Bei weit verbreiteter Nutzung von intelligenten Geräten und Cloud-Diensten sowie begrenzten lokalen Berechnungs- und Speicherressourcen tendieren viele Benutzer dazu, ihre persönlichen Daten zur Verarbeitung an Cloud-Server zu übertragen. Die Übertragung sensibler Daten im Klartext ruft jedoch ernsthafte Bedenken hinsichtlich der Privatsphäre und der Sicherheit der Benutzer hervor. Um diesen Problemen zu begegnen, wird eine effiziente Lösung zum Schutz der Privatsphäre und Sicherheit von Inferenzen aus neuronalen Netzwerken vorgeschlagen, die auf homomorpher Verschlüsselung und sicheren multiplen Berechnungen basiert und schnelle und präzise Inferenzen von verschlüsseltem Text ermöglicht, während die Privatsphäre sowohl der Benutzer als auch des Cloud-Servers gewährleistet wird. Zunächst wird der Inferenzprozess in 3 Phasen unterteilt: Fusionsphase zur Modifikation der Netzwerkstruktur, Vorverarbeitungsphase für homomorphe Berechnungen und Schweboperationenphase im Rahmen der geheimen Datenverteilung. Zweitens wird eine Methode zur Fusion der Netzwerkparameter vorgeschlagen, um die Kosten der Multiplikationsebenen zu senken und die Anzahl der Multiplikations- und Additionsvorgänge zwischen dem verschlüsselten und dem Klartext zu reduzieren. Schließlich wird ein schneller Faltungs-Algorithmus vorgeschlagen, um die Effizienz der Berechnung zu verbessern. Im Vergleich zu anderen fortschrittlichen Methoden reduziert die vorgeschlagene Lösung die Zeit linearer Operationen in der Online-Phase um mindestens 11 %, was die Inferenzzeit und die Kommunikationskosten signifikant reduziert.