Es wurde nachgewiesen, dass Hardware-Transientenfehler tiefgreifende Auswirkungen auf tiefe neuronale Netzwerke haben, insbesondere in Anwendungen wie autonomen Fahrzeugen, Gesundheitswesen und Luft- und Raumfahrt, wo sich die sicherheitskritische Fehlklassifizierungsrate um das Vierfache erhöhen kann. Die Verwendung genauer Fehlerinjektionsmethoden zur Bewertung von Ungenauigkeiten ist jedoch sehr zeitaufwändig und kann in einer vollständigen Simulationsumgebung mehrere Stunden oder sogar Tage dauern. Zur Beschleunigung der Bewertung von Hardware-Transientenfehlern in tiefen neuronalen Netzwerken wurde eine einheitliche End-to-End-Automatisierungsmethode - A-Mean - entwickelt, die die stillen Datenverlustraten grundlegender Operationen wie Faltung, Addition, Multiplikation, Aktivierungsfunktion, Max-Pooling usw. sowie einen statischen zweistufigen Mittelwertberechnungsmechanismus nutzt, um schnell die Gesamtdatenverlustrate zu berechnen und eine Schätzung der allgemeinen Klassifizierungsgenauigkeit und der sicherheitskritischen Fehlklassifizierung für spezifische Anwendungsindikatoren zu liefern. Darüber hinaus wird die Fehlerempfindlichkeit als neuer Indikator definiert, um die Änderungen in der sicherheitskritischen Fehlklassifizierung und der Genauigkeitsabnahme aufgrund von transienten Fehlern zu kennzeichnen. Der Vergleich der vorgeschlagenen Bewertungsmethode A-Mean mit der führenden Fehlerinjektionsmethode TensorFI+ auf fünf Modellen tiefgehenender neuronaler Netzwerke und vier Datensätzen zeigt eine Beschleunigung um das 922,80-fache, wobei der durchschnittliche Verlust an sicherheitskritischen Fehlklassifizierungen und Genauigkeit nur 4,20 % bzw. 0,77 % beträgt.
Keywords
Analysemodell; Deep Neural Network; Hardware-Transientenfehler; Schnelle Bewertung; Automatisierungsbewertungstool