Método automatizado de extremo a extremo para la evaluación rápida de la precisión de las redes neuronales profundas en presencia de fallas transitorias de hardware

Jiajia JIAO ,  

Ran WEN ,  

Hong YANG ,  

Abstract

Se ha demostrado que las fallas transitorias de hardware afectan significativamente las redes neuronales profundas, especialmente en aplicaciones como la conducción autónoma, la atención médica y la navegación espacial, donde la probabilidad de clasificación errónea crítica para la seguridad aumenta hasta 4 veces. Sin embargo, la evaluación de la inexactitud utilizando métodos precisos de inyección de fallas lleva mucho tiempo, en una plataforma de simulación completa puede tomar varias horas e incluso varios días. Para acelerar la evaluación de las fallas transitorias del hardware en las redes neuronales profundas, se ha diseñado un método automatizado unificado - A-Mean, que utiliza tasas de pérdida de datos silenciosos de operaciones básicas (como convolución, suma, multiplicación, función de activación, agrupación máxima, etc.) y un mecanismo de cálculo de promedio estático de dos niveles para calcular rápidamente las pérdidas de datos silenciosos totales para estimar los indicadores de clasificación generales precisión y los indicadores de aplicación específicos críticos de seguridad. Lo más importante, se ha utilizado una estrategia para determinar el límite de pérdida de datos silenciosos en la estructura no secuencial de las redes neuronales profundas. Luego, los resultados de la clasificación crítica estática se fusionan con los datos originales ejecutados sin fallas una sola vez y se considera un escenario de peor caso para un cálculo adicional de la pérdida amplificada de clasificación crítica en caso de falla transitoria y reducción de la precisión. Además, todos los procesos anteriores se han automatizado, de modo que esta herramienta de evaluación automatizada fácil de usar se puede utilizar para una evaluación rápida de las fallas transitorias del hardware en una variedad de redes neuronales profundas. Al mismo tiempo, se ha definido una nueva medida sensibilidad a fallas para caracterizar los cambios causados por las fallas temporales al aumentar la clasificación errónea crítica para la seguridad y reducir la precisión. La comparación de los resultados del método de evaluación A-Mean propuesto con los métodos líderes de inyección de fallasTensor 982.80% y T en cuatro conjuntos de datos muestra que el método de evaluación A-Mean logra una aceleración de hasta 922.80 veces, y las pérdidas medias de clasificación crítica y precisión son solo de 4.20% y 0.77%. Los resultados de A-Mean pueden obtenerse en https://github.com/breatrice321/A-Mean.

Keywords

Análisis de modelo; Redes neuronales profundas; Fallas transitorias de hardware; Evaluación rápida; Herramienta de evaluación automatizada

READ MORE