Fundamentos iniciales de la interpretación de las redes neuronales profundas: análisis de la dinámica de aprendizaje basado en la teoría de interacciones equivalentes
La mayoría de las investigaciones actuales sobre la interpretabilidad del aprendizaje profundo son empíricas, y la cuestión de si existen principios fundamentales que expliquen los mecanismos internos de las redes neuronales profundas desde diferentes ángulos, se ha convertido en uno de los problemas científicos fundamentales que requieren solución en el campo de la inteligencia artificial interpretable. Este artículo examina si la teoría de interacciones equivalentes puede utilizarse para analizar la interpretación inicial de las redes neuronales profundas. Consideramos que la fuerza interpretativa de esta teoría se manifiesta en cuatro aspectos: (1) creación de un nuevo sistema axiomático, que transforma la lógica de la toma de decisiones de la red neuronal profunda en una serie de interacciones simbólicas; (2) capacidad para interpretar simultáneamente varias características típicas del aprendizaje profundo, incluida la capacidad de generalización de la red, la resistencia a la excitación sensible, el cuello de botella de la representación y la dinámica del aprendizaje; (3) provisión de herramientas matemáticas universales para interpretar los algoritmos de aprendizaje profundo, lo que permite explicar sistemáticamente diversos métodos de atribución de experiencia y los mecanismos de lucha contra la migración; (4) análisis de la doble variabilidad dinámica de la complejidad de las interacciones en el proceso de modelado de la red neuronal profunda, explicación de la complejidad del modelado de las redes neuronales profundas durante el aprendizaje y la relación entre la capacidad de generalización y la resistencia a la excitación sensible, lo que revela en profundidad los mecanismos internos de la capacidad de generalización y la resistencia a la excitación sensible de las redes neuronales profundas en la fase de formación.
Keywords
Interpretación inicial; teoría de interacciones equivalentes; interacción dinámica de dos etapas; dinámica de aprendizaje