Fondements initiaux de l'interprétation des réseaux neuronaux profonds : analyse de la dynamique d'apprentissage basée sur la théorie des interactions équivalentes
La plupart des recherches actuelles sur l'interprétabilité de l'apprentissage en profondeur sont empiriques, et la question de savoir s'il existe des principes premiers, expliquant les mécanismes internes des réseaux neuronaux profonds sous différents angles, est devenue l'un des problèmes scientifiques fondamentaux nécessitant une solution dans le domaine de l'intelligence artificielle interprétable. Cet article examine si la théorie des interactions équivalentes peut être utilisée pour analyser l'interprétation première des réseaux neuronaux profonds. Nous estimons que la force d'interprétation de cette théorie se manifeste dans quatre aspects : (1) création d'un nouveau système axiomatique, transformant la logique de prise de décision du réseau neuronal profond en une série d'interactions symboliques ; (2) capacité à interpréter simultanément plusieurs caractéristiques typiques de l'apprentissage profond, y compris la capacité de généralisation du réseau, la résistance à l'excitation sensible, l'étranglement de la représentation et la dynamique d'apprentissage ; (3) fourniture d'outils mathématiques universels pour interpréter les algorithmes d'apprentissage profond, permettant ainsi d'expliquer systématiquement diverses méthodes d'attribution d'expérience et les mécanismes de lutte contre la migration ; (4) analyse de la double variabilité dynamique de la complexité des interactions dans le processus de modélisation du réseau neuronal profond, explication de la complexité de la modélisation des réseaux neuronaux profonds pendant l'apprentissage et de la relation entre la capacité de généralisation et la résistance à l'excitation sensible, ce qui révèle en profondeur les mécanismes internes de la capacité de généralisation et de la résistance à l'excitation sensible des réseaux neuronaux profonds lors de la phase de formation.
Keywords
Interprétation initiale; théorie des interactions équivalentes; interaction dynamique à deux étages; dynamique d'apprentissage