Attaque adverse en boîte noire du contrôleur proportionnel–intégral–dérivé basé sur l'apprentissage profond par renforcement dans le scénario de contrôle de la fréquence de charge

Wei WANG ,  

Zhenyong ZHANG ,  

Xin WANG ,  

Xuguo JIAO ,  

Abstract

Le contrôle de la fréquence de charge est généralement géré par un contrôleur proportionnel–intégral–dérivé (PID) traditionnel. Ces dernières années, les contrôleurs adaptatifs basés sur l'apprentissage profond par renforcement ont suscité un grand intérêt grâce à leurs performances remarquables. Cependant, ces contrôleurs adaptatifs basés sur l'apprentissage profond par renforcement présentent une vulnérabilité intrinsèque, les rendant sensibles aux attaques adverses. Afin de développer des systèmes de contrôle plus robustes, cet article analyse en profondeur la vulnérabilité des contrôleurs adaptatifs basés sur l'apprentissage profond par renforcement face aux attaques adverses. Dans un premier temps, un contrôleur adaptatif a été développé en se basant sur un algorithme d'apprentissage profond par renforcement. Ensuite, compte tenu des capacités limitées de l'attaquant, les performances du contrôle de la fréquence de charge basé sur l'apprentissage profond par renforcement sous attaque adverse ont été évaluées à l'aide d'une méthode d'optimisation d'ordre zéro. Enfin, la robustesse du contrôleur adaptatif basé sur l'apprentissage profond par renforcement a été renforcée grâce à un entraînement adversarial. De nombreuses simulations ont été effectuées pour évaluer les performances du contrôleur PID basé sur l'apprentissage profond par renforcement en présence et absence d'attaques adverses.

Keywords

contrôleur adaptatif;apprentissage profond par renforcement;contrôle de la fréquence de charge;attaque adverse

READ MORE