Ataque adversario de caja negra al controlador proporcional-integral-derivativo basado en aprendizaje profundo por refuerzo en escenarios de control de frecuencia de carga

Wei WANG ,  

Zhenyong ZHANG ,  

Xin WANG ,  

Xuguo JIAO ,  

Abstract

El control de la frecuencia de carga generalmente es gestionado por un controlador tradicional proporcional-integral-derivativo (PID). En los últimos años, los controladores adaptativos basados en aprendizaje profundo por refuerzo han recibido gran atención debido a su excelente desempeño. Sin embargo, estos controladores adaptativos basados en aprendizaje profundo por refuerzo tienen vulnerabilidades inherentes y son fácilmente afectados por ataques adversarios. Para desarrollar sistemas de control más robustos, este artículo realiza un análisis profundo de la vulnerabilidad de los controladores adaptativos basados en aprendizaje profundo por refuerzo bajo ataques adversarios. Primero, se desarrolló un controlador adaptativo basado en un algoritmo de aprendizaje profundo por refuerzo. Segundo, considerando las capacidades limitadas del atacante, se evaluó el desempeño del control de frecuencia de carga basado en aprendizaje profundo por refuerzo bajo ataques adversarios utilizando un método de optimización de orden cero. Finalmente, la robustez del controlador adaptativo basado en aprendizaje profundo por refuerzo se mejoró mediante entrenamiento adversario. Mediante simulaciones extensas, se evaluó el desempeño del controlador PID basado en aprendizaje profundo por refuerzo en presencia y ausencia de ataques adversarios.

Keywords

controlador adaptativo;aprendizaje profundo por refuerzo;control de frecuencia de carga;ataques adversarios

READ MORE