Control del seguimiento de la privacidad y la coherencia en un sistema de agentes múltiples de tiempo discreto poco estricto basado en el aprendizaje por refuerzo
En este artículo se estudia el problema del seguimiento de la privacidad y la coherencia en un sistema de agentes múltiples de tiempo discreto poco estricto. Para reducir el impacto de los errores entre el texto en claro y su descifrado, se ha desarrollado un sistema de cifrado Liu mejorado para garantizar una buena recuperación de la información en claro. Se utiliza la tecnología de aprendizaje por refuerzo para compensar las dinámicas desconocidas y los errores entre la señal real y la señal descifrada. Se diseña una estrategia de control del seguimiento de la privacidad y la coherencia basada en el método de retroceso y el conocimiento de la teoría de grafos. Con la ayuda de la teoría de estabilidad de Lyapunov, se demuestra que los errores de seguimiento de la coherencia del sistema de agentes múltiples y todas las señales están finalmente acotados. Por último, se verifica la eficacia de la estrategia de control diseñada utilizando un ejemplo de simulación.
Keywords
sistema de agentes múltiples; seguimiento coherente; protección de la privacidad; aprendizaje por refuerzo