Étude de la formation de faisceau dans un système de communication à large bande dans une zone rapprochée assisté par une super surface intelligente omnidirectionnelle basée sur l'apprentissage par renforcement profond
Cet article étudie un système de communication à large bande dans une zone rapprochée multi-utilisateur assistée par une super surface intelligente omnidirectionnelle, et propose un algorithme robuste basé sur l'apprentissage par renforcement profond. En optimisant conjointement la formation de faisceau actif de la station de base et la formation de faisceau passif de la super surface intelligente omnidirectionnelle, la vitesse d'accès des utilisateurs est améliorée. Pour atténuer le problème de la division de faisceau à large bande dans les communications à large bande, une structure de codage mixte conjoint dans le temps est introduite pour une formation efficace de faisceau à large bande. Compte tenu du modèle de déphasage couplé de la super surface omnidirectionnelle intelligente, la conception de la formation de faisceau passive est transformée en un problème de contrôle mixte de déphasage continu et discret, et le problème du contrôle des actions séquentielles de grande dimension est résolu en appliquant une cartographie d'actions mixtes. De plus, un opérateur softmax est introduit pour atténuer le biais d'estimation dans les algorithmes d'apprentissage par renforcement actuels. Les résultats de simulation montrent que l'algorithme proposé est supérieur aux algorithmes existants en surmontant les problèmes de surestimation et de sous-estimation.
Keywords
Apprentissage par renforcement profond; Formation de faisceau de zone rapprochée; Super surface intelligente omnidirectionnelle; Division de faisceau à large bande