Méthode d'adaptation du fractionnement sans fil des grands modèles de langage sur le bord du calcul basée sur l'apprentissage par renforcement basé sur le modèle

Yuxuan CHEN ,  

Rongpeng LI ,  

Xiaoxue YU ,  

Zhifeng ZHAO ,  

Honggang ZHANG ,  

Abstract

L'optimisation du déploiement des grandes modèles de langage (LLM) dans un environnement de calcul multi-niveaux est essentielle pour améliorer la protection de la vie privée et l'efficacité du calcul. Pour un raisonnement LLM sans fil efficace, cette étude analyse de manière approfondie l'impact des différents points de fractionnement dans les principaux LLM open source. Ce document présente un cadre d'apprentissage par renforcement basé sur le modèle (MBRL) pour déterminer le meilleur point de fractionnement entre le bord et le périphérique utilisateur (UE). En introduisant un modèle de récompense, cette méthode réduit considérablement le coût de calcul des évaluations de performances fréquentes. Les vastes résultats de simulation montrent que cette méthode équilibre efficacement les performances de raisonnement et les charges de calcul dans différentes conditions de réseau, fournissant une solution robuste au déploiement de LLM dans un environnement décentralisé.

Keywords

grands modèles de langage; calcul de bord; apprentissage par renforcement basé sur le modèle; raisonnement fractionné; modèle Transformer

READ MORE