Distillation des connaissances pour les grands modèles de langage financiers : revue systématique des stratégies, applications et évaluations

Jiaqi SHI; Xulong ZHANG; Xiaoyang QU; Junfei XIE; Jianzong WANG

doi:10.1631/FITEE.2500282

Distillation des connaissances pour les grands modèles de langage financiers : revue systématique des stratégies, applications et évaluations

DOI：10.1631/FITEE.2500282

Abstract

Les grands modèles de langage financiers offrent un potentiel énorme pour les applications financières. Cependant, le coût élevé de déploiement et les délais importants d'inférence constituent des obstacles majeurs. En tant que méthode de compression importante, la distillation des connaissances apporte des solutions efficaces à ces défis. Cet article enquête de manière exhaustive sur l'interaction entre la distillation des connaissances et les grands modèles de langage financiers, couvrant trois aspects clés : stratégie, application et évaluation. Au niveau stratégique, une taxonomie structurée est introduite pour analyser comparativement les chemins de distillation existants. Au niveau application, un cadre logique amont-milieu-aval est proposé pour expliquer systématiquement la valeur pratique des modèles distillés dans le domaine financier. Au niveau évaluation, pour résoudre le manque de normes dans le domaine financier, un cadre d'évaluation complet est construit, évaluant plusieurs dimensions telles que la précision financière, la fidélité de l'inférence et la robustesse. En résumé, cet article vise à fournir une feuille de route claire pour ce domaine interdisciplinaire afin d'accélérer le développement des grands modèles financiers distillés.

Keywords

Grands modèles de langage financiers; distillation des connaissances; compression de modèles; trading quantitatif

Distillation des connaissances pour les grands modèles de langage financiers : revue systématique des stratégies, applications et évaluations

Jiaqi SHI ,

Xulong ZHANG ,

Xiaoyang QU ,

Junfei XIE ,

Jianzong WANG ,

DOI：10.1631/FITEE.2500282

Abstract

Keywords