Dans le domaine des services financiers, la valeur potentielle des grands modèles de langage inférentiels — notamment le nouveau modèle open source DeepSeek-R1 — est encore à un stade exploratoire préliminaire. Bien que les grands modèles de langage généralistes soient déjà largement utilisés dans l'analyse des actualités financières et les interactions clients, DeepSeek-R1, grâce à son mécanisme d'entraînement multi-étapes intégré avec apprentissage par renforcement, débloque de manière révolutionnaire des capacités avancées de raisonnement. Il peut non seulement gérer avec précision des tâches complexes de questions-réponses financières, mais propose également un modèle étudiant léger distillé, adapté aux environnements à ressources limitées, améliorant ainsi considérablement la flexibilité de déploiement. Cet article aborde le domaine de l'intelligence artificielle financière sous un angle interdisciplinaire, en analysant d'abord systématiquement l'architecture technique et les principes fondamentaux de DeepSeek-R1, puis en réalisant des tests de performance préliminaires mais complets sur DeepSeek-R1 et son modèle distillé, basés sur deux ensembles de données publiques de questions-réponses financières. Sur cette base, il explore en profondeur les opportunités d'innovation offertes par ce modèle dans les services financiers, analyse objectivement ses limitations actuelles, et propose trois orientations de recherche futures. Cet article vise à fournir une base théorique et des orientations pratiques pour une application raisonnable et un développement approfondi des grands modèles de langage inférentiels dans le domaine de l'intelligence artificielle financière, afin de faire progresser la fintech vers un niveau supérieur.
Keywords
grands modèles de langage; inférence de modèle; intelligence artificielle; fintech