La découverte d'alpha désigne la détection systématique de signaux basés sur les données capables de prédire les rendements futurs des découpes, constituant une tâche centrale en recherche quantitative. Ces dernières années, les avancées des grands modèles de langage (LLM) ont engendré des cadres de découverte d'alpha basés sur les LLM, offrant une voie intermédiaire idéale entre l'orientation humaine et les méthodes automatisées, combinant efficacité et profondeur sémantique. Cet article adopte une perspective d'agent pour réaliser une revue structurée des systèmes émergents de découverte d'alpha basés sur les LLM et analyse le rôle fonctionnel des LLM en tant que mineur, évaluateur et assistant interactif. Malgré les progrès initiaux, des défis clés persistent, notamment une évaluation simplifiée des performances, des capacités numériques limitées, un manque de diversité et d'originalité, une dynamique d'exploration faible, des fuites de données temporelles ainsi que des risques liés à la boîte noire et à la conformité. Sur cette base, nous esquissons les directions futures, comprenant l'amélioration de la cohérence du raisonnement, l'extension à de nouveaux types de données, la révision des schémas d'évaluation et l'intégration des LLM dans des systèmes quantitatifs plus généraux. Notre analyse montre que les LLM, en tant qu'interfaces évolutives, peuvent à la fois amplifier l'expertise du domaine et renforcer la rigueur algorithmique, en transformant des hypothèses qualitatives en facteurs vérifiables pour renforcer l'expertise et en soutenant le backtesting rapide et le raisonnement sémantique pour améliorer la rigueur algorithmique. Dans ce paradigme complémentaire, l'intuition, l'automatisation et le raisonnement basé sur le langage s'entrelacent pour remodeler ensemble l'avenir de la recherche quantitative.
Keywords
découverte d'alpha; investissement quantitatif; grands modèles de langage (LLM); agents LLM; fintech