L'extraction d'alpha fait référence à la découverte systématique de signaux pilotés par les données capables de prédire les rendements futurs à l'horizon, constituant la tâche centrale de la recherche quantitative. Ces dernières années, les progrès des grands modèles de langage (LLM) ont donné naissance à des cadres d'extraction d'alpha basés sur les LLM, offrant une voie intermédiaire idéale entre l'orientation humaine et les méthodes de fouille automatiques, combinant efficacité et profondeur sémantique. Cet article adopte une perspective agentielle pour fournir une revue structurée des systèmes émergents d'extraction d'alpha basés sur les LLM, tout en analysant les rôles fonctionnels des LLM en tant que mineur, évaluateur et assistant interactif. Bien que des progrès initiaux aient été réalisés, des défis clés subsistent, notamment une évaluation des performances simplifiée, une capacité limitée de compréhension numérique, un manque de diversité et d'originalité, une dynamique d'exploration faible, des fuites de données temporelles ainsi que des risques de boîte noire et des défis de conformité. Sur cette base, nous esquissons les futures directions de développement, incluant l'amélioration de la cohérence du raisonnement, l'expansion à de nouvelles modalités de données, la révision des schémas d'évaluation et l'intégration des LLM dans des systèmes quantitatifs plus généraux. Notre analyse montre que les LLM, en tant qu'interfaces évolutives, peuvent à la fois amplifier l'expertise sectorielle et renforcer la rigueur algorithmique, en convertissant des hypothèses qualitatives en facteurs vérifiables, tout en soutenant les backtests rapides et le raisonnement sémantique. Dans ce paradigme complémentaire, intuition, automatisation et raisonnement basé sur le langage s'entrelacent pour redéfinir ensemble l'avenir de la recherche quantitative.
Keywords
extraction d'alpha;investissement quantitatif;grands modèles de langage (LLM);agents LLM;technologie financière