Revisión de la investigación sobre minería de alfa basada en grandes modelos de lenguaje

Junjie ZHANG ,  

Shuoling LIU ,  

Tongzhe ZHANG ,  

Yuchen SHI ,  

Abstract

La minería de alfa se refiere al descubrimiento sistemático de señales impulsadas por datos capaces de predecir los rendimientos futuros de cortes transversales, siendo una tarea central en la investigación cuantitativa. En los últimos años, los avances en los grandes modelos de lenguaje (LLM) han dado lugar a marcos de minería de alfa basados en LLM, que ofrecen una vía intermedia ideal entre la orientación humana y los métodos automáticos de minería, combinando eficiencia y profundidad semántica. Este artículo adopta una perspectiva de agente para realizar una revisión estructurada de los sistemas emergentes de minería de alfa basados en LLM y analiza el papel funcional de LLM como minero, evaluador y asistente interactivo. A pesar de los avances iniciales, persisten desafíos clave que incluyen evaluaciones de desempeño simplificadas, capacidades numéricas limitadas, falta de diversidad y originalidad, dinámica de exploración débil, filtración de datos temporales, así como riesgos de caja negra y desafíos de cumplimiento. En base a esto, delineamos direcciones futuras de desarrollo que incluyen mejorar la coherencia del razonamiento, ampliar a nuevos tipos de datos, reconsiderar los esquemas de evaluación e integrar LLM en sistemas cuantitativos más generales. Nuestro análisis muestra que LLM, como interfaz escalable, puede tanto amplificar el conocimiento experto del dominio como aumentar la rigurosidad algorítmica, es decir, al transformar hipótesis cualitativas en factores verificables para fortalecer el conocimiento del dominio, y al apoyar el backtesting rápido y el razonamiento semántico para mejorar la rigurosidad algorítmica. En este paradigma complementario, la intuición, la automatización y el razonamiento basado en el lenguaje se fusionan para remodelar conjuntamente el futuro de la investigación cuantitativa.

Keywords

minería de alfa; inversión cuantitativa; grandes modelos de lenguaje (LLM); agentes LLM; tecnología financiera

READ MORE