La minería de alfa se refiere al descubrimiento sistemático de señales impulsadas por datos capaces de predecir los rendimientos futuros transversales y es una tarea central en la investigación cuantitativa. En los últimos años, los avances en grandes modelos de lenguaje (LLM) han dado lugar a marcos de minería de alfa basados en LLM, que ofrecen una ruta intermedia ideal entre la guía humana y los métodos automáticos de minería, combinando eficiencia y profundidad semántica. Este artículo aborda una revisión estructurada de los sistemas emergentes de minería de alfa basados en LLM desde la perspectiva de agentes y analiza los roles funcionales de LLM como minero, evaluador y asistente interactivo. A pesar del progreso inicial, persisten desafíos clave, incluyendo evaluaciones de desempeño simplificadas, capacidad limitada de comprensión numérica, falta de diversidad y originalidad, dinámicas débiles de exploración, fugas de datos temporales y riesgos de caja negra y desafíos de conformidad. En consecuencia, delineamos direcciones futuras de desarrollo, que incluyen mejorar la coherencia del razonamiento, expandir a nuevas modalidades de datos, reconsiderar los esquemas de evaluación e integrar LLM en sistemas cuantitativos más generales. Nuestro análisis muestra que LLM, como interfaz escalable, puede amplificar tanto el conocimiento especializado del dominio como reforzar la rigurosidad algorítmica, transformando hipótesis cualitativas en factores verificables y apoyando pruebas retrospectivas rápidas y razonamiento semántico. En este paradigma complementario, la intuición, la automatización y el razonamiento basado en el lenguaje se integran para dar forma conjuntamente al futuro de la investigación cuantitativa.
Keywords
minería de alfa;inversión cuantitativa;grandes modelos de lenguaje (LLM);agentes LLM;tecnología financiera