En el ámbito de los servicios financieros, el valor potencial de los grandes modelos de lenguaje de razonamiento —especialmente el modelo emergente de código abierto DeepSeek-R1— todavía se encuentra en una fase preliminar de exploración. Aunque los modelos de lenguaje general han sido ampliamente aplicados en el análisis de noticias financieras y la interacción con clientes, DeepSeek-R1, gracias a su mecanismo de entrenamiento en varias etapas integrado con aprendizaje por refuerzo, desbloquea de manera innovadora capacidades avanzadas de razonamiento. No solo puede manejar con precisión tareas complejas de preguntas y respuestas financieras, sino que también presenta un modelo ligero destilado para entornos con recursos limitados, mejorando significativamente la flexibilidad de despliegue. Este artículo aborda el campo de la inteligencia artificial financiera desde una perspectiva interdisciplinaria, analizando primero sistemáticamente la arquitectura técnica y los principios centrales de DeepSeek-R1, y luego realizando pruebas preliminares pero completas de rendimiento en DeepSeek-R1 y su modelo destilado basadas en dos conjuntos de datos públicos de preguntas financieras. Sobre esta base, explora en profundidad las oportunidades innovadoras que este modelo aporta a los servicios financieros, analiza objetivamente sus limitaciones actuales y propone tres direcciones de investigación futura. El objetivo de este artículo es proporcionar una base teórica y una guía práctica para la aplicación razonable y el desarrollo profundo de los grandes modelos de lenguaje de razonamiento en el campo de la inteligencia artificial financiera, impulsando la tecnología financiera hacia un nivel superior.
Keywords
grandes modelos de lenguaje; inferencia del modelo; inteligencia artificial; tecnología financiera