В сфере финансовых услуг потенциальная ценность выводных крупных языковых моделей, особенно новой открытой модели DeepSeek-R1, находится на начальной стадии изучения. Несмотря на то, что универсальные крупные языковые модели уже широко применяются в анализе финансовых новостей и взаимодействии с клиентами, DeepSeek-R1 благодаря интегрированному многоэтапному обучению с усиленным обучением прорывным образом раскрывает продвинутые способности к рассуждению, не только точно справляясь со сложными финансовыми вопросами, но и предоставляя легковесную дистиллированную модель для ограниченных ресурсов, значительно повышая гибкость развертывания. В данной статье с междисциплинарной точки зрения рассматривается область финансового искусственного интеллекта: сначала систематически анализируется техническая архитектура и основные принципы DeepSeek-R1, затем на основе двух открытых наборов данных вопросов и ответов по финансам проводится предварительное, но всестороннее тестирование производительности DeepSeek-R1 и его дистиллированной модели. На этом основании подробно обсуждаются инновационные возможности, которые модель приносит в финансовые услуги, объективно анализируются существующие ограничения и предлагаются три направления будущих исследований. Цель статьи — предоставить теоретическую основу и практическое руководство для разумного применения и глубокого развития выводных крупных языковых моделей в области финансового искусственного интеллекта, продвигая финтех к более высокому уровню.
Keywords
крупные языковые модели; вывод моделей; искусственный интеллект; финтех