DeepSeek-R1 встречается с финансовыми приложениями: стандарты, возможности и ограничения

Shuoling LIU; Liyuan CHEN; Jiangpeng YAN; Yuhang JIANG; Xiaoyu WANG; Xiu LI; Qiang YANG

doi:10.1631/FITEE.2500227

DeepSeek-R1 встречается с финансовыми приложениями: стандарты, возможности и ограничения

DOI：10.1631/FITEE.2500227

Abstract

В сфере финансовых услуг потенциальная ценность выводных крупных языковых моделей, особенно новой открытой модели DeepSeek-R1, находится на начальной стадии изучения. Несмотря на то, что универсальные крупные языковые модели уже широко применяются в анализе финансовых новостей и взаимодействии с клиентами, DeepSeek-R1 благодаря интегрированному многоэтапному обучению с усиленным обучением прорывным образом раскрывает продвинутые способности к рассуждению, не только точно справляясь со сложными финансовыми вопросами, но и предоставляя легковесную дистиллированную модель для ограниченных ресурсов, значительно повышая гибкость развертывания. В данной статье с междисциплинарной точки зрения рассматривается область финансового искусственного интеллекта: сначала систематически анализируется техническая архитектура и основные принципы DeepSeek-R1, затем на основе двух открытых наборов данных вопросов и ответов по финансам проводится предварительное, но всестороннее тестирование производительности DeepSeek-R1 и его дистиллированной модели. На этом основании подробно обсуждаются инновационные возможности, которые модель приносит в финансовые услуги, объективно анализируются существующие ограничения и предлагаются три направления будущих исследований. Цель статьи — предоставить теоретическую основу и практическое руководство для разумного применения и глубокого развития выводных крупных языковых моделей в области финансового искусственного интеллекта, продвигая финтех к более высокому уровню.

Keywords

крупные языковые модели; вывод моделей; искусственный интеллект; финтех

DeepSeek-R1 встречается с финансовыми приложениями: стандарты, возможности и ограничения

Shuoling LIU ,

Liyuan CHEN ,

Jiangpeng YAN ,

Yuhang JIANG ,

Xiaoyu WANG ,

Xiu LI ,

Qiang YANG ,

DOI：10.1631/FITEE.2500227

Abstract

Keywords