Поэтический парадокс в обратном переводе: оценка качества китайского перевода больших языковых моделей

Li WEIGANG; Pedro Carvalho BROM

doi:10.1631/FITEE.2500298

Поэтический парадокс в обратном переводе: оценка качества китайского перевода больших языковых моделей

DOI：10.1631/FITEE.2500298

Abstract

Большие языковые модели (LLMs) демонстрируют впечатляющие результаты в задачах многоязычного перевода, но сталкиваются с трудностями при обработке глубоких и семантически сложных китайских текстов. В данной статье предлагается рамочная структура обратного перевода на основе больших языковых моделей (LLM-BT), основанная на процессе "китайский → промежуточный язык → китайский" для оценки качества перевода. Исследование охватывает 5 популярных LLM и 3 традиционных инструмента перевода, созданы разнообразные корпуса, включающие научные аннотации, исторические парадоксы и литературные метафоры, отражающие сложность китайского языка на лексическом и семантическом уровне. Разработана система оценки NLPMetrics, включающая билингвальные оценки (BLEU), символо-базированную F1 (CHRF), показатель редактирования перевода (TER) и метрику семантического сходства (SS). Экспериментальные результаты показывают, что LLM в литературных задачах обычно превосходят традиционные инструменты. Также выявлено явление высокой размерности — поэтический парадокс, когда модели сохраняют поверхностную плавность перевода, но ослабляют метафоры и эмоциональную глубину. Кроме того, некоторые модели демонстрируют склонность к дословному обратному переводу, проявляющуюся в повторных или межмодельных тестах как «квазисамосознание», стимулированное данными. Для улучшения ограничений BLEU в оценке китайского языка предложена улучшенная версия BLEU, сочетающая сегментацию Jieba и взвешивание частоты терминов, что эффективно повышает чувствительность к разбиению слов и согласованности терминологии. Дополнительные эксперименты демонстрируют, что по некоторым семантическим измерениям выходные данные LLM приближаются к точности человеческого перевода поэзии, но по-прежнему не хватает глубокой метафорической выразительности. В статье традиционная оценка "точность — плавность" расширена до многомерного анализа поведения LLM, предоставляя прозрачную основу для продвижения объяснимого искусственного интеллекта и обозначая новые направления исследований в области культурной обработки естественного языка и согласования многоязычных LLM.

Keywords

обратный перевод; обработка китайского естественного языка; обратный перевод на основе больших языковых моделей (LLM-BT); поэтический парадокс; квазисамосознание; дословный обратный перевод

Поэтический парадокс в обратном переводе: оценка качества китайского перевода больших языковых моделей

Li WEIGANG ,

Pedro Carvalho BROM ,

DOI：10.1631/FITEE.2500298

Abstract

Keywords