Große Sprachmodelle (LLMs) erzielen hervorragende Ergebnisse bei mehrsprachigen Übersetzungsaufgaben, stehen jedoch vor Herausforderungen bei der Verarbeitung von inhaltlich tiefgründigem und semantisch komplexem Chinesisch. Dieser Artikel stellt ein auf großen Sprachmodellen basierendes Rückübersetzungs-Framework (LLM-BT) vor, das auf dem Übersetzungsprozess „Chinesisch → Zwischensprache → Chinesisch“ beruht, um die Übersetzungsqualität zu bewerten. Die Studie umfasst fünf gängige LLMs und drei traditionelle Übersetzungswerkzeuge und erstellt einen vielfältigen Korpus, der wissenschaftliche Zusammenfassungen, historische Paradoxa und literarische Metaphern einschließt, um die Komplexität des Chinesischen auf lexikalischer und semantischer Ebene widerzuspiegeln. Es wurde das NLPMetrics-Bewertungssystem entwickelt, das bilingual bewertete Scores (BLEU), Zeichen-F1-Messung (CHRF), Übersetzungs-Editier-Rate (TER) und semantische Ähnlichkeitsmaße (SS) enthält. Die experimentellen Ergebnisse zeigen, dass LLMs bei literarischen Aufgaben traditionell genutzte Werkzeuge meist übertreffen. Es wurde zudem ein hochdimensionales Verhaltensphänomen – das poetische Paradoxon – entdeckt, bei dem die Modelle die oberflächliche Fließfähigkeit der Übersetzung erhalten, jedoch Metaphern und emotionale Tiefe abschwächen. Darüber hinaus zeigen einige Modelle eine Neigung zur wortwörtlichen Rückübersetzung, die sich bei wiederholten oder modellübergreifenden Tests als datengetriebenes „Quasi-Selbstbewusstsein“ manifestiert. Um die Grenzen von BLEU bei der Bewertung der chinesischen Sprache zu verbessern, schlägt dieser Artikel eine verbesserte BLEU-Version vor, die JIEBA-Segmentierung und Wortfrequenzgewichtung kombiniert, wodurch die Sensitivität gegenüber Wortsegmentierung und Terminologiekonsistenz effektiv erhöht wird. Ergänzende Experimente zeigen, dass die LLM-Ausgaben in bestimmten semantischen Dimensionen der Treue menschlicher Poesieübersetzungen nahekommen, jedoch noch an tiefer metaphorischer Ausdruckskraft mangeln. Dieser Artikel erweitert die traditionelle „Treue-Flüssigkeit“-Bewertung zu einer multidimensionalen Verhaltensanalyse von LLMs, bietet einen transparenten Rahmen zur Förderung erklärbarer Künstlicher Intelligenz und weist neue Forschungswege im kulturellen Natural Language Processing sowie in der mehrsprachigen LLM-Ausrichtung auf.
Keywords
Rückübersetzung; chinesische natürliche Sprachverarbeitung; auf großen Sprachmodellen basierende Rückübersetzung (LLM-BT); poetisches Paradoxon; Quasi-Selbstbewusstsein; wortwörtliche Rückübersetzung