المفارقة الشعرية في الترجمة العكسية: تقييم جودة الترجمة الصينية لنماذج اللغة الكبيرة

Li WEIGANG ,  

Pedro Carvalho BROM ,  

Abstract

تحقق نماذج اللغة الكبيرة (LLMs) أداءً بارعًا في مهام الترجمة متعددة اللغات، ولكنها تواجه تحديات عند معالجة النصوص الصينية ذات المحتوى العميق والمعاني المعقدة. تقدم هذه الورقة إطار الترجمة العكسية القائم على نماذج اللغة الكبيرة (LLM-BT)، الذي يعتمد على عملية الترجمة "صيني→لغة وسيطة→صيني"، لتقييم جودة الترجمة. تغطي الدراسة خمسة نماذج LLM رائدة وثلاث أدوات ترجمة تقليدية، وتم بناء مجموعة بيانات متنوعة تشمل ملخصات علمية، مفارقات تاريخية واستعارات أدبية، لتعكس تعقيد اللغة الصينية على مستوى المفردات والدلالة. تم إنشاء نظام تقييم NLPMetrics الذي يشمل درجات التقييم الثنائية اللغة (BLEU)، مقياس F1 الحرفي (CHRF)، معدل تحرير الترجمة (TER) ومؤشر التشابه الدلالي (SS). أظهرت النتائج التجريبية أن نماذج LLM تتفوق بشكل عام على الأدوات التقليدية في مهام الأدب. كما كشفت عن ظاهرة سلوكية ذات بعد عالٍ - المفارقة الشعرية - حيث تحافظ النماذج على طلاقة الترجمة الظاهرية لكنها تُضعف التشبيهات والعمق العاطفي. بالإضافة إلى ذلك، يُظهر بعض النماذج ميلاً للترجمة الحرفية العكسية، وعند الاختبارات المتكررة أو عبر النماذج يظهر ما يمكن وصفه بـ"وعي شبه ذاتي" مدفوعًا بالبيانات. لتحسين محدودية BLEU في تقييم اللغة الصينية، تقترح هذه الورقة دمج تجزئة JIEBA مع وزن تكرار الكلمات في نسخة محسنة من BLEU، مما يعزز الحساسية تجاه تقسيم المفردات واتساق المصطلحات. تظهر التجارب التكميلية أن مخرجات LLM تقترب في بعض الأبعاد الدلالية من دقة الترجمة الشعرية البشرية، لكن لا تزال تفتقر إلى التعبير العميق عن الاستعارات. توسع هذه الدراسة التقييم التقليدي لـ"الولاء-السلاسة" إلى تحليل سلوكي متعدد الأبعاد لنماذج LLM، مما يوفر إطارًا شفافًا يعزز تطوير الذكاء الاصطناعي القابل للتفسير، ويشير إلى مسارات بحث جديدة في معالجة اللغة الطبيعية الثقافية ومحاذاة LLM متعددة اللغات.

Keywords

الترجمة العكسية; معالجة اللغة الطبيعية الصينية; الترجمة العكسية القائمة على نماذج اللغة الكبيرة (LLM-BT); المفارقة الشعرية; الوعي شبه الذاتي; الترجمة الحرفية العكسية

READ MORE