مهمة التعرف على الأحرف الصينية المتغيرة تهدف إلى حل مشكلة اللبس والالتباس الدلالي في الأحرف الصينية، وهذه المشكلة تشكل خطرًا محتملًا على أمن محتوى صفحات الويب، وتزيد من تعقيد إدارة المصطلحات الحساسة. يركز معظم الطرق الحالية في مرحلة التدريب المُسبق على الحصول على الدلالة السياقية من مكتبة النصوص الصينية والمفردات، مغفلين غالبًا عن الخصائص الصوتية والشكلية الطبيعية للأحرف الصينية. استنادًا إلى المشكلة المذكورة أعلاه، نقترح في هذه الورقة نموذج ترجمة متعدد الأوزان متعدد الوسائط موجه نحو التعرف على الأحرف الصينية المتغيرة. يدمج هذا النموذج سمات النطق الصوتية للبينين الصيني والسمات الشكلية للخط الصيني في كل عنصر لغوي صيني، لتعلم سمات الدلالة العميقة للنص المتغير. وتقوم الطبقة العائقة بترميز سمات النطق للبينين الصيني من خلال طبقة الطبقة، وتستخدم شبكات الظواهر المكونة لتعلم سمات الشكل للحروف الصينية. باعتبار الشبه في السمات متعددة الوسائط بين الجملة المصدر والجملة الهدف في مهمة التعرف على الأحرف الصينية المتغيرة، تم تصميم آلية تضمين الأوزان المشتركة، وتستخدم المعلومات التحفيزية للجملة المصدر في عملية التدريب لتوليد الجملة الهدف. تُظهر نتائج التجارب أن النموذج المشترك متعدد الأوزان متعدد الوسائط المقترح في هذا البحث يحقق في التقييم المزدوج للغة (BLEU) وقيمة F1 على التوالي 89.550% و 79.480%، مما يؤدي إلى تحسين كبير مقارنة بالنموذج الأساسي الحالي.
Keywords
Chinese variant characters;Multimodal model;Translation model;Phonology and morphology