DRMSpell: تقنية إعادة توزيع الوسائط المتعددة الديناميكية في تصحيح الإملاء الصيني

Yinghao LI ,  

Heyan HUANG ,  

Baojun WANG ,  

Yang GAO ,  

Abstract

مهمة تصحيح الإملاء الصيني تهدف إلى اكتشاف وتصحيح الأخطاء المحتملة في النص الصيني. ومع ذلك، تظهر اللغة الصينية تعقيدًا شديدًا، حيث يوجد عدة إصدارات مختلفة للصوت، ويمكن أن تكون هذه الاختلافات مرتبطة بأحرف مختلفة. نظرًا لهذا التعقيد في اللغة الصينية، فإن مهمة تصحيح الإملاء الصينية ذات أهمية كبيرة لضمان دقة ووضوح التواصل الكتابي، وقد جرى مؤخرًا دمج المعرفة الخارجية من خلال الطرق الصوتية والبصرية في النموذج. ومع ذلك، لم تكن هذه الطرق قادرة على استخدام المعلومات النمطية بشكل فعال لحل أنواع مختلفة من أخطاء الإملاء. في هذه الورقة، نقترح نموذج لغة متعدد الوسائط مطلق السمات يسمى DRMSpell لاستخدامه في تصحيح الإملاء الصيني، حيث يأخذ هذا النموذج بعين الاعتبار تفاعل الوسائط. نقدم وحدة إعادة توزيع ديناميكية للوسائط المتعددة لإعادة توزيع مختلف الوسائط للحصول على مزيد من المعلومات متعددة الوسائط. وللاستفادة الكاملة من المعلومات متعددة الوسائط التي تم الحصول عليها وتعزيز النموذج بشكل أكبر، نقترح استراتيجية للقناع المستقل للوسائط الثلاثة لقناع عنصر واحد في مرحلة التدريب المسبق. حققت طريقتنا أداءً متفوقًا على معظم المؤشرات التي تستخدم على نطاق واسع كمعايير الاختبار الأساسية، وتشير نتائج التجارب إلى أن طريقتنا قادرة على نمذجة معلومات تفاعل الوسائط، حتى عند تواجد معلومات الوسائط الخاطئة.

Keywords

تصحيح الإملاء الصيني؛ متعدد الوسائط؛ استراتيجية القناع

READ MORE