La tâche de correction de l'orthographe chinoise vise à détecter et corriger les erreurs d'orthographe potentielles dans le texte chinois. Cependant, la langue chinoise présente une complexité élevée, car elle comporte plusieurs variantes de changements tonals qui peuvent correspondre à différents caractères. Compte tenu de cette complexité de la langue chinoise, la tâche de correction de l'orthographe chinoise est essentielle pour garantir l'exactitude et la clarté de la communication écrite, et des recherches récentes ont déjà intégré des connaissances externes à travers les modalités vocales et visuelles dans le modèle. Cependant, ces méthodes n'ont pas réussi à utiliser efficacement les informations modales de manière ciblée pour résoudre différents types d'erreurs d'orthographe. Dans cet article, nous proposons un modèle linguistique pré-entraîné multi-modal appelé DRMSpell pour la correction de l'orthographe chinoise, qui tient compte de l'interaction entre les modalités. Nous introduisons un module de réaffectation dynamique multi-modal pour réaffecter différentes modalités et obtenir des informations multi-modales plus utiles. Pour tirer pleinement parti des informations multi-modales obtenues et renforcer davantage le modèle, nous proposons une stratégie de masquage modal indépendante, qui masque trois types de modalités pour un élément de mot individuel à l'étape de pré-entraînement. Notre méthode montre des performances de pointe sur la plupart des métriques de test de référence largement utilisées, et les résultats expérimentaux montrent que notre méthode est capable de modéliser les informations d'interaction entre les modalités, même pour des informations modales erronées.
Keywords
Correction de l'orthographe chinoise ; multi-modalité ; stratégie de masquage