Traitement des mots déclencheurs et des arguments polysémiques dans l'extraction d'événements : stratégie d'apprentissage adaptatif de la sémantique basée sur un mécanisme de récompense-punition
L'extraction d'événements est une tâche complexe de traitement du langage naturel, visant à identifier les mots déclencheurs et les arguments et à les classer à partir de textes non structurés. La polysémie des mots déclencheurs et des arguments est l'un des défis majeurs affectant la précision de l'extraction d'événements. Les méthodes existantes supposent généralement que la polysémie dans les mots déclencheurs et les arguments est uniformément répartie. Cependant, dans les scénarios d'application réels, le nombre d'échantillons de différentes significations dans un même mot déclencheur ou argument diffère, ce qui entraîne un biais dans la distribution des significations. Ce biais présente deux défis pour une extraction précise des événements : manquer des significations à faible fréquence et détecter faussement des significations à haute fréquence. Pour relever ces défis, une méthode d'apprentissage adaptatif de la sémantique est proposée, en utilisant un mécanisme de récompense-punition pour réduire les différences dans la distribution des significations à haute et basse fréquence et simultanément élargir les différences entre les significations cibles et non cibles, afin d'équilibrer la distribution sémantique. De plus, un mécanisme de conscience contextuelle des événements au niveau de la phrase est proposé, visant à guider l'apprentissage précis de l'encodeur pour renforcer la prédiction sémantique des événements pour les mots déclencheurs et les arguments polysémiques mentionnés dans la phrase. Enfin, pour différentes significations de tâches, un décodeur de sémantique spécifique est proposé, identifiant précisément les limites des mots déclencheurs et des arguments prédits pour cette signification. Les résultats des expériences sur ACE2005 et ses variantes, ainsi que sur le benchmark ERE, montrent que la méthode proposée dans cet article est supérieure à tous les benchmarks d'extraction d'événements mono et multitâches.