Umgang mit mehrdeutigen Triggerwörtern und Argumenten bei der Ereignisextraktion: Strategie des adaptiven semantischen Lernens auf der Grundlage eines Belohnungs-Bestrafungsmechanismus
Die Ereignisextraktion ist eine komplexe Aufgabe der natürlichen Sprachverarbeitung, die darauf abzielt, Triggerwörter und Argumente zu identifizieren und aus unstrukturierten Texten zu klassifizieren. Die Polysemie von Triggerwörtern und Argumenten ist eine der wichtigsten Herausforderungen, die die Genauigkeit der Ereignisextraktion beeinflussen. Die bestehenden Methoden gehen in der Regel davon aus, dass die Polysemie bei Triggerwörtern und Argumenten gleichmäßig verteilt ist. In realen Anwendungsszenarien variiert jedoch die Anzahl von Proben mit unterschiedlichen Bedeutungen in einem Triggerwort oder Argument, was zu einer Verzerrung der Bedeutungsverteilung führt. Diese Verzerrung führt zu zwei Herausforderungen für eine präzise Ereignisextraktion: das Versäumen von seltenen Bedeutungen und die falsche Erkennung von häufigen Bedeutungen. Zur Bewältigung dieser Herausforderungen wird eine Methode des adaptiven semantischen Lernens vorgeschlagen, die einen Belohnungs-Bestrafungsmechanismus verwendet, um Unterschiede in der Verteilung von häufigen und seltenen Bedeutungen zu verringern und gleichzeitig Unterschiede zwischen Ziel- und Nicht-Ziel-Bedeutungen zu erweitern, um die semantische Verteilung auszugleichen. Darüber hinaus wird ein Mechanismus des kontextuellen Ereignisbewusstseins auf Satzebene vorgeschlagen, der das genaue Lernen des Encoders zur Verstärkung der semantischen Vorhersage von Ereignissen für mehrdeutige Triggerwörter und Argumente, die im Satz erwähnt werden, lenkt. Schließlich wird für verschiedene Aufgabensinne ein spezifischer semantischer Decoder vorgeschlagen, der die Grenzen der vorhergesagten Triggerwörter und Argumente für diesen Sinn präzise identifiziert. Die Ergebnisse von Experimenten auf ACE2005 und seinen Varianten sowie beim Benchmark ERE zeigen, dass die in diesem Artikel vorgeschlagene Methode allen Einzel- und Mehrfachaufgaben-Ereignisextraktions-Benchmarks überlegen ist.