Manejo de palabras desencadenantes y argumentos polisémicos en la extracción de eventos: estrategia de aprendizaje adaptativo de la semántica basada en un mecanismo de recompensa-castigo
La extracción de eventos es una tarea compleja de procesamiento del lenguaje natural, que tiene como objetivo identificar palabras desencadenantes y argumentos y clasificarlos a partir de textos no estructurados. La polisemia de las palabras desencadenantes y de los argumentos es uno de los desafíos principales que afectan la precisión en la extracción de eventos. Los métodos existentes suelen suponer que la polisemia en las palabras desencadenantes y los argumentos está distribuida uniformemente. Sin embargo, en escenarios de aplicación reales, varía el número de muestras de diferentes significados en una misma palabra desencadenante o argumento, lo que conlleva un sesgo en la distribución de significados. Este sesgo plantea dos desafíos para una extracción precisa de eventos: la omisión de significados de baja frecuencia y la detección errónea de significados de alta frecuencia. Para enfrentar estos desafíos, se propone un método de aprendizaje adaptativo de la semántica, utilizando un mecanismo de recompensa-castigo para reducir las diferencias en la distribución de significados de alta y baja frecuencia y, al mismo tiempo, ampliar las diferencias entre los significados objetivo y no objetivo, con el fin de equilibrar la distribución semántica. Además, se propone un mecanismo de conciencia del contexto de eventos a nivel de frase, con el fin de guiar el aprendizaje preciso del codificador para reforzar la predicción semántica de eventos para palabras desencadenantes y argumentos polisémicos mencionados en la frase. Finalmente, para diferentes significados de tareas, se propone un decodificador de la semántica específico, que identifica con precisión los límites de las palabras desencadenantes y argumentos predichos para ese significado. Los resultados de experimentos en ACE2005 y sus variantes, así como en el benchmark ERE, muestran que el método propuesto en este artículo es superior a todos los benchmarks de extracción de eventos individuales y multitaría.
Keywords
extracción de eventos; desencadenantes polisémicos; argumentos polisémicos; desequilibrio semántico; mecanismo de recompensa–castigo