استخراج الأحداث هو مهمة معقدة في معالجة اللغة الطبيعية ، تهدف إلى التعرف على الكلمات المثيرة والمقاومات وتصنيفها من النصوص غير المهيكلة. إن العديد من المعاني في الكلمات المثيرة والمقاومات تعتبر تحديًا رئيسيًا يؤثر على دقة استخراج الأحداث. يعتقد الأساليب الحالية عمومًا أن العديد من المعاني في الكلمات المثيرة والمقاومات توزعت بالتساوي. ومع ذلك ، في السياقات التطبيقية الفعلية ، هناك اختلاف في عدد العينات لنفس الكلمة المثيرة أو المقاومات الذي يؤدي إلى انحياز في توزيع المعاني. هذا الانحياز يجلب تحديين للحصول على استخراج دقيق للأحداث: تفووت المعاني منخفضة التردد والتفتيش الخاطئ للمعاني عالية التردد. لحل هذه التحديات ، تقترح طريقة تعلم الدليلية الموائمة ، عن طريق استخدام توازن المكافآت والعقوبات لتقليل اختلاف المعاني العالية والمنخفضة التردد ، وفي الوقت نفسه ، توسيع الفارق بين المعاني المستهدفة وغير المستهدفة ، لتحقيق توازن في توزيع المعاني. علاوة على ذلك ، تقترح آلية إدراك السياق للجملة ، توجه الكودر المعلوماتي لتعلم دقيق لمعرفة الأحداث المشار إليها في الجملة ، لتعزيز توقعات المعاني للكلمات المثيرة والمقاومات المتعددة. وأخيرًا ، بالنسبة لمختلف المعاني في المهام المختلفة ، تقترح مفكك المعاني الخاص بالمهمة النوعية ، اعتراف دقيق بحدود الكلمات المثيرة والمقاومات المتوقعة للمعنى المقصود. تشير نتائج التجارب على ACE2005 وتجاربها ومقياس ERE إلى التحسين الذي يقدمه الأسلوب المقدم في هذه الوثيقة مقارنة بجميع القائمة الأساسية لاستخراج الأحداث الفردية ومتعددة المهام.
Keywords
استخراج الأحداث ، كلمات المثيرة الكثيرة المعاني ، مقاومات كثيرة المعاني ، عدم توازن دليلي ، آلية الجائزة والعقوبة