MAL: multilevel active learning with BERT for Chinese textual affective structure analysis

Shufeng XIONG; Guipei ZHANG; Xiaobo FAN; Wenjie TIAN; Lei XI; Hebing LIU; Haiping SI

doi:10.1631/FITEE.2400242

MAL: multilevel active learning with BERT for Chinese textual affective structure analysis

DOI：10.1631/FITEE.2400242

Abstract

هي هيكلية تحليل مشاعر النص الصيني (CTASA) مهمة وضع العلامات المتسلسلة ، وعادة ما يعتمد على الطرق العميقة للتعلم المراقبة. ومع ذلك ، قد يكون الحصول على مجموعة بيانات كبيرة مع وسم كبير الممل ويستغرق وقتًا طويلاً. من خلال اختيار العينات الأكثر قيمة ، يوفر التعلم النشط حلاً لخفض تكلفة العلامات. وفي السابق تركزت طرق التعلم النشط بشكل رئيسي على عدم اليقين أو التنوع للعينات ، ولكن في الواقع لا تزال تواجه التحديات مثل الانحياز النموذجي أو اختيار العينات غير ذات الصلة. لحل هذه المشاكل ، تقدم هذه الورقة تعلماً نشطاً متعدد المستويات (MAL) ، الذي يستفيد من تمثيلات المقروء المزدوج الاتجاهية (BERT) والتوزيع الاحتمالي على مستوى الكلمة المستمدة من نموذج الحقل الشرطي العشوائي (CRF) لنمذجة هيكلية النص الصيني المعقدة. من خلال دمج ميزات المستوى الجملة المستخرجة من المدمج المزوّد بالمحول (BERT) مع التوزيع الاحتمالي على مستوى الكلمة من نموذج الحقل الشرطي العشوائي (CRF)، يمكن ل MAL التقاط بشكل كامل هيكل المشاعر في النص الصيني (CTAS). تشير النتائج التجريبية إلى أن MAL يقلص تكلفة العلامات بشكل كبير (بنسبة ٧٠٪ تقريبًا) بالمقارنة مع الطرق الأساسية، وكان الأداء أكثر استقرارًا.

Keywords

Sentiment analysis;Sequence labeling;Active learning (AL);Bidirectional encoder representations from Transformers (BERT)

MAL: multilevel active learning with BERT for Chinese textual affective structure analysis

Shufeng XIONG ,

Guipei ZHANG ,

Xiaobo FAN ,

Wenjie TIAN ,

Lei XI ,

Hebing LIU ,

Haiping SI ,

DOI：10.1631/FITEE.2400242

Abstract

Keywords