هي هيكلية تحليل مشاعر النص الصيني (CTASA) مهمة وضع العلامات المتسلسلة ، وعادة ما يعتمد على الطرق العميقة للتعلم المراقبة. ومع ذلك ، قد يكون الحصول على مجموعة بيانات كبيرة مع وسم كبير الممل ويستغرق وقتًا طويلاً. من خلال اختيار العينات الأكثر قيمة ، يوفر التعلم النشط حلاً لخفض تكلفة العلامات. وفي السابق تركزت طرق التعلم النشط بشكل رئيسي على عدم اليقين أو التنوع للعينات ، ولكن في الواقع لا تزال تواجه التحديات مثل الانحياز النموذجي أو اختيار العينات غير ذات الصلة. لحل هذه المشاكل ، تقدم هذه الورقة تعلماً نشطاً متعدد المستويات (MAL) ، الذي يستفيد من تمثيلات المقروء المزدوج الاتجاهية (BERT) والتوزيع الاحتمالي على مستوى الكلمة المستمدة من نموذج الحقل الشرطي العشوائي (CRF) لنمذجة هيكلية النص الصيني المعقدة. من خلال دمج ميزات المستوى الجملة المستخرجة من المدمج المزوّد بالمحول (BERT) مع التوزيع الاحتمالي على مستوى الكلمة من نموذج الحقل الشرطي العشوائي (CRF)، يمكن ل MAL التقاط بشكل كامل هيكل المشاعر في النص الصيني (CTAS). تشير النتائج التجريبية إلى أن MAL يقلص تكلفة العلامات بشكل كبير (بنسبة ٧٠٪ تقريبًا) بالمقارنة مع الطرق الأساسية، وكان الأداء أكثر استقرارًا.
Keywords
Sentiment analysis;Sequence labeling;Active learning (AL);Bidirectional encoder representations from Transformers (BERT)