يستخدم مهمة الكشف عن أحداث الصوت شبه المراقبة عادة البيانات غير الموسومة على نطاق واسع والبيانات التركيبية لتحسين قدرة النموذج العامة ، وبالتالي خفض الانحراف الزائد للنموذج على كمية قليلة من البيانات المحددة. ومع ذلك ، يرافق عادة عملية التدريب العام مشوش الأصوات الزائفة والتداخل الديني المعرفي ، مما يؤدي إلى مشكلة تعلم توزيع فئة نصف الضوضاء. بهدف تخفيف هذه المشكلة ، يتم تقديم طريقة جديدة لتعلم توزيع فئة نصف الإشارة (PADO) استنادًا إلى تحسين توزيع صندوق الفئة الديناميكي. على وجه الخصوص ، عند توفير بيانات العلامات الحقيقية ، يضم PADO مسهلًا مستقلًا قابلا للتعلم (رمز الفئة) لاستكشاف المعرفة الأولية للتوزيع الحقيقي كمعلومات تلميح إضافية ، وتفاعل ديناميكي مع معرفة التوزيع بعد الضوضاء ، لتحقيق تحسين معرفة توزيع الفئة والاحتفاظ بأداء التعميم للنموذج. بناءً على هذا ، يتمكن PADO من تحسين كفاءة تعلم توزيع الفئة بشكل ملحوظ. نتائج التجارب على مجموعات بيانات DCASE 2019 و 2020 و 2021 تشير إلى أن PADO يفوق بشكل كبير الطرق المتقدمة الحالية ، وسهل الانتقال إلى نماذج أخرى.
Keywords
Prompt tuning;Class distribution learning;Semi-supervised learning;Sound event detection