Полу-надзорный метод обнаружения звуковых событий с оптимизацией классового распределения на основе динамических подсказок

Lijian GAO ,  

Qing ZHU ,  

Yaxin SHEN ,  

Qirong MAO ,  

Yongzhao ZHAN ,  

Abstract

Задача полу-надзорного обнаружения звуковых событий обычно использует большие неразмеченные данные и синтетические данные для повышения обобщающей способности модели, что эффективно снижает переобучение модели на небольшом количестве размеченных данных. Однако, обобщающий процесс обучения обычно сопровождается шумом ложных меток и помехами отличий знания области. Для смягчения проблемы обучения распределению классов, эксплуатирующей полу-надзорный метод динамической оптимизации подсказок (PADO). Конкретно, когда имеются реальные размеченные данные, PADO динамически встраивает набор обучаемых независимых параметров (классовые токены) для изучения первичного знания реального распределения в качестве дополнительной подсказки, взаимодействующей динамически с шумным знанием последующего распределения, что обеспечивает оптимизацию знания распределения наполовину, при этом сохраняя обобщающую способность модели. На основе этого PADO может значительно повысить эффективность обучения распределению классов. Экспериментальные результаты на наборах данных DCASE 2019, 2020 и 2021 показывают, что PADO значительно превосходит текущие передовые методы и легко переносится на другие основные модели.

Keywords

Настройка подсказки; Обучение распределению классов; Полу-надзорное обучение; Обнаружение звуковых событий

READ MORE