Задача полу-мониторинга обнаружения звуковых событий обычно использует широкомасштабные данные без меток и синтетические данные для улучшения обобщающей способности модели, что в конечном итоге уменьшает переобучение модели на небольшом количестве помеченных данных. Однако процесс обобщения обучения обычно сопровождается помехами ложных меток и динамическим взаимодействием доменных знаний, что приводит к проблеме обучения распределению классов половина шума. Чтобы смягчить это возмущение половинного шума класса, предлагается новый метод половинного обучения распределению классов оптимизации (PADO) на основе динамической настройки распределения классов. Конкретно, когда предоставляются реальные метки данных, PADO динамически встраивает набор обучаемых независимых параметров (токены класса) для изучения априорных знаний реального распределения в качестве дополнительной подсказки, взаимодействует с динамическим значением апостериорного распределения с шумом, что позволяет оптимизировать знание распределения класса и сохранять обобщающую способность модели. На основе этого PADO способен существенно улучшить эффективность изучения распределения класса. Результаты экспериментов на наборах данных DCASE 2019, 2020 и 2021 показывают, что PADO заметно превосходит текущие передовые методы и легко адаптируется к другим основным моделям.
Keywords
Prompt tuning;Class distribution learning;Semi-supervised learning;Sound event detection