Dynamic prompting class distribution optimization for semi-supervised sound event detection

Lijian GAO ,  

Qing ZHU ,  

Yaxin SHEN ,  

Qirong MAO ,  

Yongzhao ZHAN ,  

Abstract

La tâche de détection d'événements sonores semi-supervisée utilise généralement des données non étiquetées à grande échelle et des données synthétiques pour améliorer la capacité de généralisation du modèle, réduisant ainsi efficacement le surapprentissage du modèle sur une petite quantité de données étiquetées. Cependant, le processus d'entraînement de généralisation s'accompagne généralement de bruit de fausses étiquettes et d'interférences de connaissances de domaine, ce qui entraîne un problème d'apprentissage de la distribution de classe semi-bruit. Pour atténuer ce problème d'apprentissage de la distribution de classe semi-bruit, une méthode d'optimisation de l'apprentissage de la distribution de classe semi-supervisée basée sur des astuces dynamiques (PADO) est proposée. En particulier, lorsqu'il est fourni avec des données d'étiquettes réelles, PADO intègre dynamiquement un ensemble de paramètres indépendants apprenables (jetons de classe) pour exploiter la connaissance a priori de la distribution réelle en tant qu'informations supplémentaires, interagir dynamiquement avec la connaissance de la distribution a posteriori post-bruit, ce qui permet d'optimiser la connaissance de la distribution de classe et de conserver la performance de généralisation du modèle. Sur cette base, PADO peut considérablement améliorer l'efficacité de l'apprentissage de la distribution de classe. Les résultats des expériences sur les ensembles de données DCASE 2019, 2020 et 2021 montrent que PADO est nettement supérieur aux méthodes avancées actuelles et facilement transférable à d'autres modèles principaux.

Keywords

Prompt tuning;Class distribution learning;Semi-supervised learning;Sound event detection

READ MORE