Méthode de détection d'événements sonores semi-supervisée basée sur l'optimisation dynamique de la distribution des classes

Lijian GAO ,  

Qing ZHU ,  

Yaxin SHEN ,  

Qirong MAO ,  

Yongzhao ZHAN ,  

Abstract

La tâche de détection d'événements sonores semi-supervisée utilise généralement de grandes données non étiquetées et des données synthétiques pour améliorer la capacité de généralisation du modèle, réduisant ainsi efficacement le surajustement du modèle sur un petit nombre de données étiquetées. Cependant, le processus d'entraînement de généralisation est généralement accompagné de bruit d'étiquetage faux et d'interférences de connaissances de domaine. Pour atténuer le problème de l'apprentissage de la distribution de classe semi-bruyante, nous proposons une méthode d'apprentissage de la distribution de classe semi-supervisée basée sur l'optimisation dynamique des indices (PADO). Plus précisément, lorsque des données d'étiquetage réelles sont fournies, PADO intègre dynamiquement un ensemble de paramètres indépendants apprenables (jetons de classe) pour explorer la connaissance a priori de la distribution réelle en tant qu'informations d'indice supplémentaires, interagir dynamiquement avec la connaissance perturbée de la distribution postérieure, optimisant ainsi la connaissance de la distribution de classe tout en préservant la capacité de généralisation du modèle. Sur cette base, PADO peut grandement améliorer l'efficacité de l'apprentissage de la distribution de classe. Les résultats expérimentaux sur les ensembles de données DCASE 2019, 2020 et 2021 montrent que PADO est nettement supérieur aux méthodes avancées actuelles et facile à transférer à d'autres modèles principaux.

Keywords

Ajustement de l'indice; Apprentissage de la distribution de classe; Apprentissage semi-supervisé; Détection d'événements sonores

READ MORE