Dynamic prompting class distribution optimization for semi-supervised sound event detection

Lijian GAO ,  

Qing ZHU ,  

Yaxin SHEN ,  

Qirong MAO ,  

Yongzhao ZHAN ,  

Abstract

La tarea de detección de eventos de sonido semisupervisados generalmente utiliza datos sin etiquetar a gran escala y datos sintéticos para mejorar la capacidad de generalización del modelo, reduciendo efectivamente el sobreajuste del modelo en una pequeña cantidad de datos etiquetados. Sin embargo, el proceso de entrenamiento de generalización generalmente se acompaña de ruido de etiquetas falsas e interferencia de conocimientos del dominio, lo que resulta en un problema de aprendizaje de la distribución de clase semi-ruido. Para mitigar este problema de aprendizaje de la distribución de clase semi-ruido, se propone un método de optimización del aprendizaje de la distribución de clase semi-supervisado basado en sugerencias dinámicas (PADO). En particular, cuando se proporcionan datos de etiquetas reales, PADO incorpora dinámicamente un conjunto de parámetros independientes aprendibles (tokens de clase) para explorar el conocimiento a priori de la distribución real como información adicional, interactuar dinámicamente con el conocimiento de la distribución a posteriori posterior al ruido, lo que permite optimizar el conocimiento de la distribución de clase y preservar el rendimiento de generalización del modelo. Sobre esta base, PADO puede mejorar significativamente la eficiencia del aprendizaje de la distribución de clase. Los resultados de los experimentos en los conjuntos de datos DCASE 2019, 2020 y 2021 muestran que PADO es notablemente superior a los métodos avanzados actuales y fácilmente transferible a otros modelos principales.

Keywords

Prompt tuning;Class distribution learning;Semi-supervised learning;Sound event detection

READ MORE