La tarea de detección de eventos sonoros semi supervisado suele utilizar grandes cantidades de datos no etiquetados y datos sintéticos para mejorar la capacidad de generalización del modelo, reduciendo eficazmente el sobreajuste del modelo en un pequeño conjunto de datos etiquetados. Sin embargo, el proceso de entrenamiento de generalización suele estar acompañado de ruido de etiquetas falsas e interferencias de conocimiento de dominio. Para mitigar el problema del aprendizaje de la distribución de clase semi ruidosa, proponemos un método de aprendizaje de distribución de clase semi supervisado basado en la optimización dinámica de las señales (PADO). Específicamente, cuando se proporcionan datos de etiquetas reales, PADO incorpora dinámicamente un conjunto de parámetros independientes aprendibles (tokens de clase) para explorar el conocimiento previo de la distribución real como información de señal adicional, interactuar dinámicamente con el conocimiento perturbado de la distribución posterior, optimizando así el conocimiento de la distribución de clase mientras se conserva la capacidad de generalización del modelo. Sobre esta base, PADO puede mejorar significativamente la eficiencia del aprendizaje de la distribución de clase. Los resultados experimentales en los conjuntos de datos DCASE 2019, 2020 y 2021 muestran que PADO es sustancialmente superior a los métodos avanzados actuales y es fácil de transferir a otros modelos principales.
Keywords
Ajuste de señal; Aprendizaje de distribución de clase; Aprendizaje semi supervisado; Detección de eventos sonoros