En los procesos industriales, el reconocimiento preciso de entidades nombradas (NER) en chino es crucial para aplicaciones como la extracción de información, la construcción de grafos de conocimiento y la toma de decisiones inteligentes. Sin embargo, problemas como los límites difusos de las entidades, la superposición semántica y la escasez de datos anotados limitan significativamente su desempeño. Para abordar estos desafíos, este artículo propone un marco de NER chino guiado por un diccionario de dominio llamado DDiNER. Este marco fusiona un diccionario industrial jerárquico con un modelo de representación codificadora bidireccional a través de un adaptador de diccionario jerárquico, y combina redes neuronales bidireccionales de memoria a corto y largo plazo con campos aleatorios condicionales para lograr la fusión de características multinivel. Los resultados experimentales muestran que DDiNER logra un rendimiento excelente, alcanzando precisiones medias, tasas de recuperación y valores F1 del 95.75%, 95.73% y 95.74%, respectivamente, superando notablemente los métodos tradicionales. La validación en un conjunto de datos independiente confirma que el modelo posee buena robustez y capacidad de generalización para reconocer entidades no registradas y de cola larga. Este estudio proporciona una solución eficiente y escalable para el NER chino en el ámbito industrial, con un notable potencial para aplicaciones inteligentes posteriores.
Keywords
reconocimiento de entidades nombradas; industria de procesos; diccionario de dominio; adaptador de diccionario jerárquico