Dans les processus industriels, la reconnaissance précise des entités nommées en chinois (NER) est essentielle pour des applications telles que l'extraction d'information, la construction de graphes de connaissances et la prise de décision intelligente. Cependant, la frontière floue des entités, le chevauchement sémantique et le manque de données annotées limitent fortement ses performances. Pour relever ces défis, cet article propose un cadre NER chinois guidé par un dictionnaire de domaine, appelé DDiNER. Ce cadre intègre un dictionnaire industriel hiérarchique avec un modèle d'encodage bidirectionnel via un adaptateur de dictionnaire hiérarchique, et combine un réseau de mémoire à long terme bidirectionnel avec un champ conditionnel aléatoire pour réaliser une fusion multi-niveaux des caractéristiques. Les résultats expérimentaux montrent que DDiNER atteint d'excellentes performances, avec une précision moyenne, un rappel et une valeur F1 respectivement de 95,75 %, 95,73 % et 95,74 %, surpassant nettement les méthodes classiques. La validation sur un jeu de données indépendant confirme que le modèle possède une bonne robustesse et capacité de généralisation dans la reconnaissance des entités non enregistrées et à longue traîne. Cette étude offre une solution efficace et évolutive pour le NER chinois dans le domaine industriel, avec un potentiel significatif pour les applications intelligentes en aval.
Keywords
reconnaissance d'entités nommées; industrie des procédés; dictionnaire de domaine; adaptateur de dictionnaire hiérarchique