DDiNER: Domänenspezifische Wörterbuch-geführte Methode zur chinesischen Erkennung benannter Entitäten für komplexe Industrieszenarien

Ronghui LIU ,  

Wei CUI ,  

Xiaojun LIANG ,  

Weihua GUI ,  

Abstract

In industriellen Prozessen ist die präzise chinesische Erkennung benannter Entitäten (NER) von großer Bedeutung für Anwendungen wie Informationsgewinnung, Wissensgraph-Erstellung und intelligente Entscheidungsfindung. Grenzunsicherheiten von Entitäten, semantische Überlappungen und Mangel an annotierten Daten schränken jedoch die Leistung erheblich ein. Zur Bewältigung dieser Herausforderungen schlägt dieser Artikel einen domänenspezifischen Wörterbuch-geführten chinesischen NER-Rahmen namens DDiNER vor. Dieser Rahmen integriert ein hierarchisches industrielles Domänenwörterbuch mit einem bidirektionalen Codierungsmodell über einen hierarchischen Wörterbuch-Adapter und kombiniert bidirektionale Lang-Kurzzeitgedächtnis-Netzwerke mit bedingten Zufallsfeldern zur mehrstufigen Merkmalsfusion. Die experimentellen Ergebnisse zeigen, dass DDiNER herausragende Leistungen erzielt, mit mittlerer Präzision, Recall und F1-Wert von 95,75 %, 95,73 % bzw. 95,74 %, und deutlich besser als bestehende Methoden abschneidet. Validierungen auf unabhängigen Datensätzen bestätigen die gute Robustheit und Generalisierungsfähigkeit des Modells bei der Erkennung nicht registrierter und seltener Entitäten. Diese Studie bietet eine effiziente und skalierbare Lösung für chinesisches NER im industriellen Bereich mit signifikantem Potenzial für intelligente nachgelagerte Anwendungen.

Keywords

Erkennung benannter Entitäten; Prozessindustrie; Domänenspezifisches Wörterbuch; hierarchischer Wörterbuch-Adapter

READ MORE