Die Binäranalyse ist eine wichtige Basistechnologie, die zahlreiche Anwendungen im Bereich Softwaretechnik und Sicherheitsforschung unterstützt. Mit der ständigen Vergrößerung des Softwareumfangs und der komplexen Entwicklung von Softwarearchitekturen steht die Binäranalysetechnologie vor neuen Herausforderungen. Um bestehende Engpässe zu überwinden, wenden Forscher Künstliche Intelligenz zur Verständnis- und Analyse von Binärcode an. Dabei steht die Frage im Mittelpunkt, wie Binärcode dargestellt werden kann, also wie intelligente Methoden verwendet werden können, um Darstellungsvektoren mit semantischen Informationen für Binärcode zu erzeugen, die dann in verschiedenen nachgelagerten Aufgaben der Binäranalyse eingesetzt werden können. Dieser Artikel untersucht und analysiert die neuesten Fortschritte in der aktuellen Binärcode-Darstellungstechnologie und unterteilt die bestehenden Forschungsarbeiten in zwei Teile: Binärcode-Merkmalextraktionsmethoden und Binärcode-Merkmalseinbettungsmethoden. Der Merkmalextraktionsteil umfasst hauptsächlich die Merkmalsdefinition und -klassifikation sowie die Merkmalserstellung. Zunächst wird die abstrakte Definition und Klassifikation der Merkmale systematisch erläutert, anschließend der Prozess zur Erstellung konkreter Merkmalsdarstellungen detailliert vorgestellt. Im Einbettungsteil werden die Einbettungsmethoden basierend auf den verwendeten verschiedenen intelligenten semantischen Verständnismodellen nach der Nutzung von Texteimbettungsmodellen und Graphimbettungsmodellen in vier Kategorien eingeteilt und vorgestellt. Abschließend wird die Gesamtentwicklung der aktuellen Forschung zusammengefasst und potenzielle zukünftige Forschungsrichtungen der Binärcode-Darstellungstechnologie diskutiert.
Keywords
Binäranalyse;Binärcode-Darstellung;Merkmalextraktion von Binärcode;Merkmalseinbettung von Binärcode