Revisión de avances en tecnología de representación del código binario

Taiyan WANG ,  

Qingsong XIE ,  

Lu YU ,  

Zulie PAN ,  

Min ZHANG ,  

Abstract

El análisis de datos binarios, como tecnología básica importante, proporciona apoyo a muchas aplicaciones en el campo de la ingeniería de software y la investigación de seguridad. Con la expansión continua del tamaño del software y la evolución compleja de la arquitectura del software, la tecnología de análisis de datos binarios se enfrenta a nuevos desafíos. Para superar las barreras actuales, los investigadores están aplicando tecnologías de inteligencia artificial a la comprensión y análisis del código binario, cuya esencia radica en cómo representar el código binario, es decir, cómo utilizar métodos inteligentes para generar vectores de representación del código binario que contengan información semántica, y luego aplicarlos a diversas tareas de análisis de datos binarios. Este artículo revisa los últimos avances en la tecnología de representación del código binario y analiza el flujo de trabajo de la investigación relacionada, dividiéndolo en dos partes: métodos de extracción de características del código binario y métodos de incrustación de características del código binario. La parte de extracción de características incluye la definición y clasificación de características, así como el proceso de construcción de características. En la parte de incrustación de características, según el modelo de inteligencia de comprensión de texto utilizado, los métodos de incrustación se clasifican en 4 categorías y se presentan en detalle. Finalmente, se realiza un resumen del desarrollo general de la investigación actual y se consideran algunas posibles direcciones de investigación en la tecnología de representación del código binario.

Keywords

Análisis binario; Representación del código binario; Selección de características del código binario; Incrustación de características del código binario

READ MORE