El análisis binario, como una tecnología fundamental importante, sostiene numerosas aplicaciones en los campos de la ingeniería de software y la investigación en seguridad. Con la expansión continua de la escala del software y la evolución compleja de las arquitecturas del sistema de software, la tecnología de análisis binario enfrenta nuevos desafíos. Para superar los cuellos de botella existentes, los investigadores aplican técnicas de inteligencia artificial para la comprensión y análisis del código binario, cuyo núcleo reside en cómo representar el código binario, es decir, cómo utilizar métodos inteligentes para generar vectores de representación que contengan información semántica del código binario, para su aplicación en múltiples tareas posteriores del análisis binario. Este artículo investiga y analiza los últimos avances en la tecnología actual de representación del código binario, dividiendo el flujo de trabajo de la investigación relacionada en dos partes: métodos de extracción de características del código binario y métodos de incrustación de características del código binario. La parte de extracción de características incluye principalmente la definición y clasificación de características, así como la construcción de características. Primero se expone sistemáticamente la definición y clasificación abstracta de las características, luego se detalla el proceso de construcción de representaciones concretas de características. En la parte de incrustación, según los diferentes modelos inteligentes de comprensión semántica utilizados, y tomando como criterio de clasificación el uso de modelos de incrustación de texto y modelos de incrustación gráfica, se dividen los métodos de incrustación en cuatro categorías y se presentan. Finalmente, se resume el pensamiento general sobre el desarrollo de las investigaciones existentes y se hacen perspectivas sobre algunas posibles direcciones de investigación relacionadas con la tecnología de representación del código binario.
Keywords
Análisis binario;representación del código binario;extracción de características del código binario;incrustación de características del código binario