Анализ двоичных данных, как важная базовая технология, обеспечивает поддержку многим приложениям в области программной инженерии и исследований безопасности. С увеличением масштабов программ и сложным развитием архитектуры программ, технология анализа двоичных данных сталкивается с новыми вызовами. Чтобы преодолеть существующие препятствия, исследователи применяют технологии искусственного интеллекта к пониманию и анализу двоичного кода, суть которых заключается в том, как представлять двоичный код, то есть как использовать интеллектуальные методы для генерации векторов представления двоичного кода, содержащих семантическую информацию, и применять их к различным задачам анализа двоичных данных. В данной работе проводится обзор последних достижений в технологии представления двоичного кода и анализируется рабочий процесс существующих исследований, который делится на две части: методы извлечения особенностей двоичного кода и методы встраивания особенностей двоичного кода. Часть извлечения фичей включает определение и классификацию фичей, а также процесс создания фичей. В части встраивания фичей, в зависимости от использованной модели интеллектуального понимания семантики, методы встраивания делятся на 4 категории и они подробно описываются. Наконец, делается общий вывод о текущем развитии исследований и рассматриваются некоторые потенциальные направления исследований в области технологии представления двоичного кода.
Keywords
Анализ двоичных данных, Представление двоичного кода, Выбор особенностей двоичного кода, Встраивание особенностей двоичного кода