Обзор прогресса исследований технологий представления двоичного кода

Taiyan WANG ,  

Qingsong XIE ,  

Lu YU ,  

Zulie PAN ,  

Min ZHANG ,  

Abstract

Двоичный анализ является важной базовой технологией, поддерживающей множество приложений в области программной инженерии и исследований безопасности. С ростом масштабов программного обеспечения и усложнением архитектур программных систем технологии двоичного анализа сталкиваются с новыми вызовами. Для преодоления существующих ограничений исследователи применяют методы искусственного интеллекта для понимания и анализа двоичного кода, ключевым моментом является способ представления двоичного кода, то есть как использовать интеллектуальные методы для генерации семантически насыщенных векторных представлений двоичного кода, которые могут применяться в различных задачах последующего анализа. В данной статье проведён обзор и анализ современных исследований технологий представления двоичного кода, при этом существующие работы разделены на методы извлечения признаков двоичного кода и методы внедрения признаков двоичного кода. Часть, посвящённая извлечению признаков, включает определение и классификацию признаков, а также их построение. Сначала систематически излагается абстрактное определение и классификация признаков, затем подробно описывается процесс построения конкретных представлений признаков. В части внедрения признаков, основываясь на различных моделях интеллектуального семантического понимания, методы внедрения классифицируются по использованию текстовых моделей и графовых моделей в четыре категории и рассматриваются подробно. В конце даётся общее резюме развития существующих исследований и перспективы возможных направлений исследований технологий представления двоичного кода.

Keywords

Двоичный анализ;Представление двоичного кода;Извлечение признаков двоичного кода;Внедрение признаков двоичного кода

READ MORE