يُعَد التحليل الثنائي تقنية أساسية هامة تدعم العديد من التطبيقات في مجالات هندسة البرمجيات وأبحاث الأمان. مع التوسع المستمر في حجم البرمجيات وتعقيد بنى النظام البرمجية، تواجه تقنيات التحليل الثنائي تحديات جديدة. لتجاوز هذه العقبات الحالية، يقوم الباحثون بتطبيق تقنيات الذكاء الاصطناعي على فهم وتحليل الكود الثنائي، حيث يكمن الجوهر في كيفية تمثيل الكود الثنائي، أي كيفية استخدام الطرق الذكية لتوليد متجهات تمثيلية تحتوي على معلومات دلالية للكود الثنائي، مما يسمح بتطبيقها في مهام التحليل الثنائي المختلفة. تستعرض هذه الورقة البحثية آخر التقدمات في تقنيات تمثيل الكود الثنائي في المرحلة الحالية، وتقسم سير العمل في البحوث ذات الصلة إلى طريقتي استخراج ميزات الكود الثنائي وتضمين ميزات الكود الثنائي. تشمل جزء استخراج الميزات تعريف وتصنيف الميزات بالإضافة إلى بناء الميزات. بدايةً يتم شرح التعريف والتصنيف التجريدي للميزات بشكل منهجي، ثم يتم تفصيل عملية بناء التمثيل المحدد للميزات. في قسم التضمين، وبناءً على نماذج الفهم الذكي الدلالي المختلفة المستخدمة، يتم تصنيف طرق التضمين إلى أربع فئات اعتماداً على استخدام نماذج تضمين النصوص ونماذج تضمين الرسوم البيانية ويتم شرحها. في النهاية، يتم تلخيص الأفكار العامة لتطور البحوث القائمة ويتم استشراف بعض الاتجاهات البحثية المحتملة المتعلقة بتقنيات تمثيل الكود الثنائي.