استخراج التعزيز المميز على أساس زيادة البيانات

Yuxi HAN ,  

Dequan LI ,  

Yang YANG ,  

Abstract

قامت أنظمة التعلم التعميقي المعزز بأداء ملحوظ في المهام البصرية، لكن قدرتها على التعميم أضعف عندما تتعرض الصورة الداخلية لإشارة تشويش، وبالتالي من الصعب تطبيق العميل الذكي المدرب في بيئة جديدة. من أجل تمكين العميل الذكي من التمييز بين إشارات الضوضاء في الصورة والبكسل الهامة، تعتبر تقنيات زيادة البيانات وإنشاء الشبكات المساعدة حلاً فعالًا. يتمثل الحل ذو أهمية بتقديم خوارزمية جديدة، وهي تحسين قيمة البيانات المميزة (SEQA)، تشجع هذه الخوارزمية العميل الذكي على استكشاف الحالة المجهولة بشكل كامل وتركز انتباهه على المعلومات الهامة. على وجه التحديد، يقوم SEQA بمنع سمات التشويش واستخراج سمات بارزة، ويستخدم خسارة المعلق لتحديث الشبكة الفك المقنن لحث العميل الذكي على التركيز على الميزات الهامة واتخاذ القرارات الصحيحة. تم تقييم هذه الخوارزمية على معيار التعميم الرئيسي للسيطرة على DeepMind، وأظهرت نتائج التجارب أن هذه الخوارزمية تعزز بشكل كبير كفاءة التدريب واستقراره. في الوقت نفسه، في معظم مهام معيار التعميم للسيطرة على DeepMind، كانت خوارزميتنا أفضل من أحدث أساليب التعلم التعميقي من حيث كفاءة العينات والقدرة على التعميم.

Keywords

تعلم تعميق عميق؛ مهام بصرية ؛ تعميم، زيادة بيانات، بروز، معيار التعميم للسيطرة على DeepMind

READ MORE