نویسندگان:
(1) لیمنگ ژانگ، مرکز تحقیقات در زمینه فناوریهای نرمافزار مهندسی (CREST)، دانشگاه آدلاید، استرالیا.
(2) M. Ali Babar، مرکز تحقیقات در زمینه فناوری های نرم افزار مهندسی (CREST)، دانشگاه آدلاید، استرالیا.
جدول پیوندها
چکیده و 1 مقدمه
1.1 چالش های تنظیم پارامتر پیکربندی و 1.2 مشارکت
2 اهداف تنظیم
3 مروری بر چارچوب تنظیم
4 مشخصه سازی حجم کاری و 4.1 مشخصه سازی در سطح پرس و جو
4.2 شخصیت پردازی مبتنی بر زمان اجرا
5 هرس ویژگی و 5.1 هرس در سطح بار کاری
5.2 هرس در سطح پیکربندی
5.3 خلاصه
6 دانش از تجربه
7 توصیه پیکربندی و 7.1 بهینه سازی بیزی
7.2 شبکه عصبی
7.3 یادگیری تقویتی
7.4 راه حل های مبتنی بر جستجو
8 تنظیم آزمایشی
9 کارهای مرتبط
10 بحث و نتیجه گیری و مراجع
7.3 یادگیری تقویتی
یادگیری تقویتی (RL) زیر شاخه ای از یادگیری ماشین است که در آن یک عامل یاد می گیرد که با تعامل با یک محیط، تصمیمات متوالی بگیرد. در RL، عامل، که اغلب به عنوان یک الگوریتم یا برنامه نمایش داده می شود، به دنبال توسعه یک استراتژی یا سیاست است که آن را قادر می سازد تا یک پاداش تجمعی را در طول زمان به حداکثر برساند. فرآیند یادگیری شامل پیمایش عامل در حالات مختلف، انجام اقدامات بر اساس…