جدول پیوندها
بخش اول: چکیده و مقدمه
بخش دوم: مفاهیم مهم
قسمت 3: توضیحات سیستم
قسمت 4: عوامل و جزئیات شبیه سازی
بخش 5: طراحی آزمایش
بخش 6: یادگیری مستمر
بخش 7: نتایج آزمایش
بخش 8: پاسخگویی بازار و عامل به رویدادهای خارجی
بخش 9: نتیجه گیری و مراجع
قسمت 10: نتایج شبیه سازی اضافی
قسمت 11: پیکربندی شبیه سازی
6. نتیجه گیری
در این کار، ما فرمول بندی عوامل RL را اصلاح می کنیم [6] و یک پلت فرم شبیه سازی بسیار واقعی را پیاده سازی کنید. ما نتایج شبیه سازی را با یک مجموعه داده واقعی و یک بازار شبیه سازی شده با استفاده از معامله گران هوش صفر (ZI) مقایسه می کنیم. نتایج بهدستآمده با استفاده از پلتفرم شبیهسازی، ویژگیهای واقعی بازار و پاسخگویی به عوامل خارجی را نشان میدهد. ما متوجه شدیم که عوامل یادگیری مستمر RL واقعیترین شبیهسازی بازار را تولید میکنند و قادر به تطبیق با شرایط متغیر بازار هستند.
کالیبراسیون یک سیستم مبتنی بر عامل هنوز یک مشکل چالش برانگیز است. وادوری و همکاران [29] و لوسانژ و همکاران [7] روش های دو مرحله ای را برای کالیبره کردن سیستم چند عامله مبتنی بر RL نشان می دهد. با این حال، استفاده از این الگوریتم ها در سیستم ما بسیار چالش برانگیز است زیرا سیستم ما غیر ثابت است و در زمان واقعی اجرا می شود. ما قصد داریم در کارهای آینده به این موضوع و سایر مسائل بپردازیم.
مراجع
[1] R. ادامه، …