عوامل RL واقع گرایی و سازگاری برتر را نسبت به عوامل هوش صفر نشان می دهند

بخش اول: چکیده و مقدمه

بخش دوم: مفاهیم مهم

قسمت 3: توضیحات سیستم

قسمت 4: عوامل و جزئیات شبیه سازی

بخش 5: طراحی آزمایش

بخش 6: یادگیری مستمر

بخش 7: نتایج آزمایش

بخش 8: پاسخگویی بازار و عامل به رویدادهای خارجی

بخش 9: نتیجه گیری و مراجع

قسمت 10: نتایج شبیه سازی اضافی

قسمت 11: پیکربندی شبیه سازی

5 نتایج آزمایش

5.1 ویژگی های آماری قیمت دارایی های مشاهده شده

ما از داده‌های کتاب سفارش محدود سطح تیک گوگل، اپل و آمازون در 21/06/2012 از LOBSTER استفاده می‌کنیم. [28]. ما فقط به دلیل محدودیت های صفحه، نمودارهایی را برای گروه A ارائه می کنیم. یادگیری مستمر گروه A جالب ترین گروه برای تجزیه و تحلیل است.

دم های سنگین و پوسیدگی کشیدگی. ما رفتار لپتوکورتیک را با استفاده از کشیدگی اضافی اندازه گیری می کنیم که باید به طور قابل توجهی بزرگتر از 0 باشد. پوسیدگی به این معنی است که با کاهش فرکانس نمونه برداری (ثانیه، دقیقه، ساعت و غیره) کشیدگی کاهش می یابد. شکل 3 نمودارهای Quantile-Quantile شبیه سازی ها را به ترتیب برای عوامل آموزش مداوم RL (گروه A) و عوامل ZI در مقایسه با داده های واقعی نشان می دهد. داده‌های واقعی، و همچنین داده‌های به‌دست‌آمده با استفاده از عوامل RL و ZI، همگی بازده دم چربی و توزیع قیمت قوی را نشان می‌دهند. نتایج شبیه‌سازی عوامل ZI دم خفیف‌تری را نشان می‌دهد.

Source link