جدول پیوندها
-
چکیده
-
مقدمه
پس زمینه
یادگیری تقویتی
کار مشابه
-
روش شناسی
طراحی DRLAgent
-
رویه های آموزشی
-
مراحل تست
-
نتایج
-
آزمایشات SABR
-
نتیجه گیری
-
ضمیمه A
-
مراجع
آزمایشات SABR
برای ارزیابی کاربرد دنیای واقعی پوششدهی DRL، عوامل با استفاده از مسیرهای مدل نوسان تصادفی کالیبرهشده بازار آموزش داده میشوند. با این حال به یاد بیاورید که برای ایجاد یک خط پایه، اولین آزمایش از ضرایب مدل دلخواه استفاده می کند. برای این آزمایش اولیه، نمایشهای 11 و 12 توزیعهای نهایی P&L استراتژیهای DRL و BS Delta را به ترتیب زیر 0% و 3% هزینه تراکنش نشان میدهند و شکل 13 آمار خلاصه هر دو مورد را نشان میدهد.
نتایج با آزمایشهای GBM مطابقت دارد و نشان میدهد که تحت هزینههای تراکنش، عامل DRL از استراتژی BS Delta بهتر عمل میکند و میانگین P&L نهایی بالاتر و انحراف استاندارد کمتری را تولید میکند. برنامه دنیای واقعی اکنون ممکن است با استفاده از عوامل DRL آموزش دیده با مدل های کالیبره شده بازار مورد بررسی قرار گیرد. برای ارائه نتایج بدون فهرست کردن همه 80 گزینه، میانگین و انحراف استاندارد میانگین نتیجه نهایی P&L در پنج ضربه برای هر نماد و تاریخ سررسید محاسبه میشود. این آمار نهایی P&L برای هر دو عامل DRL و استراتژی BS Delta در شکل 14 برای…