ارزیابی عوامل RL عمیق در پوشش ریسک با مدل های نوسان تصادفی کالیبره شده توسط بازار

  1. چکیده

  2. مقدمه

    پس زمینه

    یادگیری تقویتی

    کار مشابه

  3. روش شناسی

    طراحی DRLAgent

  4. رویه های آموزشی

  5. مراحل تست

  6. نتایج

  7. آزمایشات SABR

  8. نتیجه گیری

  9. ضمیمه A

  10. مراجع

آزمایشات SABR

برای ارزیابی کاربرد دنیای واقعی پوشش‌دهی DRL، عوامل با استفاده از مسیرهای مدل نوسان تصادفی کالیبره‌شده بازار آموزش داده می‌شوند. با این حال به یاد بیاورید که برای ایجاد یک خط پایه، اولین آزمایش از ضرایب مدل دلخواه استفاده می کند. برای این آزمایش اولیه، نمایش‌های 11 و 12 توزیع‌های نهایی P&L استراتژی‌های DRL و BS Delta را به ترتیب زیر 0% و 3% هزینه تراکنش نشان می‌دهند و شکل 13 آمار خلاصه هر دو مورد را نشان می‌دهد.

نتایج با آزمایش‌های GBM مطابقت دارد و نشان می‌دهد که تحت هزینه‌های تراکنش، عامل DRL از استراتژی BS Delta بهتر عمل می‌کند و میانگین P&L نهایی بالاتر و انحراف استاندارد کمتری را تولید می‌کند. برنامه دنیای واقعی اکنون ممکن است با استفاده از عوامل DRL آموزش دیده با مدل های کالیبره شده بازار مورد بررسی قرار گیرد. برای ارائه نتایج بدون فهرست کردن همه 80 گزینه، میانگین و انحراف استاندارد میانگین نتیجه نهایی P&L در پنج ضربه برای هر نماد و تاریخ سررسید محاسبه می‌شود. این آمار نهایی P&L برای هر دو عامل DRL و استراتژی BS Delta در شکل 14 برای…

Source link