نتایج عملکرد عامل یادگیری تقویتی عمیق در پوشش گزینه های فروش آمریکایی

  1. چکیده

  2. مقدمه

    پس زمینه

    یادگیری تقویتی

    کار مشابه

  3. روش شناسی

    طراحی DRLAgent

  4. رویه های آموزشی

  5. مراحل تست

  6. نتایج

  7. آزمایشات SABR

  8. نتیجه گیری

  9. ضمیمه A

  10. مراجع

نتایج

این بخش نتایج آزمایش های عددی را ارائه و مورد بحث قرار می دهد. همانطور که در روش توضیح داده شد، یک عامل DRL ابتدا با استفاده از شبیه سازی یک فرآیند GBM آموزش داده می شود و نتایج آزمایش این عامل آموزش دیده GBM ابتدا ارائه می شود. نه تنها آزمایش‌های GBM با و بدون هزینه تراکنش انجام می‌شوند، استحکام عامل DRL با انجام آزمایشی در سطح نوسان بالاتر از آنچه توسط عامل DRL در آموزش دیده می‌شود، ارزیابی می‌شود. در مرحله بعد، قابلیت کاربرد در دنیای واقعی با آزمایش عوامل DRL که با مدل‌های نوسانات تصادفی کالیبره شده در بازار آموزش دیده‌اند، ارزیابی می‌شود، و خاطرنشان می‌کند که اولین آزمون نوسانات تصادفی از پارامترهای دلخواه استفاده می‌کند.

آزمایش حرکت براونی هندسی

در آزمایش اول، یک عامل DRL با استفاده از مسیرهای دارایی GBM آموزش داده می شود. نمایش‌های 3 و 4 توزیع نهایی P&L حاصل را زمانی نشان می‌دهند که نرخ‌های هزینه تراکنش، λ، به ترتیب 0 و 3 درصد باشد. توجه داشته باشید که برای سهولت مقایسه از نمودارهای فرعی جداگانه استفاده می شود و نتایج عامل DRL در مقایسه با BS Delta و دوجمله ای یکسان است.

Source link