جدول پیوندها
چکیده و 1 مقدمه
2 آثار مرتبط و 2.1 الگوریتم های یادگیری تقویتی عمیق
2.2 کتابخانه های یادگیری تقویتی عمیق و 2.3 یادگیری تقویتی عمیق در امور مالی
3 چارچوب پیشنهادی FinRL و 3.1 مروری بر چارچوب FinRL
3.2 لایه کاربردی
3.3 لایه عامل
3.4 لایه محیطی
3.5 خط لوله آموزش – آزمایش – تجارت
4 آموزش عملی و عملکرد معیار و 4.1 ماژول بک تست
4.2 استراتژی های پایه و معیارهای معاملاتی
4.3 آموزش عملی
4.4 استفاده از مورد اول: معاملات سهام
4.5 استفاده از مورد دوم: تخصیص پورتفولیو و 4.6 مورد استفاده III: تجارت ارزهای دیجیتال
5 اکوسیستم FinRL و نتیجه گیری و مراجع
4.5 استفاده از مورد دوم: تخصیص پورتفولیو
ما یک استراتژی تخصیص پورتفولیو را بازتولید می کنیم [21] که از یک عامل DRL برای تخصیص سرمایه به مجموعه ای از سهام و تخصیص مجدد دوره ای استفاده می کند.
FinRL تکرارپذیری را با اجازه دادن به کاربران برای مقایسه آسان نتایج تنظیمات مختلف، مانند مجموعه سهام برای معامله، سرمایه اولیه و فراپارامترهای مدل، بهبود میبخشد. از لایه عامل برای تعیین کتابخانه های پیشرفته DRL استفاده می کند. کاربران نیازی به توسعه مجدد شبکههای عصبی ندارند و در عوض میتوانند با هر الگوریتم DRL، آنها را متصل و بازی کنند.
شکل 6 و جدول 3 عملکرد بک تست را در Dow 30 نشان می دهد…