بازگشایی مدارک کلیدی در یادگیری تقویتی
نویسندگان: (1) جونگمین لی، گروه علوم ریاضی، دانشگاه ملی سئول. (2) ارنست کی ریو، گروه علوم ریاضی، دانشگاه ملی سئول و برنامه میان رشته ای در هوش مصنوعی، دانشگاه ملی سئول. چکیده و 1 مقدمه 1.1 نمادها و مقدمات 1.2 کارهای قبلی 2 تکرار ارزش ثابت 2.1 نرخ تسریع شده برای اپراتور سازگاری بلمن 2.2 …