نویسندگان:
(1) Avrim Blum، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.
(2) ملیسا دوتز، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.
جدول پیوندها
چکیده و 1 مقدمه
2 تنظیم و 2.1 مدل های مخالفان مغرضانه رفتاری
3 مقدمات و شهود
4.1 Myopic Best Responder و 4.2 Gambler’s Fallacy Opponent
4.3 برنده ماندن، باخت و شیفت مخالف
4.4 حریف پیرو رهبر و 4.5 بالاترین میانگین بازده حریف
5 تعمیم دادن
5.1 سایر راهبردهای مبتنی بر رفتار
5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی های شناخته شده
6 کار آینده و مراجع
یک ضمیمه
الف.1 نوع برد-بمان باخت-شیفت: کراوات-بمان
الف.2 نوع پیروی از رهبر: تاریخچه محدود
الف.3 مرزهای اشتباه بیضی
A.4 بالاترین میانگین بازده حریف
2. تنظیم
ما بازی های دو نفره و تکراری را با ویژگی های زیر در نظر می گیریم:
-
متقارن
-
حاصل جمع صفر
-
پرداختها به {1، 0، −1} محدود میشوند (به ترتیب نشان دهنده برد، تساوی و باخت)
-
هر عمل حداقل یک عمل دیگر را شکست می دهد
-
هر عمل حداقل به یک عمل دیگر بازنده است
▶ تعریف 1 (بازی مجاز). ما برای سهولت به بازی با خواص فوق به عنوان یک بازی مجاز اشاره می کنیم.
ما در نظر میگیریم که چقدر میتوانیم بدون دانستن ماتریس بازده M یا حتی مشاهده بازده در هنگام بازی در برابر یک …