نویسندگان:
(1) Avrim Blum، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.
(2) ملیسا دوتز، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.
جدول پیوندها
چکیده و 1 مقدمه
2 تنظیم و 2.1 مدل های مخالفان مغرضانه رفتاری
3 مقدمات و شهود
4.1 Myopic Best Responder و 4.2 Gambler’s Fallacy Opponent
4.3 برنده ماندن، باخت و شیفت مخالف
4.4 حریف پیرو رهبر و 4.5 بالاترین میانگین بازده حریف
5 تعمیم دادن
5.1 سایر راهبردهای مبتنی بر رفتار
5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی های شناخته شده
6 کار آینده و مراجع
یک ضمیمه
الف.1 نوع برد-بمان باخت-شیفت: کراوات-بمان
الف.2 نوع پیروی از رهبر: تاریخچه محدود
الف.3 مرزهای اشتباه بیضی
A.4 بالاترین میانگین بازده حریف
4.3 برنده ماندن، باخت و شیفت مخالف
به یاد بیاورید که حریف Win-Stay Lose-Shift بلافاصله پس از برد همان اکشن را انجام می دهد و بلافاصله پس از باخت به اکشن بعدی تغییر می کند. نوع Tie-Shift این حریف با تساوی مانند باخت و شیفت رفتار می کند و نوع Tie-Stay با تساوی مانند برد رفتار می کند و می ماند.
4.3.1 نوع: Tie-Shift
اثبات. در مرحله اول ترتیب عمل صحیح را ثبت می کنیم: حریف با انجام اولین اقدام در دستور عمل خود شروع می کند و همیشه جابجا می شود…