کلید شکست دادن برنده – ماندن، باخت – شیفت انواع حریف

نویسندگان:

(1) Avrim Blum، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.

(2) ملیسا دوتز، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.

چکیده و 1 مقدمه

2 تنظیم و 2.1 مدل های مخالفان مغرضانه رفتاری

3 مقدمات و شهود

4.1 Myopic Best Responder و 4.2 Gambler’s Fallacy Opponent

4.3 برنده ماندن، باخت و شیفت مخالف

4.4 حریف پیرو رهبر و 4.5 بالاترین میانگین بازده حریف

5 تعمیم دادن

5.1 سایر راهبردهای مبتنی بر رفتار

5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی های شناخته شده

6 کار آینده و مراجع

یک ضمیمه

الف.1 نوع برد-بمان باخت-شیفت: کراوات-بمان

الف.2 نوع پیروی از رهبر: تاریخچه محدود

الف.3 مرزهای اشتباه بیضی

A.4 بالاترین میانگین بازده حریف

4.3 برنده ماندن، باخت و شیفت مخالف

به یاد بیاورید که حریف Win-Stay Lose-Shift بلافاصله پس از برد همان اکشن را انجام می دهد و بلافاصله پس از باخت به اکشن بعدی تغییر می کند. نوع Tie-Shift این حریف با تساوی مانند باخت و شیفت رفتار می کند و نوع Tie-Stay با تساوی مانند برد رفتار می کند و می ماند.

4.3.1 نوع: Tie-Shift

اثبات. در مرحله اول ترتیب عمل صحیح را ثبت می کنیم: حریف با انجام اولین اقدام در دستور عمل خود شروع می کند و همیشه جابجا می شود…

Source link