نویسندگان:
(1) Avrim Blum ، موسسه فناوری تویوتا در شیکاگو ، IL ، ایالات متحده ؛
(2) ملیسا دوتز ، مؤسسه فناوری تویوتا در شیکاگو ، IL ، ایالات متحده.
جدول پیوندها
چکیده و 1 مقدمه
2 تنظیم و 2.1 مدل از مخالفان مغرضانه رفتاری
3 مقدمات و شهود
4.1 بهترین پاسخ دهنده و حریف مغزی 4.2 قمارباز
4.3 برنده ، حریف از دست دادن
4.4 حریف پیروی از رهبر و 4.5 بالاترین حریف بازپرداخت
5 تعمیم
5.1 سایر استراتژی های مغرضانه از نظر رفتاری
5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی ها
6 کار و منابع آینده
یک ضمیمه
A.1 نوع Win-Stay-Lose-Shift: Tie-Stay
A.2 نوع پیروی از رهبر: تاریخ محدود
A.3 مرزهای اشتباه بیضوی
A.4 بالاترین حریف بازپرداخت
A. ضمیمه
A.1 نوع Win-Stay-Lose-Shift: Tie-Stay
اثباتبشر به یاد بیاورید که نوع تساوی-ماندگار از حریف تغییر Win-Shift-Shift همان عمل را بلافاصله پس از پیروزی یا کراوات انجام می دهد و در دستور عمل خود بلافاصله پس از باخت ، به عمل بعدی تغییر می کند. از آنجا که هر عمل حداقل با یک عمل دیگر مورد ضرب و شتم قرار می گیرد ، حریف باید پس از یکی از اقداماتی که ما در پاسخ به عمل فعلی آن در فاز 1 انجام می دهیم تغییر یابد (از آنجا که ما هر عمل را به صورت پشت سر هم انجام می دهیم). اگر حریف تغییر کند تا یک عمل جدید در …