راه هایی برای مقابله با مخالفان تاریخ محدود با ابزارهای الگوریتمی

نویسندگان:

(1) Avrim Blum ، موسسه فناوری تویوتا در شیکاگو ، IL ، ایالات متحده ؛

(2) ملیسا دوتز ، مؤسسه فناوری تویوتا در شیکاگو ، IL ، ایالات متحده.

چکیده و 1 مقدمه

2 تنظیم و 2.1 مدل از مخالفان مغرضانه رفتاری

3 مقدمات و شهود

4.1 بهترین پاسخ دهنده و حریف مغزی 4.2 قمارباز

4.3 برنده ، حریف از دست دادن

4.4 حریف پیروی از رهبر و 4.5 بالاترین حریف بازپرداخت

5 تعمیم

5.1 سایر استراتژی های مغرضانه از نظر رفتاری

5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی ها

6 کار و منابع آینده

یک ضمیمه

A.1 نوع Win-Stay-Lose-Shift: Tie-Stay

A.2 نوع پیروی از رهبر: تاریخ محدود

A.3 مرزهای اشتباه بیضوی

A.4 بالاترین حریف بازپرداخت

A.2 نوع پیروی از رهبر: تاریخ محدود

به یاد بیاورید که یک نوع تاریخ محدود از حریف پیروی از رهبر ، عملی را انجام می دهد که می توانست به بالاترین بازپرداخت خالص در برابر آخرین دور بازی های ما دست یابد. توجه داشته باشید که ما R 0 را فرض می کنیم. اگر r = 0 باشد ، حریف به سادگی هر دور (اولین اقدام در سفارش عمل خود) را بدون در نظر گرفتن بازی ما انجام می دهد. در این حالت ، بازی آنها هیچ اطلاعاتی در مورد بهترین پاسخ ها نشان نمی دهد ، بنابراین بهترین کاری که می توانیم انجام دهیم این است که در اکثر دور با بازی همان بازی کراوات کنید …

Source link