درک مدل های رقیب تعصب محور در گیم پلی رقابتی

نویسندگان:

(1) Avrim Blum، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.

(2) ملیسا دوتز، موسسه فناوری تویوتا در شیکاگو، IL، ایالات متحده آمریکا.

چکیده و 1 مقدمه

2 تنظیم و 2.1 مدل های مخالفان مغرضانه رفتاری

3 مقدمات و شهود

4.1 Myopic Best Responder و 4.2 Gambler’s Fallacy Opponent

4.3 برنده ماندن، باخت و شیفت مخالف

4.4 حریف پیرو رهبر و 4.5 بالاترین میانگین بازده حریف

5 تعمیم دادن

5.1 سایر راهبردهای مبتنی بر رفتار

5.2 بهره برداری از یک استراتژی ناشناخته از مجموعه ای از استراتژی های شناخته شده

6 کار آینده و مراجع

یک ضمیمه

الف.1 نوع برد-بمان باخت-شیفت: کراوات-بمان

الف.2 نوع پیروی از رهبر: تاریخچه محدود

الف.3 مرزهای اشتباه بیضی

A.4 بالاترین میانگین بازده حریف

2. تنظیم

ما بازی های دو نفره و تکراری را با ویژگی های زیر در نظر می گیریم:

  • متقارن

  • حاصل جمع صفر

  • پرداخت‌ها به {1، 0، −1} محدود می‌شوند (به ترتیب نشان دهنده برد، تساوی و باخت)

  • هر عمل حداقل یک عمل دیگر را شکست می دهد

  • هر عمل حداقل به یک عمل دیگر بازنده است

▶ تعریف 1 (بازی مجاز). ما برای سهولت به بازی با خواص فوق به عنوان یک بازی مجاز اشاره می کنیم.

ما در نظر می‌گیریم که چقدر می‌توانیم بدون دانستن ماتریس بازده M یا حتی مشاهده بازده در هنگام بازی در برابر یک …

Source link