هنگامی که استدلال قیاسی با شکست مواجه می شود: ابهامات زمینه ای در مدل های هوش مصنوعی

نویسندگان:

(1) ژان لینگ، UC سن دیگو و سهم برابر.

(2) Yunhao Fang، UC San Diego و سهم برابر.

(3) Xuanlin Li، UC San Diego;

(4) Zhiao Huang، UC San Diego;

(5) Mingu Lee، Qualcomm AI Research و Qualcomm AI Research

(6) Roland Memisevic، Qualcomm AI Research.

(7) هائو سو، UC سن دیگو.

چکیده و مقدمه

کار مرتبط

انگیزه و فرمول مسئله

استدلال زنجیره‌ای فکری قابل تأیید قیاسی

آزمایش ها

محدودیت ها

نتیجه گیری، قدردانی و مراجع

یک تأیید قیاسی با مدل‌های Vicuna

B بحث بیشتر در مورد بهبود دقت تأیید قیاسی در مقابل بهبود در مورد درستی پاسخ نهایی

C جزئیات بیشتر در مورد استخراج پاسخ

D درخواست می کند

E بیشتر نمونه های تایید قیاسی

6 محدودیت ها

در حالی که ما اثربخشی تأیید استدلال قیاسی مبتنی بر برنامه طبیعی را برای افزایش قابلیت اطمینان و تفسیرپذیری مراحل استدلال و پاسخ‌های نهایی نشان داده‌ایم،

جدول 7: ابطال مقادیر مختلف k' در صحت تأیید زنجیره های استدلال با استفاده از استراتژی رأی وحدت رویه-تکثر ما. آزمایش ها بر روی AddSub با استفاده از GPT-3.5-turbo (ChatGPT) انجام می شود.جدول 7: ابطال مقادیر مختلف k' در صحت تأیید زنجیره های استدلال با استفاده از استراتژی رأی وحدت رویه-تکثر ما. آزمایش ها بر روی AddSub با استفاده از GPT-3.5-turbo (ChatGPT) انجام می شود.

جدول 8: نمونه سوال با عبارات مبهم. اصطلاح جدول 8: نمونه سوال با عبارات مبهم. اصطلاح

مهم است که بپذیریم رویکرد ما دارای محدودیت‌هایی است. در این بخش، ما یک منبع رایج از موارد شکست را تجزیه و تحلیل می‌کنیم تا بینش عمیق‌تری در مورد رفتارهای رویکرد خود به دست آوریم. مورد شکست، همانطور که در Tab نشان داده شده است. 8، شامل تفسیر مبهم از اصطلاح “پنی” است که می تواند به عنوان یک …

Source link