درک تحقیقات مرتبط در مورد یادگیری با ابزار

چکیده و مقدمه

طراحی مجموعه داده

روش ارزیابی

آزمایش ها و تجزیه و تحلیل

کار مرتبط

نتیجه گیری، تکرارپذیری و مراجع

الف. فهرست کامل ابزارها

ب. اعلان سناریو

ج. پرس و جوهای غیر واقعی

د. تفاوت های ظریف در مقایسه کار قبلی

در بخش 1، معیارهای مورد نظر خود را برای ارزیابی دستیارهای مبتنی بر LLM با استفاده از ابزار شرح دادیم: استفاده از گفتگو برای مشخص کردن اهدافی که نیازمند فراخوانی ابزار چند مرحله ای هستند، و اقدامات به جای بازیابی اطلاعات، برای یک ارزیابی کاملاً خودکار که نیازی به قضاوت انسانی در مورد آن ندارد. خروجی های سیستم تحت آزمایش جدول 5 نحوه مقایسه سایر کارها در مورد ارزیابی LLM های استفاده کننده از ابزار را در کنار این عوامل خلاصه می کند. در زیر کارهای مرتبط را با جزئیات بیشتر توضیح می دهیم.

LLM های افزوده شده با ابزار نیز به عنوان یادگیری افزوده شده با ابزار، LLM ابزار، یادگیری ابزار، مدل های زبان تقویت شده (ALM) یا دستکاری ابزار با LLM شناخته می شوند (Xu et al., 2023; Mialon et al., 2023; Qin et al. .، 2023a). توسعه در این زمینه شامل بهبود عملکرد LLM در کارهای سنتی با دسترسی آنها به ابزارهایی مانند ماشین حساب یا موتور جستجو است (Lu et al., 2023a; Yao et al., 2022b; Paranjape et al., 2023; Hao et al. .، 2023). همچنین می‌تواند شامل اعمال LLM برای کارهای اتوماسیون سنتی مانند روباتیک تجسم‌یافته یا مرور وب باشد (Liu et al., 2023b; Deng et…

Source link