تنظیم دقیق LLaMA برای بازیابی متن چند مرحله‌ای: آزمایش‌ها

نویسندگان:

(1) Xueguang Ma، دانشکده علوم کامپیوتر دیوید R. Cheriton، دانشگاه واترلو.

(2) لیانگ وانگ، تحقیقات مایکروسافت.

(3) نان یانگ، تحقیقات مایکروسافت.

(4) فورو وی، تحقیقات مایکروسافت.

(5) جیمی لین، دانشکده علوم کامپیوتر دیوید آر. چریتون، دانشگاه واترلو.

چکیده و مقدمه

روش

آزمایش

مطالعه و تجزیه و تحلیل فرسایش

کار مرتبط

نتیجه گیری، قدردانی و مراجع

3 آزمایش

ما آزمایش‌هایی را روی مجموعه داده‌های رتبه‌بندی پاساژ MS MARCO و رتبه‌بندی اسناد انجام می‌دهیم تا اثربخشی خط لوله بازیابی متن چند مرحله‌ای که با استفاده از RepLLaMA و RankLLaMA برای بازیابی متن و بازیابی سند ساخته شده است را بررسی کنیم.

3.1 بازیابی پاساژ

مجموعه داده ما مدل‌های رتریور و رتبه‌بندی مجدد خود را با LLaMA بر روی تقسیم آموزشی مجموعه داده رتبه‌بندی پاساژ MS MARCO (باجاج و همکاران، 2016)، که شامل تقریباً 500 هزار نمونه آموزشی است، آموزش می‌دهیم. همانطور که در بخش 2.2 بحث شد، ادغام نگاتیوهای سخت برای تمرین موثر رتریور بسیار مهم است. در مورد ما، ما از ترکیبی از نگاتیوهای سخت BM25 و CoCondenser (Gao and Callan, 2022b) استفاده می‌کنیم تا اطمینان حاصل کنیم که نگاتیوهای سخت از نتایج بازیابی پراکنده و متراکم مشتق شده‌اند و در نتیجه تنوع نمونه‌ها را افزایش می‌دهند. برای رتبه بندی مجدد، سخت را انتخاب می کنیم …

Source link