بهینه سازی خطوط لوله بازیابی متن با مدل های LLaMA

نویسندگان:

(1) Xueguang Ma، دانشکده علوم کامپیوتر دیوید R. Cheriton، دانشگاه واترلو.

(2) لیانگ وانگ، تحقیقات مایکروسافت.

(3) نان یانگ، تحقیقات مایکروسافت.

(4) فورو وی، تحقیقات مایکروسافت.

(5) جیمی لین، دانشکده علوم کامپیوتر دیوید آر. چریتون، دانشگاه واترلو.

چکیده و مقدمه

روش

آزمایش

مطالعه و تجزیه و تحلیل فرسایش

کار مرتبط

نتیجه گیری، قدردانی و مراجع

2 روش

2.1 مقدماتی

تعریف وظیفه با توجه به یک پرسش Q و یک پیکره C = {D1, D2, …, Dn} متشکل از n سند، هدف بازیابی متن یافتن k اسنادی است که بیشترین ارتباط را با پرس و جوی Q دارند، با k ≪ n. در یک خط لوله بازیابی چند مرحله‌ای که توسط یک بازیابی و یک رتبه‌بندی مجدد تشکیل شده است، وظیفه بازیابی تولید مؤثر کاندیدهای k بالا است که بر اساس متریک شباهت Sim(Q, D) ∈ R. وظیفه رتبه‌بندی مجدد است. این است که این k اسناد کاندید را مجدداً مرتب کنیم تا ترتیب ارتباط را با استفاده از یک مدل رتبه‌بندی مجدد مؤثرتر، اما معمولاً گران‌تر از نظر محاسباتی بهبود ببخشیم. توجه داشته باشید که «سند» در این زمینه می‌تواند به یک قطعه اطلاعات دلخواه، شامل جملات، قسمت‌ها یا اسناد کامل اشاره کند. در حالی که یک خط لوله چند مرحله ای می تواند چندین رتبه بندی مجدد داشته باشد، در این مقاله ما تمرکز …

Source link