بهبود جاسازی متن با مدل های زبان بزرگ: دستورالعمل هایی برای آموزش و ارزیابی

نویسندگان:

(1) لیانگ وانگ، شرکت مایکروسافت، و مکاتبه به ([email protected])

(2) نان یانگ، شرکت مایکروسافت، و مکاتبات به ([email protected])

(3) Xiaolong Huang، Microsoft Corporation.

(4) لینجون یانگ، شرکت مایکروسافت؛

(5) Rangan Majumder، Microsoft Corporation;

(6) فورو وی، شرکت مایکروسافت و مکاتبات به ([email protected]).

چکیده و 1 مقدمه

2 کارهای مرتبط

3 روش

3.1 تولید داده مصنوعی

3.2 آموزش

4 آزمایش

4.1 آمار داده های مصنوعی

4.2 تنظیم دقیق و ارزیابی مدل

4.3 نتایج اصلی

4.4 بازیابی چند زبانه

5 تجزیه و تحلیل

5.1 آیا پیش‌آموزش ضدعفونی ضروری است؟

5.2 گسترش به جاسازی متن طولانی و 5.3 تجزیه و تحلیل فراپارامترهای آموزشی

6 نتیجه گیری و مراجع

A جزئیات پیاده سازی

B تجزیه و تحلیل آلودگی مجموعه تست

C درخواست برای تولید داده مصنوعی

د دستورالعمل برای آموزش و ارزشیابی

د دستورالعمل برای آموزش و ارزشیابی

ما به صورت دستی دستورالعمل هایی را برای مجموعه داده های آموزشی می نویسیم، همانطور که در جدول 13 فهرست شده است. برای مجموعه داده های ارزیابی، دستورالعمل ها در جدول 14 فهرست شده اند.

جدول 8: الگوی درخواست برای زیرگروه تطبیق طولانی-کوتاه. برای متغیرها، جدول 8: الگوی درخواست برای زیرگروه تطبیق طولانی-کوتاه. برای متغیرها،

جدول 9: الگوی درخواست برای زیرگروه تطبیق کوتاه کوتاه. ما اسناد منفی تولید نمی کنیم زیرا کار تطبیق در حال حاضر به طور منطقی دشوار است.جدول 9: الگوی درخواست برای زیرگروه تطبیق کوتاه کوتاه. ما اسناد منفی تولید نمی کنیم زیرا کار تطبیق در حال حاضر به طور منطقی دشوار است.

جدول 10: الگوی درخواست برای زیرگروه تطبیق طولانی. ما اسناد منفی را به دلایل تاخیر ایجاد نمی کنیم.جدول 10: الگوی درخواست برای زیرگروه تطبیق طولانی. ما اسناد منفی را به دلایل تاخیر ایجاد نمی کنیم.

جدول 11: الگوی اعلان STS تک زبانه. برای متغیرهای، جدول 11: الگوی اعلان STS تک زبانه. برای متغیرهای،

جدول 12: الگوی درخواست برای بازیابی بیت متن. برای متغیرهای، جدول 12: الگوی درخواست برای بازیابی بیت متن. برای متغیرهای،

جدول 13: دستورالعمل برای هر مجموعه داده آموزشی.جدول 13: دستورالعمل برای هر مجموعه داده آموزشی.

جدول 14: دستورالعمل های مورد استفاده برای ارزیابی در معیار MTEB. جدول 14: دستورالعمل های مورد استفاده برای ارزیابی در معیار MTEB.

جدول 15: نتایج برای هر مجموعه داده در معیار MTEB. معیارهای ارزیابی و نتایج دقیق پایه در مقاله اصلی موجود است [28].جدول 15: نتایج برای هر مجموعه داده در معیار MTEB. معیارهای ارزیابی و نتایج دقیق پایه در مقاله اصلی موجود است [28].

Source link