بهبود تعبیه متن با مدل های بزرگ زبان: آموزش

::: اطلاعات
نویسندگان:

(1) لیانگ وانگ ، شرکت مایکروسافت و مکاتبات ([email protected]) ؛

(2) نان یانگ ، شرکت مایکروسافت و مکاتبات ([email protected]) ؛

(3) شیائولونگ هوانگ ، شرکت مایکروسافت ؛

(4) لینجون یانگ ، شرکت مایکروسافت ؛

(5) Rangan Majumder ، شرکت مایکروسافت ؛

(6) Furu Wei ، Microsoft Corporation و مکاتبات ([email protected]).

:::

چکیده و 1 مقدمه

2 کار مرتبط

3 روش

3.1 تولید داده مصنوعی

3.2 آموزش

4 آزمایش

4.1 آمار داده های مصنوعی

4.2 تنظیم خوب و ارزیابی مدل

4.3 نتایج اصلی

4.4 بازیابی چند زبانه

5 تجزیه و تحلیل

5.1 آیا قبل از آموزش متضاد ضروری است؟

5.2 گسترش به تعبیه متن طولانی و 5.3 تجزیه و تحلیل آموزش هایپرپارامترها

6 نتیجه گیری و منابع

جزئیات اجرای

B تجزیه و تحلیل آلودگی مجموعه آزمون

C برای تولید داده های مصنوعی

D دستورالعمل آموزش و ارزیابی

3.2 آموزش

بهبود تعبیه متن با مدل های بزرگ زبان: آموزش

\

::: اطلاعات این مقاله در ARXIV تحت مجوز عمل CC0 1.0 در دسترس است.

:::

\

Source link