::: اطلاعات
نویسندگان:
(1) لیانگ وانگ ، شرکت مایکروسافت و مکاتبات ([email protected]) ؛
(2) نان یانگ ، شرکت مایکروسافت و مکاتبات ([email protected]) ؛
(3) شیائولونگ هوانگ ، شرکت مایکروسافت ؛
(4) لینجون یانگ ، شرکت مایکروسافت ؛
(5) Rangan Majumder ، شرکت مایکروسافت ؛
(6) Furu Wei ، Microsoft Corporation و مکاتبات ([email protected]).
:::
جدول پیوندها
چکیده و 1 مقدمه
2 کار مرتبط
3 روش
3.1 تولید داده مصنوعی
3.2 آموزش
4 آزمایش
4.1 آمار داده های مصنوعی
4.2 تنظیم خوب و ارزیابی مدل
4.3 نتایج اصلی
4.4 بازیابی چند زبانه
5 تجزیه و تحلیل
5.1 آیا قبل از آموزش متضاد ضروری است؟
5.2 گسترش به تعبیه متن طولانی و 5.3 تجزیه و تحلیل آموزش هایپرپارامترها
6 نتیجه گیری و منابع
جزئیات اجرای
B تجزیه و تحلیل آلودگی مجموعه آزمون
C برای تولید داده های مصنوعی
D دستورالعمل آموزش و ارزیابی
3.2 آموزش
\
::: اطلاعات این مقاله در ARXIV تحت مجوز عمل CC0 1.0 در دسترس است.
:::
\