کجا ترجمه درون متنی در مدل های زبان بزرگ اتفاق می افتد: ضمیمه

نویسندگان:

(1) سوزانا سیا، دانشگاه جانز هاپکینز؛

(2) دیوید مولر؛

(3) کوین دو.

الف. ضمیمه

الف.1. نمای گرافیکی آزمایش‌های پوشش متن

الف.2. فرمت اعلان

الف.3. نتایج اضافی در انگلیسی و اسپانیایی

علاوه بر جفت‌های زبان en → fr و fr → en، آزمایش‌هایی را نیز روی جفت‌های زبان انگلیسی و اسپانیایی اجرا می‌کنیم، هر دو en → es و es → en. به دلیل محدودیت فضا، ما نتایج آن آزمایش ها را در اینجا رسم می کنیم. به طور کلی، ما روندهای تقریباً یکسانی را در هر دو جهت انگلیسی و اسپانیایی با آنچه در کارهای ترجمه انگلیسی و فرانسوی مشاهده می‌کنیم مشاهده می‌کنیم، که ما را به این نتیجه می‌رساند که نتیجه‌گیری‌های ما در کارهای مختلف ترجمه تعمیم می‌یابد.

الف.4. رسیور اتورگرسیو فقط ترانسفورماتور

ترانسفورماتور متشکل از بلوک های روی هم قرار گرفته از خود توجه است که خود شامل واحدهای کوچکتری از سرهای خود توجه است که قبل از تغذیه از طریق یک لایه کاملاً متصل به هم متصل می شوند. در ترانسفورماتورهای فقط رمزگشای اتورگرسیو، آموزش و استنتاج از یک ماسک علّی استفاده می‌کند، که در آن موقعیت‌های فعلی فقط می‌توانند به مراحل زمانی قبلی توجه کنند، به جای اینکه بتوانند به کل توالی ورودی توجه کنند. برخلاف مدل‌های NMT رمزگذار-رمزگشا که در آن جمله مبدأ و هدف دارای بلوک‌های ترانسفورماتور پردازش جداگانه هستند، رمزگشا فقط به این معنی است که …

Source link