نویسندگان:
(1) Jianhui Pang، از دانشگاه ماکائو، و زمانی که Jianhui Pang و Fanghua Ye در آزمایشگاه هوش مصنوعی Tencent کارآموزی می کردند، کار انجام شد.[email protected])
(2) Fanghua Ye، دانشگاه کالج لندن، و زمانی که Jianhui Pang و Fanghua Ye در آزمایشگاه Tencent AI کارآموزی می کردند، کار انجام شد.[email protected])
(3) درک اف وانگ، دانشگاه ماکائو.
(4) Longyue Wang، Tencent AI Lab، و نویسنده مربوطه.
جدول پیوندها
چکیده و 1 مقدمه
2 کارهای مرتبط
3 مدل زبان بزرگ مبتنی بر لنگر
3.1 پس زمینه
3.2 شبکه های خودتوجهی مبتنی بر لنگر
3.3 استنتاج مبتنی بر لنگر
4 آزمایش و 4.1 اجرای ما
4.2 داده ها و روش های آموزشی
4.3 ارزیابی
5 نتیجه
6 تجزیه و تحلیل
7 نتیجه گیری، محدودیت ها، بیانیه اخلاقی، و مراجع
نتایج تجربی بیشتر
B تنظیمات داده
B تنظیمات داده
برای ارائه بینشی کامل در مورد اینکه چگونه مدل را به طور مستمر در AnLLM از قبل آموزش میدهیم و ارزیابیها را انجام میدهیم، چند نمونه داده را در این بخش برای دادههای آموزشی و آزمایشی به نمایش میگذاریم.
B.1 نمونه های داده های آموزشی
در این بخش، مثالهایی برای نشان دادن فرمت دادههای خاص مورد استفاده در آموزش مدلهای AnLLM ارائه میکنیم. برای مدل AnLLM-EP، نقاط پایانی بهعنوان نشانههای لنگر عمل میکنند و به ما امکان میدهند مستقیماً از متون زبان طبیعی استفاده کنیم. برای مدل AnLLM-AC، ما…