اعمال نظارت طبیعی: بهبود یادگیری درون متنی از طریق آموزش خود نظارتی

3.2 بهبود یادگیری درون متنی از طریق آموزش خود نظارتی

3.2.1 مقدمه

یادگیری چند شات درون متنی به دنبال حل وظایف نادیده در زمان استنتاج با شرطی کردن چند مثال آموزشی است. به طور خاص، در این مورد ما به روش هایی علاقه مند هستیم که از هرگونه به روز رسانی وزن چشم پوشی می کنند (براون و همکاران، 2020). کار قبلی بر روی بهبود الگوریتم‌های زمان استنتاج (مثلاً امتیازدهی مجدد خروجی‌های تولید شده (ژائو و همکاران، 2021)، انتخاب (لیو و همکاران، 2021) و سفارش (Lu et al., 2021) چند نمونه ارائه شده متمرکز شده است. ) و ترکیب منابع اضافی (به عنوان مثال، مدل‌های تنظیم دقیق در مجموعه داده‌های مشروح شده توسط انسان (میشرا و همکاران، 2021؛ یه و همکاران، 2021؛ وی و همکاران، 2022)).

ما فرض می‌کنیم که راه متفاوتی برای بهبود یادگیری درون زمینه‌ای چند شات از طریق طراحی اهداف تحت نظارت شخصی است که بیشتر شبیه قالب وظایفی است که از مدل خواسته می‌شود انجام دهد. برای انجام این کار، آموزش خود نظارتی را به عنوان یک مرحله آموزشی میانی بین پیش‌آموزش مدل زبان و ارزیابی چند شات پایین‌دستی انتخاب کردیم. به طور خاص، ما مجموعه داده‌های آموزشی را بر اساس اهداف خود نظارت شده و به دنبال قالب‌های مشابه مورد استفاده در وظایف پایین‌دستی می‌سازیم، نقاط بازرسی مدل زبان از پیش آموزش‌دیده را بر روی مجموعه داده‌های آموزشی دقیق می‌کنیم، و سپس مدل‌ها را در …

Source link