هری پاتر کیست؟ UnLearning تقریبی در LLM: پیوست

نویسندگان:

(1) رونن الدان، تحقیقات مایکروسافت (ایمیل: [email protected])

(2) مارک روسینوویچ، مایکروسافت آژور و هر دو نویسنده به طور مساوی در این کار مشارکت داشتند، (ایمیل: [email protected]).

6 ضمیمه

6.1 مثال های بیشتر

شکل 6 مثال های بیشتری برای تکمیل سریع ارائه می دهد. شکل‌های 7-10 مثال‌های بیشتری از پویایی احتمالات نشانه بعدی در طول فرآیند تنظیم دقیق ارائه می‌دهند.

6.2 محاسبه نمرات آشنایی

6.2.1 آشنایی مبتنی بر تکمیل

برای آشنایی مبتنی بر تکمیل، ما 300 درخواست جمع آوری کردیم. هر یک بر اساس یک قطعه طولانی 300 کلمه ای است که به طور تصادفی از کتاب گرفته شده است، که به همراه دستورالعمل های شرح داده شده در شکل 11 به GPT-4 داده شده است، و پس از آن لیستی از نمونه های دستچین شده است. در فرآیند ارزیابی، تمام 300 دستور به مدل ارائه شد، و خروجی و همچنین اعلان و ابرداده‌های آن یک بار دیگر به GPT-4 ارائه شد، با دستورالعمل‌های شکل 12، که خواسته می‌شود تکمیل‌ها را به چهار دسته طبقه‌بندی کنند:

• تکمیل‌هایی که نام‌های صریح یا جزئیات دیگری را که مختص کتاب‌ها هستند نشان می‌دهد.

• تکمیل‌هایی که منحصر به هری پاتر نیستند، اما در مضامین آن (جادوگران، فانتزی و غیره) بدون هیچ اشاره‌ای به این مضامین در اعلان هستند.

• تکمیل‌هایی که ممکن است تصادفی به نظر برسند…

Source link