ارزیابی کمی ابزارهای نوشتن هوش مصنوعی: بینش پاسخ‌های مقیاس لیکرت

نویسندگان:

(1) PIOTR MIROWSKI و KORY W. MATHEWSON، DeepMind، انگلستان و هر دو نویسنده به طور مساوی در این تحقیق مشارکت داشتند.

(2) JAYLEN PITTMAN، دانشگاه استنفورد، ایالات متحده و کارهای انجام شده در DeepMind.

(3) ریچارد ایوانز، دیپ مایند، بریتانیا.

چکیده و مقدمه

داستان سرایی، شکل داستان ها، و لاگ خطوط

استفاده از مدل های زبان بزرگ برای تولید متن خلاق

ارزیابی متن تولید شده توسط مدل های زبان بزرگ

مصاحبه های شرکت کنندگان

نظرسنجی های شرکت کنندگان

بحث و کار آینده

نتیجه گیری، قدردانی، و مراجع

الف. کارهای مرتبط روی تولید داستان خودکار و تولید داستان قابل کنترل

ب. بحث اضافی از بازی های تیم خلاق ربات ها

ج. جزئیات مشاهدات کمی

د. شکل های تکمیلی

E. FULL PROMPT Prefixes FOR DRAMATRON

F. خروجی خام تولید شده توسط DRAMATRON

G. فیلمنامه های مشترک

D شکل های تکمیلی

شکل 7 پاسخ شرکت‌کنندگان به ارزیابی کمی را نشان می‌دهد، در مقیاس لیکرت از 1 (کاملاً مخالفم) تا 5 (کاملاً موافقم)، و بر اساس گروه‌هایی از شرکت‌کنندگان تفکیک شده است. برای گروه اول، یک متغیر شاخص باینری (دارای تجربه ابزارهای نوشتن هوش مصنوعی) تعریف کردیم. برای گروه دوم، ما یک دسته سه کلاسه را برای حوزه اصلی تخصص آنها تعریف کردیم.

Source link