بر اساس مطالعهای که توسط مرکز یدککشی برای روزنامهنگاری دیجیتال دانشگاه کلمبیا انجام شده، جستجوی ChatGPT OpenAI برای استناد دقیق ناشران اخبار مشکل دارد.
این گزارش نقل قولهای اشتباه مکرر و اسناد نادرست را نشان میدهد که نگرانیهایی را در میان ناشران در مورد دیده شدن برند و کنترل بر محتوای آنها ایجاد کرده است.
علاوه بر این، یافته ها تعهد OpenAI به توسعه هوش مصنوعی مسئولانه در روزنامه نگاری را به چالش می کشد.
پس زمینه در جستجوی ChatGPT
OpenAI ماه گذشته ChatGPT Search را راهاندازی کرد و ادعا کرد که همکاری گستردهای با صنعت خبر داشته و بازخورد ناشران را در خود جای داده است.
این در تضاد با عرضه اولیه ChatGPT در سال 2022 است، جایی که ناشران متوجه شدند که محتوای آنها برای آموزش مدلهای هوش مصنوعی بدون اطلاع یا رضایت استفاده شده است.
اکنون، OpenAI به ناشران اجازه می دهد تا از طریق فایل robots.txt مشخص کنند که آیا می خواهند در نتایج جستجوی ChatGPT گنجانده شوند یا خیر.
با این حال، یافتههای مرکز یدک کشی نشان میدهد که ناشران بدون توجه به انتخاب مشارکت خود، با خطر توزیع نادرست و ارائه نادرست مواجه هستند.
مسائل مربوط به دقت
مرکز یدک کش توانایی ChatGPT Search را برای شناسایی منابع نقل قول از 20 نشریه ارزیابی کرد.
یافته های کلیدی عبارتند از:
- از 200 پرسش، 153 پاسخ نادرست بود.
- هوش مصنوعی به ندرت اشتباهات خود را تصدیق می کرد.
- عباراتی مانند “احتمالا” تنها در هفت پاسخ استفاده شد.
ChatGPT اغلب رضایت کاربران را بر دقت اولویت قرار می دهد، که می تواند خوانندگان را گمراه کند و به شهرت ناشر آسیب برساند.
علاوه بر این، محققان دریافتند که جستجوی ChatGPT زمانی که چندین بار از یک سوال پرسیده میشود ناسازگار است، احتمالاً به دلیل تصادفی بودن مدل زبان آن.
استناد به محتوای کپی شده و همزمان
محققان دریافتند که جستجوی ChatGPT گاهی اوقات به جای منابع اصلی به مقالات کپی شده یا سندیکایی اشاره می کند.
این احتمالاً به دلیل محدودیت های ناشر یا محدودیت های سیستم است.
به عنوان مثال، هنگامی که از یک مقاله نیویورک تایمز درخواست شد (در حال حاضر درگیر شکایت علیه OpenAI و مسدود کردن خزندههای آن است)، ChatGPT به یک نسخه غیرمجاز در سایت دیگری پیوند داده شد.
حتی با بررسی فناوری MIT، که به خزندههای OpenAI اجازه میدهد، ربات چت به جای نسخه اصلی، یک کپی سندیکایی را ذکر کرد.
مرکز یدک کشی دریافت که همه ناشران در خطر ارائه نادرست توسط ChatGPT Search هستند:
- فعال کردن خزنده ها قابلیت مشاهده را تضمین نمی کند.
- مسدود کردن خزنده ها مانع از نمایش محتوا نمی شود.
این مسائل نگرانیهایی را در مورد فیلتر کردن محتوای OpenAI و رویکرد آن به روزنامهنگاری ایجاد میکند که ممکن است مردم را از ناشران اصلی دور کند.
پاسخ OpenAI
OpenAI به یافتههای مرکز یدککشی پاسخ داد و بیان کرد که از ناشران از طریق ذکر منبع واضح پشتیبانی میکند و به کاربران کمک میکند محتوا را با خلاصهها، نقل قولها و پیوندها کشف کنند.
یک سخنگوی OpenAI بیان کرد:
«ما با کمک به ۲۵۰ میلیون کاربر هفتگی ChatGPT در کشف محتوای باکیفیت از طریق خلاصهها، نقلقولها، پیوندهای واضح و ذکر منبع، از ناشران و سازندگان حمایت میکنیم. ما با شرکا همکاری کردهایم تا دقت استناد درون خطی را بهبود بخشیم و به اولویتهای ناشر احترام بگذاریم، از جمله فعال کردن نحوه نمایش آنها در جستجو با مدیریت OAI-SearchBot در robots.txt. ما به بهبود نتایج جستجو ادامه خواهیم داد.”
در حالی که این شرکت برای بهبود دقت استناد کار کرده است، OpenAI میگوید پرداختن به مسائل مربوط به نادرستی خاص دشوار است.
OpenAI همچنان متعهد به بهبود محصول جستجوی خود است.
نگاه کردن به جلو
اگر OpenAI میخواهد با صنعت خبر همکاری کند، باید اطمینان حاصل کند که محتوای ناشر به طور دقیق در جستجوی ChatGPT نشان داده میشود.
ناشران در حال حاضر قدرت محدودی دارند و از نزدیک پرونده های حقوقی علیه OpenAI را زیر نظر دارند. نتایج می تواند بر حقوق استفاده از محتوا تأثیر بگذارد و به ناشران کنترل بیشتری بدهد.
همانطور که محصولات جستجوی مولد مانند ChatGPT نحوه تعامل مردم با اخبار را تغییر میدهند، OpenAI باید تعهد خود را به روزنامهنگاری مسئولانه نشان دهد تا اعتماد کاربران را جلب کند.
تصویر ویژه: رابرت وی/شاتراستاک