Reddit این هفته شرایط بهروزرسانیشدهای را برای ابزارها و خدمات توسعهدهنده، دسترسی پولی به Reddit Data API و ابزارهای تعدیل بومی بیشتر اعلام کرد.
در حالی که وبلاگ Reddit تغییرات را به عنوان بخشی از ایجاد یک اکوسیستم سالم توضیح داد، نیویورک تایمز گزارش داد که دسترسی به API پولی شرکتهای بزرگ را از استفاده رایگان از محتوای Reddit برای آموزش مدلهای زبان بزرگ (LLM) باز میدارد.
اسناد به روز شده تأیید می کند که توسعه دهندگان فقط می توانند از محتوای Reddit برای آموزش LLM با تأیید قبلی Reddit استفاده کنند و این به منزله دسترسی تجاری است.
بارد نمی تواند تأیید کند که آیا Google محتوای Reddit را در داده های آموزشی خود به عنوان بخشی از مجموعه داده های عمومی در دسترس «احتمالاً استفاده شده» گنجانده است یا خیر.
ChatGPT نمی تواند فهرست خاصی از منابع را به اشتراک بگذارد، اما Reddit ممکن است یکی از آنها باشد.
هوش مصنوعی بینگ تأیید میکند که مایکروسافت از منابع داده متعددی از جمله شاخص و الگوریتم بینگ با مدلهای OpenAI GPT استفاده میکند.
با توجه به اینکه ChatGPT ممکن است از دادههای Reddit استفاده کرده باشد، میتوان حدس زد که مایکروسافت نیز از طریق مشارکت خود با OpenAI استفاده کرده است.
چقدر به API داده Reddit دسترسی خواهد داشت؟
طبق شرایط بهروزرسانیشده توسعهدهنده – از ۱۹ ژوئن ۲۰۲۳ – Reddit برای آنچه دسترسی تجاری و استفاده از API میداند هزینهای را دریافت میکند:
- اگر یک کسب و کار یا خدمات پولی با API متصل شود، دسترسی تجاری محسوب می شود.
- اگر یک کسب و کار یا خدمات به طور مستقیم یا غیرمستقیم از هر داده Reddit یا داده های مشتق شده درآمد ایجاد کند.
موارد زیر نمونههای خاصی از خدمات کسب درآمد از صفحه پلتفرم برنامهنویس Reddit هستند:
- خدماتی که از تبلیغات و دیوارهای پرداخت درآمد ایجاد می کنند.
- موتورهای جستجویی که از تبلیغات درآمدزایی می کنند.
- خدماتی که از کاربران برای دسترسی به تحقیقات یا داده ها هزینه دریافت می کنند.
- خدماتی که کاربران برای آنها هزینه اشتراک پرداخت می کنند.
- خدماتی که در محصول دیگری به فروش می رسد.
- خدماتی که محتوای Reddit را در وبسایتها و برنامههای کسب درآمد منتشر میکنند.
- سرویس هایی که از داده های Reddit برای مدل های آموزشی استفاده می کنند.
محققانی که از API برای مقاصد غیرتجاری استفاده میکنند، در صورتی که موافقت کنند دادههای حساس Reddit یا محصولات ساختهشده با استفاده از محتوای Reddit را منتشر نکنند، ممکن است به این کار ادامه دهند. دسترسی به حجم زیادی از داده ها ممکن است برای پوشش هزینه های مرتبط با دسترسی انبوه به API مستلزم هزینه باشد.
کریستوفر اسلو، مدیر ارشد فناوری Reddit، در مورد یک بحث یادگیری ماشینی در مورد این خبر اظهار نظر کرد و نوشت:
ما در مورد تحقیقات LLM و ML هیجان زده هستیم و به طور کلی به نقشی که Reddit در این کار در طول سال ها ایفا کرده است بسیار مفتخریم. بنابراین، در حالی که ما باید بیشتر تلاش کنیم تا اطمینان حاصل کنیم که دادههای کاربرانمان به شیوهای مسئولانه به اشتراک گذاشته میشود، اما به دنبال جلوگیری از تحقیقات دانشگاهی یا کسب درآمد از محققان نیستیم.»
توسعه دهندگان همچنین باید بپذیرند که محتوای کاربر در Reddit متعلق به کاربران است و مشمول حقوق و محدودیتهای استفاده مشخص شده توسط کاربر است. قرارداد کاربر تأیید می کند که کاربران حقوق محتوای خود را حفظ می کنند، اما آنها همچنین مجوز استفاده از آن را بدون حق امتیاز به Reddit می دهند.
Reddit جزئیات قیمت را به محض نهایی شدن به اشتراک خواهد گذاشت.
Reddit به گردانندگان اطمینان داد که تغییرات API بر ابزارهایی که به اجرای قوانین subreddit و حذف محتوایی که خطمشیهای Reddit را نقض میکنند، کمک نمیکند.
گردانندگان تشویق می شوند که زیرمجموعه Mod News را دنبال کنند تا در مورد آخرین پیشرفت ها در ابزارهای تعدیل به روز بمانند. بر اساس گزارشها، Reddit تلاش میکند تا اعتدال جامعه را سختتر نگه دارد تا تبلیغکنندگان را راضی نگه دارد.
آیا Reddit Data API ابزارهای مدیریت رسانه اجتماعی خواهد بود؟
اگر از هر ابزار شخص ثالثی برای پست کردن در Reddit، جستجوی پستها در Reddit یا ایجاد گزارشهای تحلیلی برای حساب Reddit خود استفاده میکنید، سه راه وجود دارد که میتواند بر شما تأثیر بگذارد.
- ممکن است از طریق برخی خدمات شخص ثالث به دسترسی بیشتری به ویژگی های Reddit نیاز داشته باشید.
- ممکن است مجبور شوید برای برخی از خدمات شخص ثالثی که زمانی برنامه های قیمت گذاری رایگان را برای جذب هزینه افزایش یافته دسترسی به Reddit Data API ارائه می کردند، پرداخت کنید.
- ممکن است مجبور شوید برای برخی از خدمات شخص ثالث بیش از آنچه قبلاً پرداخت کرده اید، پرداخت کنید.
زمانی که Reddit جزئیات قیمت گذاری API را منتشر کرد، تأثیر آن را خواهیم دید. پلتفرم هایی که با Reddit ادغام می شوند عبارتند از Zapier، HootSuite، IFTTT، Feedly، Vista Social، Tray.io و Social Rise. این پلتفرمها به کاربران اجازه میدهند تا بینشهای ارزشمندی در مورد تعامل Reddit کسب کنند.
در مورد اینکه اگر ابزار مدیریت رسانههای اجتماعی هزینه را به کاربرانش منتقل کند، چه نوع افزایشی را میتوانید انتظار داشته باشید: برای خدمات شخص ثالث با بیش از یک میلیون کاربر، این هزینه میتواند به اندازه یک دلار اضافی در ماه برای هر کاربر باشد. برای خدماتی که کاربران کمتری دارند، ممکن است بسیار بیشتر باشد.
اخبار مرتبط: چگونه تغییرات در API توییتر خدمات محبوب را مختل کرد
دو هفته پس از اینکه کاربران شروع به انتشار تصاویری مبنی بر قیمت گذاری سازمانی برای API توییتر کردند، توییتر به طور رسمی وب سایت خود را با برنامه های قیمت گذاری برای دسترسی پریمیوم به Twitter API v2 به روز کرد.
این به توسعهدهندگان اجازه میدهد تا برنامههایی بسازند که دادهها را از توییتر بازیابی و تجزیه و تحلیل میکنند – به این ابزارها اجازه میدهد توییتها را در یک موضوع خاص جستجو کنند، تأثیرگذاران را کشف کنند و گزارشهای تحلیلی درباره مخاطبان و تعامل حساب توییتر ایجاد کنند.
این API همچنین به برنامهها اجازه میدهد تا بهروزرسانیها را در توییتر ارسال کنند، که به ابزارهای مدیریت رسانههای اجتماعی امکان برنامهریزی و ارسال توییتها را به یک حساب میدهد.
توییتر سه گزینه قیمت گذاری را ارائه می دهد API v2.
توییتر از کاربرانی که به داده های بیشتری نیاز دارند دعوت کرد تا درخواست دهند API سازمانی دسترسی از طریق فرم گوگل
APIهای سازمانی پوشش همزمان توییتهای عمومی را با اپراتورها و قوانین خاص، فیلتر جستجوی پیشرفته، دسترسی کامل تاریخی به توییتهای بایگانیشده و فعالیت حساب توسط کاربران خاص (توییتها، پاسخها، دنبالکردن، لایکها، بلوکها و غیره) ارائه میدهند.
توییتر قیمت گذاری برای دسترسی به API توییتر در سطح سازمانی را در وب سایت خود فهرست نمی کند. آ توییت به اشتراک گذاشته شده توسط Wired، محدوده قیمت ماهانه 42000 تا 210000 دلار را پیشنهاد می کند.
در اینجا اسناد است. “بسته بزرگ” 210000 دلار در ماه یا 2.5 میلیون دلار در سال است (نکته @techmeme) https://t.co/RfGyWqpIgF pic.twitter.com/xuBiCBzoe7
— کریس استوکل-واکر ~ @[email protected] (@stokel) 10 مارس 2023
طبق گفته کاربران جوامع توسعه دهندگان خصوصی توییتر که برای اطلاعات بیشتر با این پلتفرم تماس گرفته اند، هیچ برنامه ای بین Basic (با 100 دلار در ماه) و Enterprise ارائه نمی دهد.
توییتر نیز مستهلک شد نسخههای قبلی API، از جمله استاندارد (v1.1)، Essential (v2)، بالا (v2)، و سطوح دسترسی API Premium.
افزایش هزینه ها و دسترسی مستهلک شده بر خدمات زیر که به API توییتر متکی هستند تأثیر گذاشت.
- هشدارهای هواشناسی نجات دهنده از چندین سرویس ملی هواشناسی حساب ها محدود بودند.
- IFTTT، یک سرویس اتوماسیون با 18 میلیون کاربر، با آن مواجه شد مسائل با تغییرات API که در ابتدای آوریل انجام شد.
- Feedly، یک سرویس خبرخوان که ویژگیهای هوش مصنوعی را در سال 2020 برای بیش از 18 میلیون کاربر یکپارچه کرد، ویژگیهای توییتر را بازنشسته کرد و شروع به کاوش در ادغام با Mastodon کرد.
- Flipboard، یک سرویس جمع آوری اخبار با 145 میلیون کاربر، اعلام کرد که فیدهای توییتر باقی خواهند ماند شکسته شده و اینکه Mastodon در آینده خود خواهد بود.
- HootSuite، یک ابزار مدیریت رسانه های اجتماعی با 18 میلیون کاربر، ارائه طرح های رایگان را به کاربرانی که توییتر و سایر پروفایل های اجتماعی را مدیریت می کنند، متوقف کرد.
ما با سازندگان چندین ابزار محبوب مدیریت رسانه های اجتماعی برای اظهار نظر تماس گرفتیم. تا کنون، آنها از اظهار نظر در هنگام کار با توییتر روی راهحلهای سفارشی تردید کردهاند.
ایلان ماسک، مدیرعامل توییتر (Now X Corp) گفت که دسترسی API پولی کاهش خواهد یافت سوء استفاده از ربات.
او همچنین پیشنهاد داد که امتناع مایکروسافت از پرداخت هزینههای API توییتر میتواند منجر به یک مشکل شود طرح دعوی در دادگاه بر فراز ظاهرا «پاره کردن پایگاه داده توییتر» و «فروش ما [Twitter] داده ها به دیگران.”
گیت هاب، مایکروسافت و OpenAI با یک شکایت دسته جمعی در سانفرانسیسکو، کالیفرنیا، به دلیل استفاده از محتوای تولید شده توسط کاربر ارسال شده، با نقض چندین دستورالعمل مجوز منبع باز روبرو هستند. مایکروسافت، گیت هاب و OpenAI خواستار رد این شکایت شده اند.
همین شرکت همچنین یک شکایت دسته جمعی علیه Stability AI، DeviantArt و Midjourney به دلیل استفاده از Stable Diffusion، متهم به استفاده از هنر دارای حق چاپ در داده های آموزشی خود، تنظیم کرد.
SEJ پیشرفتها را دنبال خواهد کرد، همانطور که سایر شرکتها با مخازن بزرگ دادههای عمومی و مکالمه در آینده در پاسخ به شرکتهای هوش مصنوعی از آنها برای آموزش دادهها استفاده خواهند کرد.
تصویر ویژه: Dennis Diatel/Shutterstock