هوش مصنوعی مولد و بهویژه ChatGPT برای مطبوعات فناوری، رسانههای جریان اصلی و گفتگوهای حرفهایها در تقریباً هر زمینهای مفید بوده است. چطور قراره در کار شما اختلال ایجاد کنه؟! آیا هوش مصنوعی جایگزین شما خواهد شد؟ آیا نویسندگان هالیوود، مشاوران املاک، سگگردان و متخصصان بیهوشی دیگر مفید هستند؟
در هماهنگی با افراد خوب Datos، که پانل انتخابی و ناشناس از 20 میلیون دستگاه (رومیزی و تلفن همراه، بیش از 200 کشور را پوشش میدهد) بینش فوقالعادهای را در مورد آنچه افراد واقعی در وب انجام میدهند، ارائه میدهد، ما پروژه چالشبرانگیزی را انجام دادیم تا به آن پاسخ دهیم. حداقل بخشی از رمز و راز پیرامون ChatGPT.
بررسی شماره 1: آیا استفاده از ChatGPT در حال افزایش است؟
اگر کارهایی مانند ChatGPT Forecasts استفاده برای رشد 900٪ یا ChatGPT را در عرض شش ماه به آنچه فیس بوک برای انجام آن به یک دهه نیاز داشت می خواند، می خوانید، اگر فرض کنید سیستم متن پیش بینی توکن آن چیزی را دارد که هر سرمایه گذار VC میل دارد، بخشیده خواهید شد. بعد از: رشد منحنی J. اما، ناظران باهوش تر ممکن است پست اخیر Honest Broker را متوجه شده باشند: اعداد زشت از ChatGPT نشان می دهد که تقاضای هوش مصنوعی در حال کاهش است یا پوشش مشابه WSJ و واشنگتن پست.
اول، نگاه سطح بالا به ترافیک OpenAI.com:

از ماه می، ترافیک OpenAI 29.15٪ کاهش یافته است. تئوری های مختلفی وجود دارد که این را توضیح می دهند بدون اینکه نشان دهند علاقه یا استفاده مولد هوش مصنوعی در واقع در حال کاهش است:
- تئوری الف) استفاده حرفه ای/معمول هنوز در بالاترین حد خود قرار دارد یا در حال رشد است. فقط کاربران جدید/آنهایی که آن را بررسی میکنند بدون-وظیفه-خاصی در حال سقوط هستند
- تئوری ب) استفاده زیاد به تکالیف مدرسه مرتبط است و کاربران آموزشی در ایالات متحده، کانادا و سایر کشورهای دارای تعطیلات تابستانی مسئول کاهش سراب هستند.
پانل کلیک جریان Datos هر URL بازدید شده توسط میلیون ها دستگاهی را که در پنل آنها شرکت کرده اند را جمع آوری می کند، و از این تعداد، نه تنها ترافیک ماهانه به OpenAI، بلکه تعداد بازدیدهای این دستگاه ها را نیز می بینیم. این باید به ما کمک کند تا نظریه A را تأیید یا رد کنیم.
من از Datos خواستم تا از سپتامبر سال گذشته (2022) کل ترافیک پنل به OpenAI را بر اساس بازدید/ماه به ما ارائه دهد. این توزیع در زیر به تصویر کشیده شده است:

در اینجا می توانیم ببینیم که بازدیدکنندگان 1-2 برابر در ماه، در واقع، از ماه می کاهش یافته اند. این گروه همچنین پس از دسامبر شاهد کاهش شدیدی بود (زمانی که اخبار فوری در مورد قابلیتهای ChatGPT 3 باعث رشد شهابسنگ در اولین استفاده شد). اما استخوانهای نظریه A در مقابل تجزیه و تحلیل دستگاههایی با 3-10 بازدید در ماه یا دستگاههایی با 11+ بازدید در ماه مقاومت نمیکنند. هر دوی آنها از ماه می کاهش نشان می دهند. در واقع کاهش 11+ بازدید/ماه دستگاه ها از آوریل اتفاق افتاده است!
این ما را با نظریه دوم رها می کند: کاربران آموزشی مسئول کاهش هستند. با توجه به کاهش اعداد از آوریل، این فروش سختی است، اما از آنجایی که فرآیند کشف پاسخها چیزهای بیشتری را در مورد استفاده از ChatGPT نشان میدهد، بیایید به جستجو ادامه دهیم.
تحقیق شماره 2: مردم برای حل چه وظایفی از ChatGPT می خواهند؟
آیا موارد استفاده آموزشی باعث پذیرش ChatGPT می شود؟ آیا ما نسلی از دانش آموزان را پرورش می دهیم که از هوش مصنوعی برای انجام بیشتر کارهای اداری استفاده می کنند؟ یا برعکس، آیا ChatGPT به سوالاتی پاسخ میدهد که جایگزین جستجوی گوگل میشوند، نیازی به برنامهنویسان نرمافزاری را از بین میبرند، یا شاید در میزهای بازی نقشآفرینی، داستانسرایان را پر میکند؟
برای پاسخ به این سؤالات، Datos بیش از 7000 درخواست واقعی کاربر را از ChatGPT به SparkToro ارائه کرد، که ما سپس آنها را به معتبرترین/مرتبط ترین 4098 فیلتر کردیم (حذف درخواست هایی که فقط چند کلمه یا چرندیات مزخرف / ایموجی ها / هیچ چیز غیرقابل قبولی نداشتند. زبان / غیره). نتایج شگفت انگیز است.
ابتدا، تعداد درخواستها را در هر جلسه تقسیم میکنم:

در بالا می بینیم که کاربران ChatGPT تقریباً به طور مساوی (یک سوم هر کدام) بین یک اعلان، 2-4 اعلان و 5+ جلسه اعلان تقسیم شده اند. اما، این نوع تجزیه و تحلیل به ما نمیگوید که مردم با آن درخواستها چه میکنند، و از آنجایی که Datos میتواند متن کامل صفحات ChatGPT را ارائه دهد، ما آنها را تجزیه و تحلیل کردیم (با استفاده از یکی از بهترین سیستمهای طبقهبندی موضوعات موجود: خود ChatGPT ).

من ابتدا از ChatGPT خواستم تا طبقهبندیهای ریز ارائه کند، سپس رایجترین آنها را انتخاب کردم (فقط 20 مورد بیش از 95% از 4098 درخواست منحصربهفرد را تشکیل میدادند) و آنها را بهصورت دستی در دستههای سطح بالا قرار دادم که در بالا میتوانید مشاهده کنید. برنامه نویسی بزرگترین مورد استفاده است، با 29.14٪ از تمام سری های سریع در این مورد استفاده می شود. همچنین واضح ترین/کمترین مبهم است. من 100+ از هر سری سریع را به صورت دستی بررسی کردم (یک کار سخت، اما جذاب) تا صحت طبقهبندی کننده را تأیید کنم، و کمک برنامهنویسی (با نوشتن بیتهای خاص کد، قالببندی کد، تشخیص خطاها در کد و موارد دیگر) در هر مورد وجود داشت. یک ChatGPT به عنوان علامت گذاری شده است.
همانطور که دیگران اغلب اشاره کرده اند، این ابزار در کارهای مربوط به برنامه نویسی برتری دارد. جای تعجب نیست که این یک مورد استفاده محبوب است.
بعدی آموزش است – اما نه فقط آموزش ابتدایی یا متوسطه. دانش شخصی یا علاقه مندی ها و دانش حرفه ای برای اهداف کاری هر دو در اینجا نیز گنجانده شده اند. در مورد ایجاد محتوا نیز – برخی به وضوح شخصی هستند (استادان سیاهچال D&D که به معماها یا تلاش برای ماجراجویی های خود نیاز داشتند، مورد علاقه مکرر مجموعه داده بود) در حالی که برخی دیگر حرفه ای هستند (“یک پست وبلاگ 500 کلمه ای درباره مشکلات لوله کشی دیترویت برای من بنویس” – احتمالاً یک محتوا بازاریاب از نوشتن مطالب خود خسته شده است).
موارد استفاده فروش و بازاریابی با ایجاد محتوا همپوشانی دارند، اما من تصمیم گرفتم این موارد را جدا نگه دارم تا فقط جلساتی را ببینم که فقط میتوانند به عنوان کمک به متخصصان فروش+بازاریابی در انجام وظایفشان طبقهبندی شوند (تجزیه و تحلیل تجزیه و تحلیل، سؤالاتی در مورد اینکه کدام کانالها را تبلیغ کنیم. محصولات، وظایف بهینهسازی تبلیغات و حتی پیامرسانی/تبلیغات کمکی همگی در مجموعه داده بودند).
برای بیان یک نکته دقیق تر در مورد این تحقیق، من تفکیک تقریباً کامل زیرمجموعه ها را ارائه می کنم (به جز تعدادی که بسیار همپوشانی/موضوعاتی که من ترکیب کرده ام):

من از کد رنگی در نمودار دایره ای بالا استفاده کرده ام تا این تفکیک را قابل اسکن تر کنم، به عنوان مثال «کمک نوشتن»، «ایجاد محتوای شخصی»، «ایده خلاقانه» و «ایجاد محتوای حرفه ای» همه با رنگ خاکستری هستند. آنها تحت “محتوا” مورد استفاده گسترده تر قرار می گیرند.
ویرایش بالاتر، ویرایش اولیه و تکالیف همه زیرمجموعههایی بودند که ChatGPT جلسات را در آن طبقهبندی میکرد، و با هم، 10٪ از تمام موارد استفاده را تشکیل میدهند. این برای توضیح کاهش 29 درصدی ترافیک از آوریل/مه تا ژوئیه کافی نیست، و بنابراین، من فکر میکنم میتوانیم در تابوت تئوری B قرار دهیم.
همچنین تجزیه و تحلیل برخی از رایج ترین کلمات در جلسات سریع ChatGPT برای من جذاب بود. برای کسانی که کنجکاو هستند، من یک نمودار تجسمی از موارد زیر را گنجانده ام:

«Write»، «Create» و «List» احتمالاً افعال واضحی برای درخواستهای ChatGPT هستند. اما، یافتن “SEO” در 2.39٪ از تمام جلسات سریع؟ تکان دهنده! دیدن “بازی” در 4.66٪ شگفتی دیگری بود. در این تفکیک نشان داده نشد، اما همچنان سرگرم کننده و جالب (حداقل برای من) بود:
- داور 0.61%
- SaaS 0.56%
- قیمت 0.54٪
- برنامه درسی 0.46%
- اشتغال 0.44%
- کارفرما 0.39%
- وکیل 0.37٪
- وکیل 0.37%
- توییت 0.34%
- فیلم 0.32%
- DnD (یا D&D) 0.17٪
- RPG 0.15٪
همانطور که گفتم، تعداد شگفت انگیزی از داستان نویسان نقش آفرینی از ChatGPT استفاده می کنند. شاید افراد Hasbro/Wizards of the Coasts باید این را برای ارتقاء بعدی در DnDBeyond در نظر بگیرند.
از الی، سرژ و کل تیم در داتوس، و همچنین بریتنی مولر، دانشمند ارشد DataSci101، و اسکات هاگ، مدیر ارشد فناوری وایدا، که بدون آنها این مطالعه امکانپذیر نبود، تشکر میکنیم.
برای کسانی که کنجکاو در مورد ارائهدهنده داده برای این مجموعه از میلیونها بازدید و هزاران سری سریع تحلیل شده هستند:
Datos ارائهدهنده پیشرو Data-as-a-Service (DaaS) مجموعه دادههای جریان کلیکی سازگار با حریم خصوصی در جهان است. آنها برای اکثر اقدامات رفتاری آنلاین قابل تصور، از جمله، اما نه محدود به، بازدید، جستجو، مصرف ویدئو، و خرید، فیدهای سطح رویداد و داده های جمع آوری شده را ارائه می دهند.
در واقع، ما آنقدر تحت تاثیر پنل Datos قرار گرفتهایم که SparkToro V2 (که آماندا اوایل این هفته منتشر کرد) از دادههای خارقالعاده خود به عنوان یکی از سه ستون در معماری محصول استفاده خواهد کرد.