تعجب آور نیست که بازاریابان، بنیانگذاران و صاحبان مشاغل شروع به پرسیدن این سوال می کنند که چگونه می توان مارک های آنها را در پاسخ های داده شده توسط ابزارهای AI/LLM مانند ChatGPT، Perplexity و Gemini بازگرداند. اما کاملاً تکان دهنده است که یافتن اطلاعات با کیفیت بالا و دقیق در مورد نحوه انجام این کار چقدر دشوار است.
درست است، شما فقط می توانید از ChatGPT بپرسید (اولین پاسخ مناسب است، همانطور که پیشنهادات شماره 2-10 برای سوال دوم هستند؛ شماره 1 … مشکل ساز است، بیشتر در مورد آن در ویدیو). با این حال، دستیابی به اصل موضوع، مستلزم درک دقیقی از چگونگی و چرایی این موضوع است که LLM ها پاسخ هایی را که می دهند، برمی گردانند. با داشتن این دانش، میتوانیم انتخابهای هوشمندانهای در مورد محل سرمایهگذاری در رسانههای اجتماعی، بازاریابی محتوا، سرمایهگذاریهای روابط عمومی و رسانه، مشارکتها و مشارکتهای خود در وب داشته باشیم.
در تخته سفید 5 دقیقه ای این هفته (که با عرض پوزش 9 دقیقه است – موضوع نیاز به بررسی دقیق تری داشت)، توضیح خواهم داد:
- چگونه LLM ها تعیین می کنند که کدام کلمات را بعد از کلمات دیگر در پاسخ های خود قرار دهند
- بازاریابان، بنیانگذاران و سازندگان چه کاری میتوانند انجام دهند تا بر این نتایج تأثیر بگذارند
- راههایی برای دستیابی به بینش در مورد منابعی که احتمالاً در دادههای آموزشی LLM استفاده میشوند
- تاکتیک هایی برای یافتن فرصت هایی برای تأثیرگذاری بر داده های آموزشی
رونوشت
چگونه میتوانید برند، شرکت، نام خود را به عنوان پاسخی که یک مدل زبان بزرگ در هنگام پرسیدن یک سوال مرتبط از کاربران میدهد، دریافت کنید؟
این اساساً همان چیزی است که سئو (بهینهسازی موتور جستجو) برای Google، Bing، Dogpile، Lycos و HotBot در آن روزگار بود، به جز این که این مدلهای جدید، هوش مصنوعی، این کار را کاملاً متفاوت انجام میدهند. واحد پول جستجوی گوگل لینک ها بود. روشی که در این نتایج رتبه بندی کردید از طریق پیوندها، محتوای مرتبط، استفاده هوشمندانه از کلمات کلیدی و ارجاع به کار خود از منابعی بود که موتورهای جستجو خزیده بودند.
روشی که شما در مدل های زبان بزرگ رتبه بندی می کنید اینطور نیست. واحد پول مدل های زبان بزرگ لینک نیست. واحد پول مدل های زبان بزرگ عبارت است از ذکر (مخصوصاً کلماتی که اغلب در نزدیکی کلمات دیگر ظاهر می شوند) در داده های آموزشی. بگذارید منظورم را به شما نشان دهم.
من در واقع از این نتایج کاملا شرمنده شدم. من فکر نمی کنم آنها عالی باشند. از این رو، این ویدیو، پاسخ اجمالی هوش مصنوعی گوگل نیز عالی نیست. اگرچه آنها به Seer Interactive اشاره می کنند که چیزهای بسیار خوبی در اینجا دارد و من در نظرات به آنها پیوند داده ام.
باشه اول از همه، من دوست دارم استفن ولفرام سال گذشته در مورد نحوه عملکرد ChatGPT نوشته باشد. من فکر می کنم این واضح ترین و در دسترس ترین پاسخ به این است که چگونه یک مدل زبان بزرگ تصمیم می گیرد چه پاسخی بدهد. و در مقاله خود در این مورد، “ChatGPT چه می کند و چرا کار می کند؟” او این گرافیک خاص را نشان می دهد که به نظر من مفید است.
بهترین چیز در مورد هوش مصنوعی توانایی آن در یادگیری، پیش بینی، ساختن، درک، و سپس یک درصد است.
او توضیح می دهد که این درصد از داده های آموزشی ناشی می شود. اساساً، اگر ChatGPT دیده باشد که کلمه “یادگیری” بسیار بیشتر از کلمه “پیش بینی” ظاهر می شود زمانی که جمله “بهترین چیز در مورد هوش مصنوعی توانایی آن است…” در وب ظاهر می شود، به احتمال زیاد “” را نشان می دهند. یاد بگیر» تا «پیشبینی»
به این ترتیب شما خروجی مدل زبان بزرگ را بدست می آورید که برخی افراد آن را به عنوان آن توصیف می کنند تکمیل خودکار تند یا، کلماتی که اغلب پس از کلمات دیگر آمده اند. و به نظر من این راه بسیار خوبی برای فکر کردن به ابزارهای هوش مصنوعی است. بنابراین از ChatGPT پرسیدم، بهترین رستورانهای خوب در سیاتل کدامند؟ و، می توانید ببینید که من این را برای شما پنهان می کنم.
می بینید که Canlis بهترین نتیجه است. من در واقع چندین بار همین سوال را از ChatGPT پرسیدم. من هر بار نتایج متفاوتی گرفتم، که یکی از ناراحتیهای یک مدل زبان بزرگ است، زیرا همانطور که ولفرام در مثال خود در اینجا نشان میدهد، درصدی است که بر اساس آموزش، کلمهای را که بعد از هر کلمه دیگری آمده است را ببینید. داده های مدل یا آموزش بنابراین، Canlis تقریبا همیشه (اما نه هر بار) در اولین نتیجه ظاهر می شود.
وقتی این را اجرا کردم، میدانی، پنج، ده بار، فکر میکنم هفت بار از هشت بار آن را دیدم یا چیزی شبیه به آن. و این افراد دیگر، Herbfarm مکررا در مریخ نوردهای آنها حضور داشت، که سال هاست وجود نداشته است. و متأسفانه از سرآشپز تیری روتورو که یک سال پیش درگذشت یاد کردند. اما بسیاری از این پاسخهای دیگر پاسخهای معقولی هستند و از آنچه گوگل در اینجا ارائه میکند چندان دور نیستند.
می بینید که وقتی من برای رستوران های خوب در سیاتل جستجو می کنم، Canlis اولین نتیجه است. Altura دومی است.
در اینجا کاری است که من انجام خواهم داد اگر شما سعی می کنید به این نتایج برسید. اگر برای مثال، رستوران Eden Hill یا یکی از این رستورانهای غذاهای عالی در سیاتل هستید و نمیبینید که در ChatGPT یا سایر پاسخهای مدل زبان بزرگ به آن اشاره شده است، و فکر میکنید که ظاهر شدن برند یا شرکت شما مهم است. در این نتایج LLM، اقدام بعدی چیست؟
در اینجا کاری است که من انجام خواهم داد:
من به دنبال همه مکانهایی در وب میگردم که در مورد آنها صحبت میشود، غذاخوریهای خوب و رستورانها و سیاتل. می توانید ببینید که من این کار را به طور خاص در نقل قول انجام داده ام، نه اینکه سعی کنم این را فقط به عنوان یک پرس و جو استاندارد قرار دهم و آن و این به دلیل خاصی است. این به این دلیل است که نتایجی که من در اینجا می بینم دقیقاً از این زبان استفاده می کند زیرا، البته، ما به دنبال کلماتی هستیم که اغلب پس از کلمات دیگر آمده اند، و بنابراین می خواهیم آن مکان ها را در وب پیدا کنیم.
و سپس کاری که ما می خواهیم انجام دهیم این است که مطمئن شویم نام تجاری ما در اینجا ذکر شده است. اکنون بسیار دشوار است که رستوران خود را در لیست بهترین رستوران های سیاتل برای مناسبت های خاص در EATER ذکر کنید؟ آره هست. این سخت است. این یک فرآیند روابط عمومی و یک فرآیند پیاده سازی خواهد بود، اما آیا ارزش دارد؟
کاملا. نه تنها برای مدلهای زبان بزرگ ارزشمند است، اگرچه مطمئناً احتمالاً برای آنها مفید است، اما به احتمال زیاد افراد دیگر روی این نتیجه کلیک کرده و شما را از آنجا پیدا میکنند. و این تقریباً برای همه نتایجی که ممکن است در اینجا بیابید صادق است. بنابراین این یک فرآیند دستی است.
این یکی از راههای انجام این کار است. روش دیگر، که نسبتاً جالب است، و من در واقع متوجه شدم که مدلهای زبان بزرگ خود کاملاً از وبسایتهایی که احتمالاً به دادههای آموزشی مدل زبانی بزرگ کمک میکنند آگاه هستند. بنابراین میتوانید از ChatGPT یا LLM انتخابی خود بپرسید، میدانید که احتمال استفاده از Conde Nast Traveler، CN Traveler dot com در دادههای آموزشی LLM چقدر است. و همانطور که در اینجا می بینید، در مقیاس این چیزی است که من از ChatGPT پرسیدم.
در مقیاس صفر، به احتمال زیاد، تا صد، تقریباً مطمئن، چقدر احتمال دارد که وب سایت های زیر در داده های آموزشی مدل های زبان بزرگ مانند Gemini و ChatGPT و سرگشتگی استفاده شوند.
و سپس لیستی از سایت ها را به آن می دهم و مقداری تخمین به من می دهد. به نظر من اینها کامل نیستند. اگر ده بار بپرسید، باز هم ده پاسخ متفاوت به شما می دهد. اما تقریباً همیشه چیزهایی می گوید که درست هستند، مانند اینکه Reddit به احتمال زیاد در اینجا استفاده می شود. ما می دانیم که آنها داده های خود را به مدل های زبان بزرگ می فروشند و بنابراین یک منبع رایج برای داده های آموزشی است. غذاخور و مسافر CN، و نیویورک تایمز، در آن بالا. و سپس سایتهای کوچکتر، سایتهای خاصتر، مکانهایی که خزیدن آنها سختتر است، میتوانید اعداد مختلفی را در آنجا ببینید.
و به عنوان مثال، این محتوای تولید شده توسط کاربر گاهی اوقات به دلایل حفظ حریم خصوصی حذف می شود. اینها چیزهایی است که درست است و در مورد فرآیندهای مدل زبان بزرگ نوشته شده است، که واقعا مفید است. حالا بگذارید چیز دیگری را به شما نشان دهم که بسیار نرم است.
میتوانید به SparkToro بروید و میتوانید بگویید، هی، برای افرادی که کلمات کلیدی غذای خوب سیاتل را جستجو میکنند، احتمالاً در چه وبسایتی قرار خواهند گرفت؟ چه وب سایت هایی با این مخاطبان قرابت بالایی دارند؟ و در اینجا میتوانید ببینید که برخی از آنها شامل مواردی مانند Four Seasons است، که یک هتل بسیار شیک در سیاتل است که در آن مسافرانی را میتوان یافت که احتمالاً به دنبال غذاخوری خوب هستند. در اینجا می توانید چیزهایی مانند آلاسکا ایر را ببینید که سیاتل مرکز و مرکز خطوط هوایی آلاسکا است.
و بنابراین جای تعجب نیست، بسیاری از بازدیدکنندگان شهر از آنجا وارد می شوند. بنابراین این با آنچه مدل های زبان بزرگ احتمالاً در آموزش استفاده می کنند متفاوت است. با این حال، می توانید این لیست را بگیرید، یک CSV صادر کنید. میتوانید آن CSV را باز کنید، و سپس، این دامنهها را کپی کنید، و دقیقاً همان کاری را که من با ChatGPT نشان دادم، انجام دهید.
برای این لیست دوباره این کار را انجام دهید.
بوم.
و در آنجا ما اکنون احتمالاً تخمین هایی در مورد این نوع چیزها خواهیم داشت. باز هم، من این نتایج را کاملاً تحت اللفظی نمیدانم، اما از آنها بهعنوان نشاندهنده جایی که ممکن است نیاز به انجام بازاریابی روابط عمومی و نظرات و پیشنهادات برای موارد زیر داشته باشید، استفاده میکنم:
- “هی، می توانیم با شما یک قطعه بنویسیم؟”
- “آیا می توانیم وارد نسخه بعدی شما شویم؟”
- “دفعه بعد که در مورد رستوران صحبت می کنید، ما دوست داریم رستوران ما در نظر گرفته شود.”
- «میتوانیم منتقد شما را به اینجا دعوت کنیم؟»
هر کاری که ممکن است انجام دهید.
و این فقط SparkToro نیست. ابزار دیگری وجود دارد که توصیه می کنم از آن استفاده کنید. این BuzzSumo است. آنها یک ویژگی هشدار دارند که من آن را دوست دارم و سال ها از آن استفاده کرده ام. بنابراین کاری که من اینجا انجام دادهام این است که اجازه دهید این را منفجر کنم تا بتوانید آن را ببینید.
بنابراین می توانید یک هشدار برای یک کلمه کلیدی ایجاد کنید. من این را میخواهم غذای خوبم را سیاتل بگذارم، جستجو کنم، و چه کلمه کلیدی را میخواهم نظارت کنم؟ من میخواهم غذاخوریهای خوب را با یک مطابقت دقیق نظارت کنم، و همچنین باید دقیقاً حاوی کلمه کلیدی Seattle باشد، و من خلاصه آن را میخواهم. و کاری که BuzzSumo انجام خواهد داد این است که یک پیش نمایش از نتایجی که دیده می شود به من می دهد. بنابراین، افرادی در محتوای منتشر کننده وب که حاوی کلمه غذاخوری خوب و سیاتل هستند، کجا هستند. و سپس میتوانید این مکانها را درست ببینید، مانند Elite Sports Tours و Washington Tasting Room dot com و Eater که ما آنها را میشناسیم.
این فرآیند اساساً انجام تبلیغات عمومی و روابط عمومی و بازاریابی محتوا و اطمینان از اینکه کلمات شما بعد از کلمات دیگر در وب ظاهر می شوند، در مکان هایی که LLM ها احتمالاً داده های آموزشی خود را منبع می کنند، این روشی است برای اینکه چگونه برند خود را به بزرگی تبدیل کنید. پاسخ مدل زبان
اگر بتوانید مانند Canlis مترادف با غذاخوری عالی در سیاتل شوید، زمانی که مدل های زبان بزرگ آن ها را به شما می دهند، اغلب در صدر نتایج ظاهر می شوید.