یکی از سردبیران سایت خبری محبوب The Verge در توییتی نوشت که مقاله جدیدی در صفحه یک از نتایج جستجوی گوگل با سایت های دیگری که آن را کپی کرده بودند جایگزین شده است. دنی سالیوان پاسخ می دهد که چرا این اتفاق می افتد.
محتوای کپی شده که ناشران را ناامید می کند
محتوای کپی شده که بالاتر از نسخه اصلی است، چیزی است که ناشران سالها از آن ابراز نارضایتی کردهاند.
برخی از شکایات ناشی از سوء تفاهم است.
به عنوان مثال، هنگامی که شخصی یک عبارت مزخرف مانند کلماتی که به طور تصادفی انتخاب شده از یک مقاله را جستجو می کند، گوگل نمی داند با آن چه کند که یک عبارت جستجوی واقعی نیست و پاسخی برای یک عبارت مزخرف وجود ندارد.
بنابراین کاری که گوگل انجام می دهد این است که به صورت پیش فرض جستجوی متنی را انجام دهد، به این معنی که گوگل نتایج جستجو را بر اساس کلمات موجود در یک عبارت جستجو که با کلمات موجود در یک صفحه وب مطابقت دارند، برمی گرداند.
آزمون واقعی برای اینکه آیا محتوای کپی شده بالاتر از محتوای اصلی است یا خیر، زمانی است که محتوای کپی شده از محتوای اصلی برای کلمات کلیدی رقابتی که کاربران واقعاً میسازند، بالاتر باشد.
اگر یک صفحه در نتایج داستان های برتر باشد، آیا باید دو برابر رتبه بندی شود؟
اما این وضعیتی که ظاهر شد، سناریوی دیگری را معرفی می کند. اتفاقی که افتاد این است که اگر آن صفحه وب قبلاً در نتایج برجسته داستان های برتر در بالای صفحه وب رتبه بندی شده باشد، گوگل عنوان مقاله را در بالای نتایج جستجوی معمولی رتبه بندی نمی کند.
Top Stories یک نتیجه برجسته است که در آن Google مقالات خبری مرتبط با یک عبارت جستجو را نشان می دهد.
بنابراین، اگر فردی سرفصل را جستجو کند، گوگل معمولاً مقاله را در بالای نتایج جستجو در بخش داستان های برتر نشان می دهد.
اما در این مورد، مقاله اصلی را در بالای نتایج جستجوی معمولی نشان نمیدهد، زیرا گوگل آن را deduplication مینامد، الگوریتمی که از دوبار رتبهبندی یک صفحه جلوگیری میکند.
بنابراین سوال این است که آیا گوگل باید یک صفحه را دو بار رتبه بندی کند، یک بار در داستان های برتر و دوباره در بالای نتایج جستجوی معمولی؟
کل صفحه اول از محتوای دزدیده شده تشکیل شده است
شخصی از The Verge در توییتی نوشت که جدا از بخش اخبار ویژه گوگل در بالای نتایج جستجو، جستجوی عنوانی از یک مقاله جدید منجر به این شد که گوگل ده نفر برتر را نشان دهد که شامل چیزی جز محتوای دزدیده نشده است.
آن شخص در توییتی نوشت:
“هی گوگل، من فقط به دنبال عنوانی گشتم که در وب سایت من منتشر شد و در کل صفحه اول پس از جعبه اخبار وب سایت هایی که محتوای ما را دزدیدند منتشر شد. The Verge تا صفحه 2 نشان داده نشد.
این مشکل بدتر می شود.»
هی گوگل، من فقط به دنبال عنوانی گشتم که در وب سایت من منتشر شد و در کل صفحه اول پس از جعبه اخبار وب سایت هایی که محتوای ما را دزدیدند منتشر شد. The Verge تا صفحه 2 نشان داده نشد.
این مشکل در حال بدتر شدن است. pic.twitter.com/Ox2AMYOt2Q
– دیتر بون (@backlon) 18 ژانویه 2022
دنی سالیوان از گوگل اذعان کرد که نویسندگانی که با عنوان جستجو می کنند انتظار دارند مقالات خود را در بالای نتایج جستجو ببینند، نه در صفحه دو.
اما او همچنین خاطرنشان کرد که جستجو بر اساس سرفصل لزوماً آنگونه نیست که جستجوگران معمولی جستجو کنند.
پاسخ دنی قابل بحث است. یک استدلال منطقی میتواند مطرح شود که بسیاری از افراد وقتی میخواهند عنوان مقالهای را برای اشتراکگذاری با یک دوست یا در رسانههای اجتماعی پیدا کنند، آن را جستجو میکنند. بنابراین دلیل واقعی وجود دارد که چرا افرادی غیر از نویسنده مقاله ممکن است عنوان یک مقاله را جستجو کنند.
دنی سالیوان از گوگل توییت کرد:
“ما نگاهی خواهیم انداخت. من می دانم که جستجو بر اساس تیتر برای نویسندگان رایج است و بله، من انتظار دارم این ابتدا برای آن نشان داده شود. اما منعکس کننده این نیست که بیشتر مردم چگونه ممکن است این محتوا را جستجو کنند (و برای اینکه چگونه ممکن است جستجو کنند، من آن را پیدا می کنم). اما باز هم، ما به دنبال بهبود هستیم.»
دنی در ادامه توضیح داد که چرا یک مقاله اصلی به دلیل عنوان خود در صفحه دوم رتبه بندی می شود:
در اینجا یک پیگیری در مورد آنچه اتفاق می افتد و آنچه ما به آن نگاه می کنیم است. شما این را ذکر می کنید، اما از اسکرین شات مشخص نیست که مقاله شما اولین چیزی است که در صفحه وجود دارد (همانطور که نشان داده شده است). از آنجایی که در داستان های برتر نمایش داده می شود، از بقیه صفحه حذف می شود… pic.twitter.com/YWCtcPAthZ
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
Deduplication اغلب می تواند مفید باشد. با انجام این جستجو به روشی که کاربر ممکن است با استفاده از عبارات جستجوی راه حل به جای عبارات غیرعادی در سرفصل، در بالای داستان های برتر قرار دارید، به علاوه حذف تکرار به این معنی است که تنوع بیشتری نسبت به سایر انتشارات وجود دارد…. pic.twitter.com/638IAZLWIV
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
در جستجوهایی مانند آن، سیستمهای ما نیز عموماً به دنبال نشان دادن مفیدترین و قابل اعتمادترین اطلاعاتی هستند که میتوانند. به همین دلیل است که تعداد زیادی از موارد تکراری از مقاله خود را نمی بینید. موارد تکراری قطعا وجود دارند، اما نشان دادن آنها چندان مفید نیست….
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
جستارهای جستجویی که نتایج جستجوی جایگزین را ایجاد می کنند
توییت بعدی دنی سالیوان توضیح میدهد که چگونه یک پرس و جو با عبارات زیاد، مانند یک عبارت سرفصل، باعث میشود الگوریتم گوگل به نوعی حذف شود و شروع به بازگشت نتایج جستجو کند که بیشتر شبیه جستجوهای کلیدواژه سبک قدیمی هستند، جایی که نتایج جستجو بر اساس آن نیستند. هدف جستجو یا پیوندها، اما فقط بر اساس خود کلمات کلیدی.
این چیزی است که دنی توییت کرد:
که منجر به جستجوهای تیتر محور می شود. همانطور که قبلاً گفتم، این در بین نویسندگان بسیار رایج است. من خودم همیشه این کار را انجام می دادم. اما جستجوهای سرفصل معمولاً حاوی عبارات زیادی هستند، بنابراین سیستمهای ما به صفحاتی برمیگردانند که دارای آن عبارات هستند…
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
همانطور که در بالا ذکر کردم، یک هدف جستجو در پشت جستجوی سرفصل ها وجود دارد. ممکن است گوگل «جستجوهای تیتر محور» را به عنوان هدف جستجویی که الگوریتم باید از آن آگاه باشد، تشخیص نداده باشد.
دنی پاسخش را ادامه داد:
این بدان معناست که نویسندگان احتمال بیشتری برای یافتن موارد تکراری دارند، حتی اگر برای جستجوهای معمولی که خوانندگان انجام میدهند، بعید است این جستجوها ظاهر شوند. اما ویژگی کسرسازی ما همچنان ممکن است حتی برای این موارد نیز وجود داشته باشد، همانطور که در این مورد اتفاق افتاد….
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
همانطور که گفتم، کپی برداری می تواند مفید باشد. اما ما همچنین نگرانی هایی را که ممکن است ایجاد کند درک می کنیم. ما از ماه می گذشته این کار را با Top Stories انجام دادهایم، اما میخواهیم دوباره آن را بررسی کنیم تا ببینیم آیا باید ادامه دهیم یا شاید تغییرات دیگری ایجاد کنیم.
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
همچنین، من هنوز در حال بررسی هستم، اما معتقدم که این حذف تکراری به ویژه از این نظر منحصر به فرد است که فقط در صورت نمایش یک داستان واحد یا شاید فقط برای اولین داستان نمایش داده شده در داستان های برتر اتفاق می افتد.
— دنی سالیوان (@dannysullivan) 18 ژانویه 2022
فقط برای محدود کردن توضیح بیشتر که قول داده بودم، اگر پیوندی به عنوان اولین پیوند در داستان های برتر و اگر کادر داستان های برتر قبل از نتایج وب ظاهر شود، پیوندی را از نتایج وب حذف می کنیم. اگر بعد از آن بیاید، نمی کنیم. و دوباره، این چیزی است که ما در حال بررسی آن هستیم.
— دنی سالیوان (@dannysullivan) 19 ژانویه 2022
مقالات خبری و کپی برداری
Deduplication زمانی است که گوگل تلاش می کند یک مقاله را از دوبار رتبه بندی در نتایج جستجو باز دارد. دنی سالیوان اظهار داشت که دلیل اینکه یک مقاله ممکن است در نتایج جستجوی معمولی ظاهر نشود این است که قبلاً در داستان های برتر رتبه بندی شده است و اگر آن داستان های برتر در بالای صفحه رتبه بندی شده باشد.
بنابراین سوال این است که آیا این وضعیتی است که یک صفحه وب باید دو بار رتبه بندی کند، زیرا ممکن است کاربر بخواهد مقاله اصلی را در بالای نتایج جستجو ببیند، حتی اگر قبلاً در بخش داستان های برتر باشد؟
پس از ناپدید شدن بخش داستان های برتر، مقاله خبری باید در بالای نتایج جستجو قرار گیرد.
پس از از بین رفتن داستان های برتر، محتوا در رتبه برتر قرار دارد
و همانطور که در اسکرین شات بالا مشاهده می شود، همان چیزی است که در حال حاضر در حال وقوع است.
این یک سوال جالب است که در آن گوگل باید تصمیم بگیرد که چه چیزی برای ناشر منصفانه است و چه چیزی برای جستجوگر مفید است.