جستجوی Google تحت تأثیر حملات گسترده هرزنامه قرار گرفت

نتایج جستجوی گوگل در چند روز گذشته مورد حمله اسپم قرار گرفته است، چیزی که فقط می توان آن را کاملاً خارج از کنترل توصیف کرد. بسیاری از دامنه ها برای صدها هزار کلمه کلیدی رتبه بندی می شوند، که نشان می دهد مقیاس این حمله می تواند به راحتی به میلیون ها عبارت کلیدی برسد.

با کمال تعجب، بسیاری از دامنه ها تنها در 24-48 ساعت گذشته ثبت شده اند.

این اخیراً از یک سری پست توسط بیل هارتزر (نمایه لینکدین) مورد توجه من قرار گرفت که در آن او نمودار پیوند ایجاد شده توسط ابزار بک لینک Majestic را منتشر کرد که شبکه های پیوند چندین سایت اسپم را در معرض دید قرار داد.

نمودار پیوندی که او ارسال کرد، تعداد زیادی از وب سایت ها را نشان داد که به شدت با یکدیگر پیوند دارند، که یک الگوی نسبتا معمولی برای شبکه های پیوند هرزنامه است.

اسکرین شات از شبکه به هم پیوسته محکم

جستجوی Google تحت تأثیر حملات گسترده هرزنامه قرار گرفتتصویر توسط بیل هارتزر از طریق Majestic

من و بیل در مورد سایت‌های اسپم از طریق پیام‌رسان فیس‌بوک صحبت کردیم و هر دو موافق بودیم که اگرچه ارسال‌کنندگان هرزنامه تلاش زیادی برای ایجاد یک شبکه بک لینک انجام دادند، اما پیوندها در واقع مسئول رتبه‌بندی بالا نیستند.

بیل گفت:

“به نظر من این تا حدی تقصیر گوگل است که به نظر می رسد بیشتر بر محتوا تاکید می کند تا پیوندها.”

من 100% موافقم که گوگل بیشتر بر محتوا تاکید می کند تا لینک ها. اما فکر من این است که پیوندهای هرزنامه وجود دارد تا Googlebot بتواند صفحات هرزنامه را کشف کند و آنها را فهرست کند، حتی اگر فقط برای یک یا دو روز باشد.

به محض ایندکس شدن، صفحات هرزنامه احتمالاً از دو حفره در الگوریتم‌های گوگل استفاده می‌کنند که در ادامه در مورد آن صحبت خواهم کرد.

هرزنامه خارج از کنترل در SERP های گوگل

چندین سایت برای عبارات طولانی رتبه بندی می شوند که رتبه بندی آنها تا حدودی آسان است، و همچنین عباراتی با یک جزء جستجوی محلی، که رتبه بندی آنها نیز آسان است.

عبارات دم بلند عبارات کلیدی هستند که توسط مردم استفاده می شود اما بسیار نادر است. Longtail مفهومی است که تقریباً بیست سال است که وجود داشته و متعاقباً توسط کتابی به نام The Long Tail در سال 2006 رایج شد: چرا آینده کسب و کار فروش کمتری دارد.

ارسال‌کنندگان هرزنامه می‌توانند برای این عباراتی که به ندرت جستجو می‌شوند رتبه‌بندی کنند، زیرا رقابت کمی برای آن عبارات وجود دارد که رتبه‌بندی را آسان می‌کند.

بنابراین اگر یک هرزنامه میلیون‌ها صفحه عبارات طولانی ایجاد کند، آن صفحات می‌توانند هر روز برای صدها هزار کلمه کلیدی در مدت زمان کوتاه رتبه‌بندی شوند.

شرکت هایی مانند آمازون از اصل دم بلند برای فروش صدها هزار محصول در روز استفاده می کنند که با فروش صدها هزار بار در روز یک محصول متفاوت است.

این همان چیزی است که هرزنامه‌ها از آن استفاده می‌کنند، سهولت رتبه‌بندی عبارات طولانی.

دومین چیزی که اسپمرها از آن سوء استفاده می کنند، حفره ای است که در جستجوی محلی وجود دارد.

الگوریتم جستجوی محلی با الگوریتم رتبه بندی کلمات کلیدی غیرمحلی یکسان نیست.

نمونه‌هایی که آشکار شده‌اند، انواعی از Craigslist و کلمات کلیدی مرتبط هستند.

به عنوان مثال عبارت هایی مانند قطعات خودرو Craigslist، اتاق های کریگز لیست برای اجاره، Craigslist برای فروش توسط مالک و هزاران کلمه کلیدی دیگر که اکثر آنها از کلمه Craigslist استفاده نمی کنند.

مقیاس هرزنامه بسیار زیاد است و بسیار فراتر از کلمات کلیدی با کلمه “Craigslist” در آن است.

صفحه هرزنامه چگونه به نظر می رسد

نگاهی به ظاهر صفحه هرزنامه با بازدید از صفحات با مرورگر غیرممکن است.

من سعی کردم کد منبع سایت هایی را ببینم که در گوگل رتبه بندی می شوند اما همه سایت های اسپم به طور خودکار به دامنه دیگری هدایت می شوند.

سپس برای بازدید از وب‌سایت، URL هرزنامه را در جستجوگر پیوند W3C وارد کردم، اما ربات W3C نیز نتوانست سایت را ببیند.

بنابراین من عامل کاربر مرورگر خود را تغییر دادم تا خود را به عنوان Googlebot معرفی کنم، اما سایت هرزنامه همچنان مرا هدایت کرد.

این نشان می‌دهد که سایت بررسی نمی‌کند که آیا عامل کاربر Googlebot است یا خیر.

سایت هرزنامه در حال بررسی آدرس های IP Googlebot بود. اگر آدرس IP بازدیدکننده به عنوان متعلق به Google مطابقت داشت، صفحه هرزنامه محتوا را به Googlebot نمایش می‌داد.

همه بازدیدکنندگان دیگر به دامنه‌های دیگری که محتوای کلی را نمایش می‌دهند تغییر مسیر دادند.

برای دیدن HTML وب سایت باید با یک آدرس IP Google بازدید می کردم. بنابراین من از تست کننده نتایج غنی گوگل برای بازدید از سایت هرزنامه و ضبط HTML صفحه استفاده کردم.

من به بیل هارتزر نشان دادم که چگونه HTML را با استفاده از تست کننده Rich Results استخراج کند و او بلافاصله در مورد آن توییت کرد، lol. دنگ!

Rich Results Tester گزینه ای برای نمایش HTML یک صفحه وب دارد. بنابراین HTML را کپی کرد، آن را در یک فایل متنی جایگذاری کرد و سپس آن را به عنوان یک فایل HTML ذخیره کرد.

اسکرین شات از HTML ارائه شده توسط Rich Results Tool

جستجوی Google تحت تأثیر حملات گسترده هرزنامه قرار گرفت

سپس فایل HTML را ویرایش کردم تا جاوا اسکریپت را حذف کنم و سپس فایل را دوباره ذخیره کردم.

اکنون توانستم ببینم صفحه وب برای Google چگونه به نظر می رسد:

تصویر صفحه وب اسپم

اسکرین شات از یک صفحه وب هرزنامه که در گوگل رتبه بندی می شود

رتبه یک دامنه برای بیش از 300000 کلمه کلیدی

بیل صفحه‌گسترده‌ای حاوی فهرستی از عبارات کلیدی را برای من فرستاد که فقط یکی از سایت‌های هرزنامه رتبه‌بندی شده است. یک سایت اسپم، فقط یکی از آنها، برای بیش از 300000 عبارت کلیدی رتبه بندی شده است.

اسکرین شات نمایش کلمات کلیدی برای یک دامنه

تصویری که نمای نزدیک از یک صفحه گسترده با عبارات کلیدی روی آن را نشان می دهد

عبارات کلیدی Craigslist زیادی وجود داشت اما عبارات طولانی دیگری نیز وجود داشت که بسیاری از آنها حاوی یک عنصر جستجوی محلی بودند. همانطور که اشاره کردم، رتبه‌بندی عبارات طولانی، رتبه‌بندی برای عبارات جستجوی محلی و ترکیب این دو نوع عبارت آسان است و رتبه‌بندی این عبارات کلیدی واقعاً آسان است.

چرا این تکنیک اسپم کار می کند؟

جستجوی محلی از الگوریتم متفاوتی نسبت به الگوریتم غیر محلی استفاده می کند. به عنوان مثال، یک سایت محلی، به طور کلی، برای رتبه بندی برای یک پرس و جو نیازی به لینک های زیادی ندارد. صفحات فقط به انواع کلمات کلیدی مناسب نیاز دارند تا یک الگوریتم جستجوی محلی را راه اندازی کنند و آن را برای یک منطقه جغرافیایی رتبه بندی کنند.

بنابراین اگر «قطعات خودرو Craigslist» را جستجو کنید، الگوریتم جستجوی محلی را راه‌اندازی می‌کند و به دلیل طولانی بودن آن، رتبه‌بندی آن زیاد طول نمی‌کشد.

این مشکلی است که سال هاست ادامه دارد. چندین سال پیش یک وب‌سایت توانست رتبه‌بندی «Rhinoplasty Plano, Texas» را با سایتی که حاوی مطالب و عناوین لاتین قدیمی رومی به زبان انگلیسی بود، کسب کند. رینوپلاستی یک جستجوی محلی است و پلانو، تگزاس یک شهر نسبتا کوچک است. رتبه بندی آن عبارت کلیدی جراحی بینی به قدری آسان بود که وب سایت لاتین زبان توانست به راحتی برای آن رتبه بندی کند.

همانطور که در توییتی توسط دنی سالیوان تایید شده است، گوگل حداقل از 19 دسامبر از این مشکل هرزنامه مطلع بوده است.

جالب است که ببینیم آیا گوگل بالاخره پس از این همه زمان راهی برای مبارزه با این نوع اسپم ها پیدا می کند یا خیر.

تصویر ویژه توسط Shutterstock/Kateryna Onyshchuk

سئو PBN | خبر های جدید سئو و هک و سرور