تحقیقات جدید بیش از 16 میلیون صفحه وب نشان می دهد که نرخ نمایه سازی گوگل بهبود یافته است اما بسیاری از صفحات در مجموعه داده ها نمایه نشده اند و بیش از 20 ٪ از صفحات در نهایت deindexed شدند. این یافته ها ممکن است نماینده روندها و چالش هایی باشد که مخصوص سایت هایی است که نگران SEO و نمایه سازی هستند.
تحقیق توسط ابزار indexcheckr
IndexCheckr ابزاری برای ردیابی فهرست بندی Google است که باعث می شود مشترکان هنگام فهرست بندی محتوا از آنها هشدار دهند ، صفحات فهرست بندی شده را کنترل کرده و نظارت بر وضعیت نمایه سازی صفحات خارجی که میزبان بک لینک برای صفحات وب مشترک هستند.
این تحقیق ممکن است از نظر آماری با روندهای فهرست بندی Google در اینترنت ارتباط نداشته باشد اما ممکن است ارتباط نزدیکی با سایتهایی داشته باشد که صاحبان آنها نگران نمایه سازی و نظارت بر بک لینک هستند ، به اندازه کافی برای عضویت در ابزاری برای نظارت بر آن روندها.
درباره نمایه سازی
در نمایه سازی وب ، موتورهای جستجو اینترنت را خزنده می کنند ، محتوای فیلتر (مانند حذف نسخه های تکراری یا صفحات با کیفیت پایین) و صفحات باقیمانده را در یک پایگاه داده ساختاری به نام شاخص جستجو ذخیره می کنند. این شاخص جستجو در یک سیستم فایل توزیع شده ذخیره می شود. Google در ابتدا از سیستم Google File (GFS) استفاده کرد اما بعداً به Colossus ارتقا یافت ، که برای رسیدگی به مقادیر گسترده ای از داده های جستجو در هزاران سرور بهینه شده است.
نمایه سازی نرخ موفقیت
این تحقیقات نشان می دهد که بیشتر صفحات موجود در مجموعه داده های خود فهرست بندی نشده اند اما نرخ نمایه سازی از سال 2022 به 2025 بهبود یافته است. بیشتر صفحات که Google نمایه شده اند در طی شش ماه فهرست بندی می شوند.
- بیشتر صفحات موجود در مجموعه داده فهرست بندی نشده اند (61.94 ٪).
- نرخ نمایه سازی از سال 2022 به 2025 بهبود یافته است.
- Google بیشتر صفحات را که طی شش ماه (2 /93 ٪) فهرست بندی می شوند ، فهرست می کند.
روند deindexing
روند نمایه سازی بسیار جالب است ، به خصوص در مورد سرعت Google در صفحات deindexing. از بین تمام صفحات ایندکس شده در کل مجموعه داده ها ، 13.7 ٪ از آنها طی سه ماه پس از نمایه سازی ، از بین می روند. نرخ کلی deindexing 21.29 ٪ است. یک روش آفتابی برای تفسیر این داده ها این است که 78.71 ٪ توسط Google کاملاً نمایه شده اند.
Deindexing به طور کلی با فاکتورهای کیفیت Google مرتبط است اما همچنین می تواند ناشران وب سایت و SEO ها را که عمداً درخواست می کنند از طریق دستورالعمل های NOINDEX مانند عنصر Robots متا درخواست کنند ، از وب سایت استفاده می کنند.
در اینجا درصد تجمعی مبتنی بر زمان Deindexing است:
- 1.97 ٪ از صفحات فهرست بندی شده در طی 7 روز deindexed می شوند.
- 7.97 ٪ در طی 30 روز deindexed می شوند.
- 13.70 ٪ deindexed در طی 90 روز
- 21.29 ٪ پس از 90 روز deindexed.
مقاله تحقیقاتی که به من ارائه شده است این مشاهدات را ارائه می دهد:
وی گفت: “این جدول زمانی اهمیت نظارت و بهینه سازی زودهنگام را برای رسیدگی به موضوعات بالقوه که می تواند منجر به deindexing شود ، برجسته می کند. فراتر از سه ماه ، خطر ابتلا به دیوانگی کاهش می یابد اما همچنان ادامه دارد و حسابرسی های دوره ای را برای دید محتوای طولانی مدت ضروری می کند. “
تأثیر خدمات نمایه سازی
بخش بعدی این تحقیق اثربخشی ابزارهای طراحی شده برای افزایش نمایه سازی صفحه وب را برجسته می کند. آنها دریافتند که URL های ارسال شده به ابزارهای نمایه سازی دارای 29.37 ٪ موفقیت هستند. این بدان معناست که 70.63 ٪ از صفحات وب ارسال شده بدون عنوان باقی مانده است ، احتمالاً محدودیت های در استراتژی های ارسال دستی را برجسته می کند.
درصد بالایی از صفحات فهرست بندی نشده
کمتر از 1 ٪ از وب سایت های ردیابی شده کاملاً غیرقابل توصیف بودند. اکثر URL های Undrexed از وب سایت هایی بودند که توسط Google فهرست بندی شدند. 37.08 ٪ از کل صفحات ردیابی شده کاملاً فهرست بندی شدند.
این اعداد ممکن است وضعیت اینترنت را منعکس نکند زیرا داده ها از مجموعه ای از سایت هایی که مشترک هستند به یک ابزار نمایه سازی کشیده می شوند. این داده ها را اندازه گیری می کند و آن را با آنچه ممکن است وضعیت کل اینترنت باشد متفاوت می کند.
نمایه سازی Google از سال 2022 بهبود یافته است
اگرچه برخی از آمارهای ناخوشایند در داده ها وجود دارد که یک نقطه روشن این است که افزایش مداوم نرخ نمایه سازی از سال 2022 به 2025 وجود داشته است ، نشان می دهد که توانایی Google در پردازش و شامل صفحات ممکن است بهبود یافته باشد.
مطابق با indexcheckr:
“داده های سال 2022 تا 2025 افزایش مداوم در میزان فهرست بندی گوگل را نشان می دهد ، نشان می دهد که موتور جستجو ممکن است پس از گزارش های نمایه سازی قبلی گزارش شود.”
خلاصه یافته ها
deindexing کامل در سطح وب سایت برای این مجموعه داده نادر است. سرعت نمایه سازی Google متفاوت است و بیش از نیمی از صفحات وب در این مجموعه داده ها برای فهرست بندی ، احتمالاً مربوط به کیفیت سایت است.
چه نوع مسائل مربوط به کیفیت سایت بر نمایه سازی تأثیر می گذارد؟ به نظر من ، برخی از آنچه باعث ایجاد این امر می شود ، می تواند شامل صفحات محصول تجاری با محتوایی باشد که برای اهداف تغذیه ربات به صورت عمده است. من چند سایت تجارت الکترونیکی را بررسی کرده ام که چه کسی یا تلاش کرده است فهرست بندی شود یا رتبه بندی کند. نتایج جستجوی ارگانیک Google (SERP) برای تجارت الکترونیک به طور فزاینده ای دقیق است. این نوع SERP ها هنگام بررسی از طریق لنز SEO معنی ندارند و این به این دلیل است که استراتژی های مبتنی بر تغذیه اشخاص ربات ، کلمات کلیدی و نقشه های موضعی منجر به وب سایت های اول موتور جستجو می شوند و این امر بر عوامل رتبه بندی تأثیر نمی گذارد که واقعاً مربوط به نحوه واکنش کاربران ممکن است نسبت به محتوا باشد.
مطالعه فهرست بندی را در indexcheckr.com بخوانید:
مطالعه فهرست بندی گوگل: بینش از 16 میلیون صفحه
تصویر برجسته توسط ژنراتور AI Shutterstock/Shutterstock