نحوه تجزیه و تحلیل محتوای صفحه وب توسط گوگل و وزن دهی به آن

مارتین اسپلیت در وبینار Duda مفهومی را به نام حاشیه نویسی Centerpiece توضیح داد که در مورد نحوه تجزیه و تحلیل محتوا توسط Google در صفحه وب بحث می کند.

من س questionال را تکرار نمی کنم زیرا تا حدودی خارج از موضوع و طولانی است.

اما آنچه مارتین مورد بحث قرار می دهد این است که چگونه گوگل صفحه بویلر یک صفحه وب را جدا می کند و سپس از ساختار محتوای متن خلاصه می کند که صفحه وب در مورد چیست.

او به آنچه حاشیه نویسی مرکز نامیده می شود اشاره می کند.

مارتین اسپلیت توضیح داد:

“این فقط ما در حال تجزیه و تحلیل محتوا هستیم و نمی دانم که ما در این مورد به طور عمومی چه گفته ایم ، اما فکر می کنم آن را در یکی از قسمت های پادکست مطرح کردم.

بنابراین من احتمالاً می توانم بگویم که ما به عنوان مثال چیزی به نام Annotation Centerpiece داریم ، و چند حاشیه نویسی دیگر داریم که در آنجا به محتوای معنایی و همچنین درخت طرح بندی نگاه می کنیم.

اما اساساً ما می توانیم آن را از ساختار محتوا در HTML قبلاً بخوانیم و بنابراین “اوه! این به نظر می رسد از تمام پردازش زبان طبیعی که ما در مورد کل این محتوای متنی در اینجا انجام دادیم ، به نظر برسد که این در درجه اول در مورد موضوع A ، غذای سگ است. “

تبلیغات

ادامه مطلب را در زیر ادامه دهید

اسکرین شات مارتین اسپلیت در مورد حاشیه نویسی مرکز بحث

مارتین اسپلیت گوگل

مارتین بعدی در مورد نحوه تجزیه و تحلیل صفحه از صفحه وب به اجزای جداگانه صحبت می کند ، که برخی از آنها به مرکز مربوط نمی شود.

او توضیح می دهد که قسمت های صفحه متفاوت وزن دارند. وزن دهی اشاره ای به اهمیت عنصر صفحه دارد. بنابراین اگر یک بخش نمره وزن کمی دریافت می کند ، مهم نیست که با نمره بالاتر وزن شود.

تبلیغات

ادامه مطلب را در زیر ادامه دهید

مارتین ادامه داد:

“و سپس این چیز دیگری در اینجا وجود دارد ، که به نظر می رسد مانند پیوندهایی به محصولات مرتبط باشد ، اما در واقع بخشی از مرکز آن نیست. اینجا واقعاً محتوای اصلی نیست. به نظر می رسد این موارد اضافی باشد.

و سپس مانند یک دسته دیگ بخار یا “هی ، ما متوجه شدیم که منو در همه این صفحات و لیست ها تقریباً یکسان است. این تقریباً شبیه آن منویی است که ما در تمام صفحات دیگر این دامنه داریم ، “برای مثال ، یا قبلاً آن را دیده بودیم. ما حتی در واقع به دامنه نمی پردازیم یا نمی گوییم “اوه ، این شبیه یک منو است.”

ما متوجه می شویم که شبیه دیگ بخار است و سپس ، وزن آن نیز متفاوت است. “

محتوای خارج از موضوع با توجه کمتر

مارتین در ادامه اشاره می کند که چگونه بعد از اینکه گوگل صفحه وب را مشخص کرد ، چگونه می گوید که اگر قسمتی خارج از موضوع باشد ، آن بخش خارج از موضوع چندان مورد توجه قرار نمی گیرد ، احتمالاً برای اهداف رتبه بندی.

مارتین توضیح می دهد:

“بنابراین اگر به طور اتفاقی محتوایی در صفحه ای دارید که به موضوع اصلی بقیه محتوا مربوط نمی شود ، ممکن است آنقدر که فکر می کنید به آن توجه نکنیم.

ما هنوز از این اطلاعات برای کشف پیوند و پی بردن به ساختار سایت شما و همه اینها استفاده می کنیم.

اما اگر یک صفحه دارای 10،000 کلمه در مورد غذای سگ و سپس 3000 یا 2000 یا 1000 کلمه در دوچرخه باشد ، احتمالاً این محتوای خوبی برای دوچرخه نیست. “

این واقعاً جالب است زیرا به نظر می رسد نشان می دهد که وقتی گوگل تعیین می کند که یک صفحه درباره چیست ، محتوای خارج از موضوع ممکن است فرصتی برای رتبه بندی نداشته باشد یا همانطور که مارتین می گوید ، “a” داده نمی شود.بسیار مورد توجه است. »

جیسون بارنارد پرسید:

“بنابراین برای من اینطور به نظر می رسد که شما HTML5 معنایی را حدس زده اید. آیا HTML5e معنایی به شما کمک می کند یا فقط اهمیتی نمی دهید؟ هیچ نکته ای ندارد؟”

آنچه جیسون به آن اشاره می کرد نشانه گذاری HTML5 بود که بخش های مختلف یک صفحه وب را مشخص می کند ، مانند سرصفحه ، ناوبری ، پاورقی و غیره.

تبلیغات

ادامه مطلب را در زیر ادامه دهید

در ابتدای بحث مارتین ، او به تجزیه و تحلیل ساختار محتوا و متن واقعی اشاره می کرد. بنابراین در حال حاضر موضوع کمی در اینجا به ساختار معنایی HTML5 می رود.

مارتین پاسخ داد:

“این به ما کمک می کند ، اما این تنها چیزی نیست که ما به دنبال آن هستیم. آره.”

حاشیه نویسی مرکز

حاشیه نویسی یادداشتی است که چیزی را توضیح می دهد. قطعه مرکزی چیزی است که به عنوان مرکز توجه در نظر گرفته شده است.

به نظر می رسد حاشیه نویسی مرکزی خلاصه ای از موضوع محتوای اصلی است.

مارتین توضیح می دهد که چگونه گوگل صفحه را به بخش های مختلف تقسیم می کند و قسمت های خارج از حاشیه نویسی مرکز را متفاوت ارزیابی می کند.

او همچنین اشاره می کند که چگونه قسمتهایی از صفحه که متفاوت از موضوع اصلی هستند چندان مورد توجه قرار نمی گیرند ، به نظر می رسد این بدان معناست که ممکن است محتوایی نباشد که بتواند رتبه بندی شود.

استناد

وودین دودا در مورد ارائه اساسی

مارتین اسپلیت را توضیح دهید که چگونه گوگل صفحات وب را در دقیقه 28:42 تجزیه و تحلیل می کند:

تبلیغات

ادامه مطلب را در زیر ادامه دهید

https://www.youtube.com/watch؟v=BG56C6XI0YM