در این مجموعه در مورد یادگیری سئو با پتنت های گوگل، برخی از چیزهایی را که با خواندن پتنت گوگل با عنوان «سیستم پردازش پرس و جو چند مرحله ای و روش استفاده با مخزن فضای نشانه» توسط جفری ای. دین، پل جی. هار، یاد گرفتم، پوشش خواهم داد. اولجان سرسین اوغلو، آمیتاب ک. سینگال.
از نام های موجود در این لیست نویسنده، می توان گفت که این یک حق ثبت اختراع بسیار مهم برای درک پردازش پرس و جو در موتورهای جستجو است.

حق ثبت اختراع در مورد چیست؟
حق ثبت اختراع پردازش پرس و جو چند مرحله ای گوگل در مورد چگونگی آماده سازی پرس و جوها توسط گوگل برای مطابقت با شرایط اسناد تهیه شده به عنوان یک نمایه معکوس است.
حق اختراع توضیح می دهد که چگونه:
- شاخص معکوس توسط Document Processing System تهیه شده است
- پرس و جوها تجزیه، تبدیل و به اصطلاحات پرس و جو و عبارات پرس و جو گسترش می یابند
- 4 مرحله پردازش پرس و جو اتفاق می افتد که سیگنال های ارتباطی بین اصطلاحات پرس و جو و شرایط سند ایجاد می کند
نکات برجسته از پردازش پرس و جو چند مرحله ای
جالب ترین نکات برجسته اختراع سیستم پردازش پرس و جو چند مرحله ای عبارتند از:
- شاخص معکوس فضای نشانه به نمایه های کوچکتر از اصطلاحات نزدیک تقسیم می شود
- زیرشاخص ها با اولویت بندی عباراتی که در زبان مشابه، دامنه مشابه، پوشه مشابه و غیره یافت می شوند، گروه بندی می شوند.
- پرس و جوها تجزیه می شوند، نشانه گذاری می شوند، ریشه می گیرند، از کلمات توقف جدا می شوند و با مترادف ها گسترش می یابند.
- تعداد زیادی کار برای پارتیشن بندی، رمزگذاری/رمزگشایی و فشرده سازی هر واژگان برای ذخیره بایت ها انجام شده است.
- سیستم پردازش پرس و جو قطعه هایی را از اسناد رتبه بندی شده تولید می کند و این قطعه های تولید شده را می توان برای امتیازدهی اسناد در یک پاس دوم استفاده کرد.
امتیاز مربوط به سند
در حق ثبت اختراع امتیازهای مربوط به آن ذکر شده است که توسط یک یا چند الگوریتم امتیازدهی محاسبه می شود. فاکتورهای رتبهبندی ربط مؤثر بر امتیاز مربوط به پرس و جو و سند که در پتنت ذکر شد عبارتند از:
- وجود اصطلاح پرس و جو،
- فرکانس مدت،
- تطبیق منطق بولی و عملگرها (AND/OR)،
- وزن شرایط پرس و جو،
- محبوبیت سند
- اهمیت سند
- پیوستگی اسناد
- نزدیکی عبارات پرس و جو به یکدیگر
- زمینه پرس و جو
- صفات پرس و جو
- ویژگی فونت (اندازه قلم، پررنگ، زیرخط دار، و غیره)،
- ویژگی موقعیت (در عنوان یا سرفصل ها در مقابل بدن، پاراگراف اول در مقابل هر پاراگراف در محتوا)
- ابرداده
- موقعیت در درخت پرس و جو (شرایط در رشته پرس و جو ممکن است وزن بیشتری نسبت به عبارات نمایش گسترده پرس و جو داشته باشند)
- بازخورد مرتبط از اسناد رتبه بندی شده (گذر دوم)
- عبارات موجود در اسناد رتبه بندی شده برای گسترش پرس و جو استفاده می شود و این عبارات بسط یافته امتیاز مربوط را تغییر می دهند
- عباراتی که در تکههای سند رتبهبندی شده در اسناد تولید شده یافت میشوند برای گسترش پرس و جو و تغییر وزن عبارت پرس و جو استفاده میشوند. این وزنهای جدید و اصطلاحات بسط یافته، امتیاز مربوط را تغییر میدهند
چگونه پردازش پرس و جو چند مرحله ای در گوگل کار می کند
پردازش پرس و جو چند مرحله ای در 4 مرحله کار می کند که در مرحله اول پرس و جوها را تجزیه و تبدیل به اصطلاحات پرس و جو و عبارات پرس و جو آنها می کند.
مراحل پردازش پرس و جو دوم و سوم با استفاده از شاخص معکوس دریافت شده از سیستم پردازش اسناد، امتیازهای مربوط به اصطلاحات سند را در رابطه با پرس و جو ایجاد می کند.
مرحله آخر یک بازخورد مرتبط ایجاد می کند تا پرس و جو را گسترش دهد و از عبارت جستجوی توسعه یافته برای پردازش مجدد 3 مرحله اول یک بار دیگر استفاده کند.

مراحل تشریح شده در پتنت پردازش پرس و جو چند مرحله ای
پتنت پردازش پرس و جو چند مرحله ای عناصر زیر مربوط به پردازش پرس و جو را توصیف می کند:
- چگونه سیستم پردازش اسناد، شاخص معکوس را ایجاد و رمزگذاری می کند
- چگونه سیستم پردازش پرس و جو پرس و جو را تجزیه می کند و امتیازهای مربوط به اسناد را در نمایه معکوس ایجاد می کند.
1. سیستم پردازش اسناد
را سیستم پردازش اسناد سیستمی است که نمایه معکوس را از اسناد، صفحات یا سایت های بازیابی شده از مجموعه سند آماده می کند. بخشی از آن نیست سیستم پردازش پرس و جو اما در اینجا توضیح داده شده است زیرا نحوه ساخت نمایه معکوس به سیستم پردازش پرس و جو بستگی دارد.
عمدتاً از موارد زیر تشکیل شده است:

سیستم پردازش اسناد چگونگی استخراج واژگان (یا واژگان) اصطلاحات را از اسناد و ذخیره در یک نمایه معکوس که در آن هر عبارت با یک لیست ارسال. این کار توسط مولد(های) واژگان انجام می شود.
مولد (های) واژگان
واژگان مولد نرم افزاری است که نگاشت واژگان را ایجاد می کند که مجموعه ای از اسناد تجزیه شده را رمزگذاری می کند. به طور خلاصه، یک واژگان میسازد، سازماندهی میکند و برای کارایی آن را به واژگان کوچکتر تقسیم میکند و واژگان را برای رمزگذاری میفرستد قبل از اینکه در آن ذخیره شود. مخزن فضای نشانه.

برای درک آن، باید توضیح دهیم که نمایه معکوس (که در بازیابی اطلاعات استفاده می شود) دارای دو بخش است: واژگان اصطلاحات (واژه نامه) و فهرست معکوس (فهرست ارسال) مرتبط با هر عبارت.
هر اصطلاح در واژگان به یک شناسه نگاشت می شود. این نگاشت چیزی است که ما به آن واژگان می گوییم. واژگان عموماً برای یک نمایه بیش از حد بزرگ است، به طوری که به گونه ای سازماندهی شده است که اصطلاحات مشابه به یکدیگر نزدیکتر باشند و به گونه ای تقسیم می شود که در زمان بازیابی کوچکتر و کارآمدتر باشد.
واژگان اصلی (جهانی) توسط سازنده واژگان جهانی ساخته شده است و واژگان فرعی ایجاد و نقشه برداری می شود. واژگان جهانی توسط هر دو مینی واژگان ساز یا region lexicon lexicon builder.
سیستم رمزگذاری
سپس سیستم رمزگذاری سیستمی است که در سیستم بازیابی اطلاعات گوگل برای رمزگذاری داده های با طول متغیر به منظور صرفه جویی در فضا و افزایش توان استفاده می شود. به زبان ساده، این سیستمی است که برای رمزگذاری و فشرده سازی شاخص معکوس به شیوه ای کارآمد استفاده می شود.
2. سیستم پردازش پرس و جو
را سیستم های پردازش پرس و جو یک پرس و جو را دریافت می کند، آن را تجزیه می کند و سیگنال مربوط به اسناد موجود در نمایه معکوس را تولید می کند تا بهترین نتیجه تطبیق را برای پرس و جو برگرداند.
این کار را در 2 پاس و 4 مرحله انجام می دهد. اولین پاس (مرحله 1-3) پرس و جو را تجزیه می کند، سیگنال های مربوطه را تولید می کند و مجموعه اولیه ای از نتایج را برمی گرداند. پاس دوم (مرحله 4 و دوباره 1-3) یک عبارت مبتنی بر بسط پرس و جو را ایجاد می کند که در اسناد رتبه بندی شده یافت می شود و اسناد را با استفاده از جستجوی توسعه یافته رتبه بندی می کند.

- مرحله اول: رشته پرس و جو در یک عبارت پرس و جو که برای جستجو در مقابل نمایه معکوس استفاده می شود، تجزیه می شود، تبدیل می شود و گسترش می یابد تا لیست اولیه شناسه های سند را برگرداند.
- مرحله دوم: امتیازهای مرتبط بر اساس نزدیکی اصطلاحات پرس و جو در اسناد ایجاد می شود. (شغل فروش – شغل فروش بهتر از شغل در فروش است)
- مرحله سوم: پالایش نمرات مرتبط با استفاده از ویژگیهای اصطلاح (مثلاً وزن عبارات در H1 بیشتر از بدن است)
- مرحله چهارم: مجموعه چهارم نمرات مربوط را با استفاده از ماژول بازخورد مربوط ایجاد می کند، واژگان را مرتب می کند و قطعه هایی را برای اسناد فهرست شده در مجموعه نتایج ایجاد می کند.

پتنت در مورد چه دسته بندی هایی است؟
- سئوی معنایی
- پردازش پرس و جو
- پردازش سند
تعاریف
مدت ثبت اختراع | تعریف |
---|---|
سیستم پردازش پرس و جو | هر سیستم پردازشی که برای بازیابی اسناد بر اساس عبارات موجود در یک پرس و جو استفاده می شود |
پردازش پرس و جو | فرآیندی که در آن موتورهای جستجو سعی میکنند بهترین پاسخها را در کمترین زمان برای یک درخواست کاربر معین ایجاد کنند. |
اصطلاح پرس و جو | عبارات متمایز یافت شده در یک عبارت جستجوی کاربر. اصطلاحات پرس و جو می توانند شامل کلمات یا عبارات باشند. |
تجزیه کننده پرس و جو | ماژول برای توکن کردن و تجزیه رشته پرس و جو به عبارات پرس و جو استفاده می شود. |
گسترش دهنده پرس و جو | نرم افزاری که برای گسترش پرس و جوهای جستجو در درخت پرس و جو یا سایر نمایش های پرس و جو استفاده می شود |
پردازشگر پرس و جو | سرور پردازش پرس و جو شامل تمام سیستم های محاسباتی مورد استفاده در پردازش پرس و جو است |
رشته پرس و جو | رشته متنی تجزیه نشده مورد استفاده در یک عبارت جستجو |
درخت پرس و جو | نمایش پرس و جو از پرس و جو متنی پس از اسکن، تجزیه، اعتبارسنجی و گسترش آن |
جلسه پرس و جو | رکورد متشکل از یک یا چند پرس و جو از یک کاربر واحد، شامل تمام پرس و جوها در یک دوره زمانی کوتاه، یا دنباله ای از پرس و جوها که دارای عبارات پرس و جو در یک دوره زمانی طولانی تر هستند. رکورد شامل عبارت(های) پرس و جو، مهر زمانی، آدرس IP و زبان است |
عبارت پرس و جو | معیارهای جستجو را برای بازیابی اسناد با استفاده از زمینه تعریف می کند. این شامل اصطلاحات پرس و جو، عملگرها و کاراکترهای ویژه است که کاربران می توانند از آنها برای اضافه کردن زمینه به درخواست خود استفاده کنند. |
نقشه DocID | مجموعه ای از DocID برای اسناد مربوط به موقعیت های نشانه |
واژگان جهانی | ذخیره داده برای نگاشت همه نشانه های منحصر به فرد و شناسه توکن جهانی آنها در مجموعه ای از سند |
شاخص معکوس | ساختار داده مورد استفاده توسط سیستم های بازیابی اطلاعات که از واژگانی از اصطلاحات، همراه با فهرستی از وقوع واژه ها و مکان ها در اسناد تشکیل شده است. |
سیستم بازیابی اطلاعات | سیستمی که پرس و جوها را با فهرستی از اسناد تولید شده از مجموعه ای از اسناد مطابقت می دهد |
ماژول بازخورد مربوط | ماژولی که یک یا چند عبارت جدید بسط پرس و جو را بر اساس اسناد موجود در مجموعه نتایج تولید شده توسط آخرین مرحله پرس و جو ایجاد می کند. |
درخت امتیاز دهی | وزن های مرتبط با اصطلاحات در درخت پرس و جو |
تکه ها | بخشهای کوچکی از متن از یک سند، معمولاً شامل متنی است که در اطراف کلمات کلیدی جستجو شده ظاهر میشود |
صفات اصطلاحی | ویژگیهای مرتبط با اصطلاحاتی مانند ویژگیهای فونت، ویژگیهای موقعیت مانند عنوان و عنوان و ابرداده. |
شاخص معکوس فضای نشانه | شاخص معکوس که شناسه های نشانه را در مجموعه ای از اسناد به موقعیت آنها در اسناد ترسیم می کند |
مخزن Tokenspace | مجموعه ای توکن شده از اسناد |
زیرساخت جستجوی گوگل درگیر است
پتنت «سیستم و روش پردازش پرس و جو چند مرحله ای برای استفاده با مخزن فضای نشانه» این عناصر را از زیرساخت جستجوی Google ذکر می کند:
- سیستم بازیابی اطلاعات
- سیستم پردازش اسناد
- مخزن اسناد
- Lexicon Generator
- جهانی واژگان ساز
- Mini-Lexicon Builder
- سیستم رمزگذاری
- سیستم رمزگشایی
- سیستم پردازش پرس و جو
- شاخص معکوس فضای توکن
- پردازشگر(های) پرس و جو
- تجزیه کننده پرس و جو
- درخت پرس و جو
- گسترش دهنده پرس و جو
- پردازشگر پرس و جو مرحله اول / دوم / سوم / چهارم
- پایگاه های داده
- مخزن فضای توکن
- واژگان جهانی
- مینی واژگان
- رکوردهای ویژگی
- جداول ترجمه واژگان
- نقشه محدوده اعتبار
- نقشه DocID
- سیستم پردازش اسناد
جزئیات ثبت اختراع
نام | سیستم و روش پردازش پرس و جو چند مرحله ای برای استفاده با مخزن فضای نشانه |
مأمور | Google LLC |
ثبت شد | 26/03/2013 |
وضعیت | فعال |
انقضاء | 09-08-2025 |
کاربرد | 13/851,036 |
مخترع | جفری آ. دین، پل جی. هاهر، اولکان سرسین اوغلو، آمیتاب کی. سینگال |
ثبت اختراع | US9146967B2 |

استراتژیست سئو در Tripadvisor، Seek سابق (ملبورن، استرالیا). متخصص در سئو فنی. در تلاش برای سئوی برنامهریزی شده برای سازمانهای بزرگ از طریق استفاده از پایتون، R و یادگیری ماشین.