مقاله پژوهشی Google نقص در جستجو را نشان می دهد

یک مقاله تحقیقاتی اخیر Google درباره پاسخ طولانی به س Questionال فرم نشان می دهد که پاسخ دادن به س thatالاتی که به پاسخ های طولانی تر و ظریف نیاز دارند دشوار است. در حالی که محققان توانستند وضعیت هنر این نوع پاسخ دادن را بهبود بخشند ، آنها همچنین اعتراف کردند که نتایج آنها نیاز به پیشرفت های قابل توجهی دارد.

من این مقاله پژوهشی را ماه گذشته هنگام انتشار خواندم و می خواستم آن را به اشتراک بگذارم زیرا در حل کاستی در جستجو تمرکز دارد که اصلاً زیاد در مورد آن بحث نشده است.

امیدوارم مثل من جذابیت داشته باشید!

چه موتورهای جستجو درست می شوند

این تحقیق بر روی پاسخ طولانی به س Questionال با دامنه باز با فرم طولانی، منطقه ای که پردازش زبان طبیعی همچنان شاهد پیشرفت هایی است.

آنچه موتورهای جستجو در آن مهارت دارند ، پاسخ س Questionال با دامنه باز Factoid یا پاسخ س Questionال به سادگی با دامنه باز نامیده می شود.

تبلیغات

ادامه مطلب را در زیر بخوانید

پاسخ به س Questionال دامنه باز وظیفه ای است که در آن الگوریتمی با پاسخ به س questionالی به زبان طبیعی پاسخ می دهد.

آسمان چه رنگی است؟ آسمان آبی است.

پاسخ به س Questionال طولانی مدت (LFQA)

در این مقاله تحقیق آمده است كه پاسخ طولانی به س Questionال (LFQA) مهم است اما یك چالش است و پیشرفت در دستیابی به این نوع پاسخ س questionال به اندازه پاسخ س Questionال از دامنه باز نیست.

طبق مقاله تحقیق:

“پاسخ به سوالات به صورت فرم دامنه باز (LFQA) یک چالش اساسی در پردازش زبان طبیعی (NLP) است که شامل بازیابی اسناد مربوط به یک س givenال داده شده و استفاده از آنها برای تولید پاسخ مفصل طول پاراگراف است.

در حالی که اخیراً پیشرفت چشمگیری در پاسخگویی به س facالهای دامنه باز فاکتوئید (QA) حاصل شده است ، جایی که یک عبارت یا موجود کوتاه برای پاسخ دادن به یک سوال کافی است ، اما در زمینه پاسخگویی به پرسش طولانی مدت کار کمتری انجام شده است.

با این وجود LFQA یک کار مهم است ، خصوصاً به این دلیل که یک بستر آزمایش برای اندازه گیری واقعیت مدل های متن مولد فراهم می کند. اما ، آیا معیارها و معیارهای ارزیابی واقعی برای پیشرفت در LFQA مناسب هستند؟ “

تبلیغات

ادامه مطلب را در زیر بخوانید

پاسخ سوال موتور جستجو

پاسخ س Questionال توسط موتورهای جستجوگر معمولاً متشکل از جستجوگر است که س questionال می کند و موتور جستجو متن نسبتاً کوتاهی از اطلاعات را برمی گرداند.

سالاتی مانند “شماره تلفن فروشگاه XYZ چیست؟”نمونه ای از یک سوال معمولی است که موتورهای جستجو در پاسخ دادن به آن مهارت دارند ، به ویژه به این دلیل که پاسخ عینی است و ذهنی نیست.

پاسخ به س Longال طولانی مدت دشوارتر است زیرا س questionsالات پاسخ ها را به صورت پاراگراف می خواهند ، نه متن کوتاه.

فیس بوک همچنین در حال پاسخگویی به س longال های طولانی است و راه حل های جالبی مانند استفاده از زیر ریز ویرایش س questionال و پاسخ به نام Explain Like I’m 5 (مجموعه داده ای به نام ELI5) ارائه داده است. فیس بوک همچنین اعتراف می کند که کارهای بیشتری برای انجام وجود دارد. (معرفی پاسخ طولانی مدت به سال)

نمونه سوالات فرم بلند

هنگامی که این نمونه سوالات طولانی را مطالعه کردید ، مشخص خواهد شد که چگونه ما توسط موتورهای جستجو آموزش داده ایم تا مجموعه محدودی از س quالات را بپرسیم. حتی ممکن است تکان دهنده به نظر برسد که چقدر س almostالات ما تقریباً کودکانه در مقایسه با س longالات فرم طولانی است.

مقاله تحقیقاتی Google این نمونه سوالات طولانی را ارائه می دهد:

  • در آن ساختمان های برج بلند که متعلق به بانک های بزرگ هستند چه می گذرد؟
  • دقیقاً آتش دقیقاً چیست؟ چگونه نور و گرما از چیزی حاصل می شود که واقعاً نمی توانیم آن را لمس کنیم؟
  • چرا انگلیس و دیگر کشورهای امپراتوری انگلیس هنوز در برابر پادشاهان سر تعظیم فرود می آورند؟ ملکه چه هدف واقعی را دنبال می کند؟

فیس بوک این نمونه سوالات طولانی را ارائه می دهد:

  • چرا بعضی از رستوران ها که در اصل همان غذا را سرو می کنند بهتر از بقیه هستند؟
  • تفاوت های موجود در آب مانند دریاچه ها ، رودخانه ها و دریاها چیست؟
  • چرا هنگام سفر به شرق احساس عقب ماندگی جت بیشتری می کنیم؟

آیا جستجوگران آموزش می بینند که س Shortال های کوتاهی را برای فکتوئیدها بپرسند؟

Google (و Bing) در پاسخگویی به این انواع طولانی س ofالات مشکل دارند. این ممکن است بر توانایی آنها در محتوای سطحی تأثیر بگذارد که پاسخ های پیچیده ای برای س .الات پیچیده ارائه می دهد.

شاید مردم این س questionsالات را نپرسند زیرا آنها به این دلیل آموزش دیده اند که به این دلیل پاسخ های ضعیف نشان نمی دهد. اما اگر موتورهای جستجو بتوانند به این نوع سوالات پاسخ دهند ، مردم شروع به پرسیدن آنها می کنند.

تبلیغات

ادامه مطلب را در زیر بخوانید

این یک دنیای گسترده ای از س questionsالات و جوابهاست که در تجربه جستجوی ما گم شده است.

اگر من عبارت “چرا بعضی از رستوران ها که در اصل همان غذا را سرو می کنند بهتر از بقیه هستند؟” به “چرا بعضی از رستوران ها از بقیه بهتر هستند؟”گوگل و بینگ هنوز نمی توانند پاسخ کافی ارائه دهند.

بهترین نتیجه جستجوی گوگل برای این سوال از وبلاگ (HTTP ناامن) یک هندی کانادایی است.

Google به این بخش از رستوران هندی در SERP استناد می کند:

وی افزود: “مردم هزینه های كلی تجربه و نه فقط غذا را می پردازند و به همین دلیل است كه بعضی از رستوران ها هزینه های بیشتری نسبت به بقیه دریافت می كنند. مشتریان رستوران انتظار دارند قیمت ها نوع غذا ، سطح خدمات و فضای کلی رستوران را منعکس کنند. “

اگر فرد هنگام پرسیدن این سوال جوجه سرخ شده Popeye در مقابل KFC را در ذهن داشته باشد ، چه می شود؟

مقدار مشخصی از ذهنیت وجود دارد که می تواند پاسخگوی این نوع س questionsالات باشد که پاسخی منسجم و طولانی می طلبد.

تبلیغات

ادامه مطلب را در زیر بخوانید

نمی توانم فکر کنم که جایی بهتر جواب بهتری وجود دارد. اما گوگل و بینگ قادر به نمایش این نوع مطالب نیستند.

Google از سیگنال ها برای شناسایی محتوای با کیفیت بالا استفاده می کند

در توضیحات How Search Works که گوگل در سپتامبر 2020 منتشر کرد ، Google اذعان می کند که از محتوای خود برای شناسایی قابل اعتماد یا قابل اعتماد بودن استفاده نمی کند.

Google توضیح می دهد که از سیگنال های موجود در یک پست وبلاگ با عنوان “چگونه Google اطلاعات قابل اطمینان را در جستجو ارائه می دهد” استفاده می کند.

“… … وقتی صحبت از اطلاعات با کیفیت و قابل اعتماد می شود … ما اغلب نمی توانیم از روی کلمات یا تصاویر به تنهایی بگوییم که چیزی اغراق آمیز ، نادرست ، بی کیفیت یا غیر مفید است.

در عوض ، موتورهای جستجو کیفیت محتوا را از طریق آنچه معمولاً “سیگنال” نامیده می شود ، درک می کنند. می توانید این موارد را به عنوان سرنخی در مورد ویژگی های صفحه ای تصور کنید که با آنچه انسان ممکن است از آن به عنوان کیفیت بالا یا قابل اعتماد تعبیر کند ، همسو است.

به عنوان مثال ، تعداد صفحات با کیفیت که به یک صفحه خاص لینک می شوند نشانه این است که یک صفحه می تواند منبع اطلاعاتی مطمئن درباره یک موضوع باشد. “

تبلیغات

ادامه مطلب را در زیر بخوانید

متأسفانه ، آن بخش از الگوریتم Google قادر به پاسخ صحیح به این نوع س longالات طولانی نیست.

و این واقعیت جالب و مهمی است که باید درک شود زیرا به شما کمک می کند تا بدانید امروزه محدودیت جستجو در فناوری چیست.

در مورد رتبه بندی پاساژ چطور؟

Passage Ranking مربوط به رتبه بندی صفحات وب طولانی است که حاوی پاسخ کوتاه برای جستجوی کوتاه معمولی است که نیاز به پاسخ عینی دارد.

مارتین اسپلیت از مثال یافتن پاسخ مناسب در مورد گوجه فرنگی در یک صفحه وب که بیشتر در مورد باغبانی به طور کلی است استفاده کرد.

رتبه بندی پاساژ نمی تواند س hardالات سختی را که Google در حال حاضر نمی تواند به آنها پاسخ دهد ، حل کند.

هر دو گوگل و بینگ به طور کلی پاسخگوی درخواست های نوع LFQA نیستند زیرا این منطقه ای است که موتورهای جستجو هنوز نیاز به بهبود آن دارند.

موانع پیشرفت

مقاله پژوهشی خود این نقص را در عنوان تصدیق می کند:

موانع پیشرفت در پاسخگویی طولانی به سوالات

در پایان مقاله تحقیق با بیان اینكه رویكرد آن برای حل این وظیفه “دستیابی به عملكرد هنری را به دست می آورد” اما هنوز برای حل وفصل مسائلی وجود دارد كه باید تحقیقات بیشتری انجام شود.

تبلیغات

ادامه مطلب را در زیر بخوانید

این مقاله به این نتیجه می رسد:

“ما یک سیستم تولید” تقویت شده بازیابی “ارائه می دهیم که به عملکرد هنر در مجموعه داده پاسخ دهی به فرم طولانی ELI5 می رسد. با این حال ، یک تجزیه و تحلیل عمیق نه تنها با مدل ما ، بلکه همچنین با مجموعه داده ها و معیارهای ارزیابی ELI5 چندین مسئله را نشان می دهد. ما امیدواریم که جامعه در جهت حل این مسائل تلاش کند تا بتوانیم از تپه های مناسب بالا برویم و پیشرفت معنی داری داشته باشیم. “

س Quesالات و گمانه زنی ها

ارائه پاسخ قطعی امکان پذیر نیست اما باید این سوال را داشته باشید که آیا صفحات وب موجود در آن ترافیک را از دست می دهد زیرا گوگل و بینگ هر دو قادر به نمایش محتوای فرم طولانی خود در پاسخ به س longالات فرم طولانی نیستند.

همچنین ، برخی از ناشران به دنبال معتبر بودن مقالات خود را به اشتباه بازنویسی می کنند. آیا ممکن است آن ناشران بیش از میزان جستجوی پرسش هایی که به پاسخ کوتاه تر نیاز دارند ، بیش از حد خود را بنویسند ، زیرا موتورهای جستجو نمی توانند پاسخ های ظریف موجود در اسناد طولانی تر را ارائه دهند؟

تبلیغات

ادامه مطلب را در زیر بخوانید

هیچ راهی برای دانستن این پاسخ ها به طور قطعی وجود ندارد.

اما نکته ای که این مقاله پژوهشی روشن می کند این است که پاسخ طولانی مدت به س questionال در موتورهای جستجو نوعی نقص است.

استناد

Google AI Blog Post
پیشرفت و چالش ها در پاسخ به پرسش های دامنه باز با فرم طولانی

نسخه PDF مقاله پژوهشی
موانع پیشرفت در پاسخگویی طولانی به سوالات

صفحه وب فیس بوک درباره LFQA
معرفی پاسخ طولانی به س -ال

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>