فناوری جدید گوگل به ایجاد الگوریتم های رتبه بندی قدرتمند کمک می کند

گوگل از انتشار فناوری پیشرفته ای خبر داده است که تحقیق و توسعه الگوریتم های جدیدی را که می تواند به سرعت به کار گرفته شود ، آسان تر و سریعتر می کند.

این به گوگل این توانایی را می دهد که سریع الگوریتم های ضد هرزنامه جدید ایجاد کند ، پردازش زبان طبیعی را بهبود بخشد و الگوریتم های مرتبط را رتبه بندی کرده و بتواند سریعتر از همیشه آنها را وارد مرحله تولید کند.

بهبود رتبه بندی TF همزمان با تاریخ آخرین به روزرسانی های Google

این مورد جالب است زیرا گوگل چندین الگوریتم مبارزه با هرزنامه و دو الگوریتم اصلی را در ژوئن و ژوئیه 2021 ارائه کرده است. این پیشرفتها مستقیماً پس از انتشار این فناوری جدید در مه 2021 منتشر شد.

زمان بندی می تواند تصادفی باشد اما با توجه به همه چیزهایی که نسخه جدید TF-Ranking مبتنی بر Keras انجام می دهد ، شاید مهم باشد که خود را با آن آشنا کنید تا بفهمید چرا گوگل سرعت انتشار بروزرسانی های جدید الگوریتم مربوط به رتبه بندی را افزایش داده است.

نسخه جدید رتبه بندی TF مبتنی بر Keras

گوگل نسخه جدیدی از TF-Ranking را معرفی کرد که می تواند برای بهبود یادگیری عصبی برای رتبه بندی الگوریتم ها و همچنین الگوریتم های پردازش زبان طبیعی مانند BERT استفاده شود.

تبلیغات

ادامه مطلب را در زیر بخوانید

این یک راه قدرتمند برای ایجاد الگوریتم های جدید و تقویت الگوریتم های موجود است.

رتبه بندی TensorFlow

به گفته گوگل ، TensorFlow یک پلت فرم یادگیری ماشین است.

در یک ویدیوی YouTube از سال 2019 ، اولین نسخه رتبه بندی TensorFlow به شرح زیر توصیف شد:

“اولین کتابخانه منبع باز یادگیری عمیق برای یادگیری رتبه بندی (LTR) در مقیاس.”

نوآوری بستر اصلی TF-Ranking این بود که نحوه رتبه بندی اسناد مربوطه را تغییر داد.

اسناد قبلی قبلاً با یکدیگر مقایسه شده اند که به آن رتبه بندی زوجی می گویند. احتمال مرتبط بودن یک سند با یک پرس و جو با احتمال یک مورد دیگر مقایسه شد.

این مقایسه بین جفت اسناد بود و نه مقایسه کل لیست.

نوآوری رتبه بندی TF در این است که امکان مقایسه تمام لیست اسناد را در یک زمان فراهم می کند ، که به آن امتیاز دهی چند آیتمی می گویند. این رویکرد به تصمیمات رتبه بندی بهتر اجازه می دهد.

تبلیغات

ادامه مطلب را در زیر بخوانید

بهبود رتبه بندی TF امکان توسعه سریع الگوریتم های جدید قدرتمند را فراهم می آورد

مقاله گوگل که در وبلاگ هوش مصنوعی آنها منتشر شده است می گوید TF-Ranking نسخه مهمی است که راه اندازی یادگیری رتبه بندی (LTR) مدل ها و سریعتر تولید مستقیم آنها را آسان تر از همیشه می کند.

این بدان معناست که گوگل می تواند الگوریتم های جدیدی ایجاد کرده و آنها را سریعتر از همیشه به جستجو اضافه کند.

در مقاله آمده است:

“مدل رتبه بندی بومی Keras ما دارای یک جریان گردش کار جدید است ، از جمله ModelBuilder انعطاف پذیر ، DatasetBuilder برای تنظیم داده های آموزشی و Pipeline برای آموزش مدل با مجموعه داده ارائه شده.

این اجزا ساختن یک مدل LTR سفارشی را آسان تر از همیشه کرده و اکتشاف سریع ساختارهای مدل جدید را برای تولید و تحقیق تسهیل می کند. “

TF-Ranking BERT

هنگامی که یک مقاله یا مقاله تحقیقی بیان می کند که نتایج به مراتب بهتر بودند ، هشدارهایی را ارائه می دهد و می گوید که تحقیقات بیشتری مورد نیاز است ، این نشان می دهد که الگوریتم مورد بحث ممکن است مورد استفاده قرار نگیرد زیرا آماده یا بن بست نیست.

این مورد نیست TFR-BERT، ترکیبی از رتبه بندی TF و BERT.

BERT یک روش یادگیری ماشین برای پردازش زبان طبیعی است. این راهی برای درک جستجوهای جستجو و محتوای صفحه وب است.

BERT یکی از مهمترین به روز رسانی های گوگل و بینگ در چند سال گذشته است.

مقاله بیان می کند که ترکیب TF-R با BERT برای بهینه سازی ترتیب ورودی های لیست ایجاد شده “پیشرفت های قابل توجه. »

این بیانیه که نتایج قابل توجه بود مهم است زیرا احتمال استفاده از چنین چیزی را در حال حاضر افزایش می دهد.

مفهوم آن این است که رتبه بندی TF مبتنی بر Keras BERT را قوی تر کرده است.

به گفته گوگل:

“تجربه ما نشان می دهد که این معماری TFR-BERT پیشرفت های قابل توجهی در عملکرد مدل از پیش آماده شده زبان ارائه می دهد و منجر به عملکرد پیشرفته برای چندین وظیفه رتبه بندی محبوب می شود …”

رتبه بندی TF و GAM ها

نوع دیگری از الگوریتم وجود دارد ، به نام مدلهای افزودنی عمومی (GAMs) ، که TF-Ranking نیز بهبود یافته و نسخه ای قدرتمندتر از نسخه اصلی می سازد.

یکی از مواردی که این الگوریتم را مهم می کند شفافیت آن است به این دلیل که همه چیزهایی که برای ایجاد رتبه بندی مورد استفاده قرار می گیرند قابل مشاهده و درک هستند.

تبلیغات

ادامه مطلب را در زیر بخوانید

گوگل اهمیت شفافیت را به شرح زیر توضیح می دهد:

شفافیت و تفسیرپذیری عوامل مهمی در استقرار مدل های LTR در سیستم های رتبه بندی هستند که می توانند در تعیین نتایج فرآیندهایی مانند ارزیابی صلاحیت وام ، هدف تبلیغات یا هدایت تصمیمات درمانی نقش داشته باشند.

در چنین مواردی ، سهم هر یک از ویژگی های فردی در رتبه بندی نهایی باید قابل بررسی و درک باشد تا از شفافیت ، پاسخگویی و منصفانه بودن نتایج اطمینان حاصل شود. “

مشکل GAM ها این است که نحوه استفاده از این فناوری در رتبه بندی مشکلات نوع مشخص نبود.

به منظور حل این مشکل و استفاده از GAM در تنظیم رتبه بندی ، از TF-Ranking برای ایجاد مدل های افزودنی عمومی رتبه بندی عصبی (GAMs) استفاده شد که برای نحوه رتبه بندی صفحات وب بازتر است.

گوگل این را صدا می کند ، یادگیری تفسیری-رتبه بندی.

در اینجا چیزی است که مقاله Google AI می گوید:

“برای این منظور ، ما یک رتبه بندی عصبی GAM – توسعه مدل های افزودنی تعمیم یافته به مشکلات رتبه بندی را ایجاد کرده ایم.

بر خلاف GAM های استاندارد ، یک GAM رتبه بندی عصبی می تواند ویژگی های موارد رتبه بندی شده و ویژگی های زمینه (به عنوان مثال ، پرس و جو یا مشخصات کاربر) را در نظر بگیرد تا یک مدل قابل تفسیر و جمع و جور را بدست آورد.

به عنوان مثال ، در شکل زیر ، استفاده از رتبه بندی عصبی GAM نشان می دهد که چگونه فاصله ، قیمت و ارتباط ، در زمینه یک دستگاه کاربر مشخص ، به رتبه بندی نهایی هتل کمک می کند.

GAM های رتبه بندی عصبی اکنون به عنوان بخشی از رتبه بندی TF در دسترس هستند … “

مثال رتبه بندی جستجوی هتل GAMS

من از جف کویل ، بنیانگذار فناوری بهینه سازی محتوا AI MarketMuse (MarketMuseCo) ، در مورد رتبه بندی TF و GAM ها.

تبلیغات

ادامه مطلب را در زیر بخوانید

جفری ، که دارای سابقه کامپیوتر و همچنین چندین دهه تجربه در بازاریابی جستجو است ، خاطرنشان کرد که GAM ها یک فناوری مهم هستند و بهبود آن یک رویداد مهم بود.

آقای کویل به اشتراک گذاشت:

“من زمان زیادی را صرف تحقیق در مورد نوآوری رتبه بندی عصبی GAMs و تأثیر احتمالی آن بر تجزیه و تحلیل زمینه (برای پرس و جوها) کرده ام که از اهداف بلند مدت تیم های امتیازدهی گوگل بوده است.

RankGAM عصبی و فناوری های مرتبط سلاح های مهلکی برای شخصی سازی (به ویژه اطلاعات کاربر و اطلاعات زمینه ، مانند مکان) و برای تجزیه و تحلیل عمدی هستند.

با استفاده از keras_dnn_tfrecord.py که به عنوان یک مثال عمومی در دسترس است ، نگاهی اجمالی به نوآوری در سطح اولیه می اندازیم.

توصیه می کنم همه آن کد را بررسی کنند. “

عملکرد بهتر درختان تصمیم گرادیان (BTDT)

غلبه بر استاندارد در یک الگوریتم مهم است زیرا به این معنی است که رویکرد جدید یک دستاورد است که کیفیت نتایج جستجو را بهبود می بخشد.

در این مورد ، استاندارد درختان تصمیم گیری با گرادیان (GBDT) است ، یک تکنیک یادگیری ماشین که چندین مزیت دارد.

تبلیغات

ادامه مطلب را در زیر بخوانید

اما گوگل همچنین توضیح می دهد که GBDT ها معایبی نیز دارند:

GBDT نمی تواند مستقیماً در فضاهای بزرگ مجزا مانند متن سند خام اعمال شود. آنها همچنین به طور کلی مقیاس پذیری کمتری نسبت به مدل های رتبه بندی عصبی دارند. “

در مقاله ای تحت عنوان ، آیا رتبه بندی های عصبی هنوز با درختان تصمیم گیرنده گرادیان عملکرد بهتری دارند؟ محققان اظهار می کنند که یادگیری عصبی برای رتبه بندی مدلها عبارتند از:با اختلاف زیاد ”نسبت به… پیاده سازی های مبتنی بر درخت.

محققان گوگل از TF-Ranking مبتنی بر Keras برای تولید آنچه آنها نامیده اند استفاده کردند. صلیب نهفته خودافزایش داده (DASALC) مدل.

DASALC مهم است زیرا قادر به مطابقت یا فراتر رفتن از وضعیت فعلی پایه هنر است:

“مدلهای ما قادر به مقایسه با خط پایه قوی درختی هستند ، در حالی که از آموزش عصبی اخیراً منتشر شده برای رتبه بندی روشها با فاصله زیاد بهتر عمل می کنند. نتایج ما همچنین به عنوان معیاری برای یادگیری عصبی برای رتبه بندی مدل ها عمل می کند. “

TF-Ranking مبتنی بر Keras سرعت توسعه الگوریتم های رتبه بندی را افزایش می دهد

نکته مهم این است که این سیستم جدید سرعت تحقیق و توسعه سیستم های رتبه بندی جدید را افزایش می دهد ، که شامل شناسایی هرزنامه ها برای رتبه بندی آنها در نتایج جستجو می شود.

تبلیغات

ادامه مطلب را در زیر بخوانید

مقاله نتیجه می گیرد:

“در مجموع ، ما معتقدیم که نسخه جدید TF-Ranking مبتنی بر Keras انجام تحقیقات LTR عصبی و استقرار سیستم های رتبه بندی درجه تولید را آسان تر می کند.”

گوگل در چند ماه گذشته با سرعت به روز افزایشی نوآوری کرده است ، با چندین به روزرسانی الگوریتم اسپم و دو به روز رسانی الگوریتم اصلی در طول دو ماه.

این فناوری های جدید ممکن است به این دلیل باشد که گوگل الگوریتم های جدیدی را برای بهبود مبارزه با هرزنامه و رتبه بندی وب سایت ها به طور کلی ارائه کرده است.

استناد

مقاله وبلاگ هوش مصنوعی Google
پیشرفت در رتبه بندی TF

الگوریتم جدید DASALC گوگل
آیا رتبه بندی های عصبی هنوز با درختان تصمیم گرادیان تقویت شده عملکرد بهتری دارند؟

وب سایت رسمی TensorFlow

صفحه رتبه بندی TensorFlow v0.4.0 GitHub
https://github.com/tensorflow/ranking/releases/tag/v0.4.0

Keras مثال keras_dnn_tfrecord.py