سیستم‌های توصیه‌کننده رمزگشای موقتی علّی آگاه اجتماعی – وبلاگ تحقیقاتی Google

خواندن فواید زیادی برای دانش‌آموزان جوان دارد، مانند مهارت‌های زبانی و زندگی بهتر، و نشان داده شده است که خواندن برای لذت با موفقیت تحصیلی مرتبط است. علاوه بر این، دانش‌آموزان بهزیستی عاطفی بهتر از خواندن، و همچنین دانش عمومی بهتر و درک بهتر فرهنگ‌های دیگر را گزارش کرده‌اند. با حجم وسیعی از مطالب خواندنی چه به صورت آنلاین و چه غیر آنلاین، یافتن محتوای مناسب با سن، مرتبط و جذاب می‌تواند یک کار چالش برانگیز باشد، اما کمک به دانش‌آموزان در انجام این کار گامی ضروری برای مشارکت دادن آن‌ها در خواندن است. توصیه‌های مؤثری که مطالب خواندنی مرتبط را به دانش‌آموزان ارائه می‌کند، به خواندن دانش‌آموزان کمک می‌کند، و اینجاست که یادگیری ماشینی (ML) می‌تواند کمک کند.

ML به طور گسترده ای در ساخت سیستم های توصیه کننده برای انواع مختلف محتوای دیجیتال، از فیلم ها گرفته تا کتاب ها و اقلام تجارت الکترونیکی استفاده شده است. سیستم‌های توصیه‌کننده در طیف وسیعی از پلتفرم‌های دیجیتال برای کمک به ارائه محتوای مرتبط و جذاب برای کاربران استفاده می‌شوند. در این سیستم‌ها، مدل‌های ML آموزش داده می‌شوند تا بر اساس ترجیحات کاربر، تعامل کاربر و موارد تحت توصیه، موارد را به هر کاربر به صورت جداگانه پیشنهاد دهند. این داده‌ها یک سیگنال یادگیری قوی برای مدل‌ها ارائه می‌کنند تا بتوانند مواردی را که احتمالاً مورد علاقه هستند توصیه کنند و در نتیجه تجربه کاربر را بهبود بخشند.

در «مطالعه: سیستم‌های توصیه‌کننده رمزگشای موقتی آگاه اجتماعی»، ما یک سیستم توصیه‌کننده محتوا برای کتاب‌های صوتی را در یک محیط آموزشی با در نظر گرفتن ماهیت اجتماعی خواندن ارائه می‌کنیم. ما الگوریتم STUDY را با مشارکت Learning Ally، یک سازمان غیرانتفاعی آموزشی، با هدف ترویج خواندن در دانش‌آموزان نارساخوان، ایجاد کردیم که کتاب‌های صوتی را از طریق یک برنامه اشتراک در سطح مدرسه در اختیار دانش‌آموزان قرار می‌دهد. هدف ما با استفاده از طیف گسترده ای از کتاب های صوتی در کتابخانه Learning Ally، کمک به دانش آموزان برای یافتن محتوای مناسب برای کمک به افزایش تجربه خواندن و تعامل آنهاست. با انگیزه این واقعیت که آنچه که همسالان یک فرد در حال حاضر می خوانند تأثیرات قابل توجهی بر آنچه خواندن آنها برای آنها جالب است، دارد، ما به طور مشترک سابقه درگیری خواندن دانش آموزانی را که در یک کلاس درس هستند پردازش می کنیم. این به مدل ما اجازه می‌دهد تا از اطلاعات زنده در مورد آنچه که در حال حاضر در گروه اجتماعی محلی دانش‌آموزان، در این مورد، کلاس درس در حال انجام است، بهره‌مند شود.

داده ها

Learning Ally یک کتابخانه دیجیتال بزرگ از کتاب‌های صوتی انتخاب‌شده دارد که هدف آن دانش‌آموزان است، که آن را برای ایجاد یک مدل توصیه اجتماعی برای کمک به بهبود نتایج یادگیری دانش‌آموزان مناسب می‌سازد. ما دو سال داده مصرف کتاب صوتی ناشناس دریافت کردیم. همه دانش‌آموزان، مدارس و گروه‌های موجود در داده‌ها ناشناس بودند و تنها با شناسه‌ای که به‌طور تصادفی تولید شده بود شناسایی شدند که توسط Google قابل ردیابی نیست. علاوه بر این، تمام ابرداده‌های بالقوه قابل شناسایی فقط به صورت انبوه به اشتراک گذاشته شدند تا از دانش‌آموزان و مؤسسات در برابر شناسایی مجدد محافظت شود. داده ها شامل سوابق با مهر زمانی از تعامل دانش آموزان با کتاب های صوتی بود. برای هر تعامل، یک شناسه دانش آموز ناشناس (که شامل سطح نمره دانش آموز و شناسه مدرسه ناشناس است)، یک شناسه کتاب صوتی و یک تاریخ داریم. در حالی که بسیاری از مدارس دانش‌آموزان را در یک کلاس در چندین کلاس توزیع می‌کنند، ما از این فراداده استفاده می‌کنیم تا این فرض ساده‌تر را ایجاد کنیم که همه دانش‌آموزان در یک مدرسه و در یک سطح کلاس در یک کلاس درس هستند. در حالی که این پایه و اساس مورد نیاز برای ایجاد یک مدل توصیه‌گر اجتماعی بهتر را فراهم می‌کند، مهم است که توجه داشته باشیم که این امر ما را قادر به شناسایی مجدد افراد، گروه‌های طبقاتی یا مدارس نمی‌کند.

الگوریتم STUDY

ما مشکل توصیه را به عنوان یک مشکل پیش‌بینی نرخ کلیک در نظر گرفتیم، جایی که احتمال شرطی تعامل کاربر با هر مورد خاص مشروط به هر دو 1) ویژگی‌های کاربر و مورد و 2) توالی سابقه تعامل آیتم برای کاربر مورد نظر را مدل‌سازی کردیم. . کار قبلی نشان می‌دهد که مدل‌های مبتنی بر ترانسفورماتور، یک کلاس مدل پرکاربرد که توسط Google Research توسعه داده شده است، برای مدل‌سازی این مشکل مناسب هستند. هنگامی که هر کاربر به صورت جداگانه پردازش می‌شود، این به یک مشکل مدل‌سازی توالی اتورگرسیو تبدیل می‌شود. ما از این چارچوب مفهومی برای مدل سازی داده های خود استفاده می کنیم و سپس این چارچوب را برای ایجاد رویکرد STUDY گسترش می دهیم.

در حالی که این رویکرد برای پیش‌بینی نرخ کلیک می‌تواند وابستگی‌های بین ترجیحات آیتم‌های گذشته و آینده را برای یک کاربر خاص مدل کند و می‌تواند الگوهای شباهت بین کاربران را در زمان قطار بیاموزد، نمی‌تواند وابستگی‌ها را بین کاربران مختلف در زمان استنتاج مدل‌سازی کند. برای شناخت ماهیت اجتماعی خواندن و رفع این نقص، مدل STUDY را توسعه دادیم، که توالی های متعددی از کتاب های خوانده شده توسط هر دانش آموز را در یک توالی واحد به هم متصل می کند که داده های چند دانش آموز را در یک کلاس درس جمع آوری می کند.

با این حال، اگر قرار است توسط ترانسفورماتورها مدل‌سازی شود، این نمایش داده‌ها به دقت دقیق نیاز دارد. در ترانسفورماتورها، ماسک توجه ماتریسی است که کنترل می‌کند از کدام ورودی‌ها می‌توان برای اطلاع از پیش‌بینی‌های کدام خروجی استفاده کرد. الگوی استفاده از تمام نشانه های قبلی در یک دنباله برای اطلاع از پیش بینی یک خروجی منجر به ماتریس توجه مثلثی بالایی می شود که به طور سنتی در رمزگشاهای علّی یافت می شود. با این حال، از آنجایی که توالی وارد شده به مدل STUDY به طور موقت مرتب نیست، حتی اگر هر یک از دنباله‌های تشکیل‌دهنده آن باشد، رمزگشای علی استاندارد دیگر برای این دنباله مناسب نیست. هنگام تلاش برای پیش‌بینی هر نشانه، مدل مجاز نیست به هر نشانه‌ای که در دنباله آن قبل از آن است توجه کند. برخی از این نشانه‌ها ممکن است دارای مهر زمانی باشند که متأخر هستند و حاوی اطلاعاتی هستند که در زمان استقرار در دسترس نیستند.

در این شکل ماسک توجه که معمولاً در رمزگشاهای علّی استفاده می شود را نشان می دهیم. هر ستون یک خروجی و هر ستون نشان دهنده یک خروجی است. مقدار 1 (به صورت آبی نشان داده شده است) برای یک ورودی ماتریس در یک موقعیت خاص نشان می دهد که مدل می تواند ورودی آن ردیف را هنگام پیش بینی خروجی ستون مربوطه مشاهده کند، در حالی که مقدار 0 (به صورت سفید نشان داده شده است) خلاف آن را نشان می دهد. .

مدل STUDY با جایگزینی ماسک توجه ماتریس مثلثی با یک ماسک توجه انعطاف‌پذیر با مقادیر مبتنی بر مهرهای زمانی بر روی ترانسفورماتورهای علّی بنا می‌شود تا به دنباله‌های مختلف توجه شود. در مقایسه با یک ترانسفورماتور معمولی، که اجازه توجه در میان دنباله‌های مختلف را نمی‌دهد و دارای یک ماسک ماتریس مثلثی در داخل دنباله است، STUDY یک ماتریس توجه مثلثی علّی را در یک دنباله حفظ می‌کند و دارای مقادیر انعطاف‌پذیر در سراسر دنباله‌ها با مقادیری است که به مهرهای زمانی بستگی دارد. از این رو، پیش‌بینی‌ها در هر نقطه خروجی در دنباله توسط تمام نقاط ورودی که در گذشته رخ داده‌اند نسبت به نقطه زمانی فعلی، بدون توجه به اینکه قبل یا بعد از ورودی فعلی در دنباله ظاهر می‌شوند، مطلع می‌شوند. این محدودیت علّی مهم است زیرا اگر در زمان قطار اجرا نشود، مدل به طور بالقوه می‌تواند پیش‌بینی‌هایی را با استفاده از اطلاعات آینده، که برای استقرار در دنیای واقعی در دسترس نخواهد بود، یاد بگیرد.

در (الف) ما یک ترانسفورماتور اتورگرسیو متوالی را با توجه علّی نشان می دهیم که هر کاربر را به صورت جداگانه پردازش می کند. در (ب) یک پاس مشترک رو به جلو معادل را نشان می‌دهیم که به همان محاسبات (a) منجر می‌شود. و در نهایت، در (c) نشان می‌دهیم که با معرفی مقادیر جدید غیر صفر (به رنگ بنفش) به ماسک توجه، اجازه می‌دهیم اطلاعات در بین کاربران جریان یابد. ما این کار را با اجازه دادن به یک پیش‌بینی برای شرطی کردن همه تعاملات با مهر زمانی قبلی انجام می‌دهیم، صرف نظر از اینکه تعامل از همان کاربر بوده است یا خیر.

آزمایش

ما از مجموعه داده Learning Ally برای آموزش مدل STUDY به همراه چندین خط پایه برای مقایسه استفاده کردیم. ما یک رمزگشای ترانسفورماتور نرخ کلیک اتورگرسیو را پیاده سازی کردیم که به آن “انفرادی” می گوییم. ک-نزدیکترین همسایه پایه (KNN)، و یک خط پایه اجتماعی قابل مقایسه، شبکه حافظه توجه اجتماعی (SAMN). ما از داده های سال تحصیلی اول برای آموزش و از داده های سال تحصیلی دوم برای اعتبار سنجی و آزمایش استفاده کردیم.

ما این مدل‌ها را با اندازه‌گیری درصد زمانی که مورد بعدی که کاربر واقعاً با آن تعامل داشت در بالای مدل قرار داشت ارزیابی کردیم. n توصیه ها، به عنوان مثال، بازدید @n برای مقادیر مختلف از n. علاوه بر ارزیابی مدل‌ها در کل مجموعه آزمون، ما همچنین نمرات مدل‌ها را در دو زیر مجموعه از مجموعه آزمون که چالش‌برانگیزتر از کل مجموعه داده‌ها هستند، گزارش می‌کنیم. ما مشاهده کردیم که دانش‌آموزان معمولاً در چندین جلسه با یک کتاب صوتی ارتباط برقرار می‌کنند، بنابراین توصیه ساده آخرین کتابی که کاربر خوانده است توصیه‌ای بی‌اهمیت خواهد بود. از این رو، اولین زیرمجموعه آزمایشی، که ما از آن به عنوان “غیر ادامه” یاد می کنیم، جایی است که ما فقط به عملکرد هر مدل بر اساس توصیه ها نگاه می کنیم که دانش آموزان با کتاب هایی متفاوت از تعامل قبلی تعامل داشته باشند. همچنین مشاهده می‌کنیم که دانش‌آموزان کتاب‌هایی را که در گذشته خوانده‌اند دوباره بازدید می‌کنند، بنابراین عملکرد قوی در مجموعه آزمون می‌تواند با محدود کردن توصیه‌های ارائه شده برای هر دانش‌آموز فقط به کتاب‌هایی که در گذشته خوانده‌اند به دست آورد. اگرچه ممکن است توصیه موارد دلخواه قدیمی به دانش‌آموزان ارزشمند باشد، اما ارزش زیادی از سیستم‌های توصیه‌گر ناشی از نمایش محتوای جدید و ناشناخته برای کاربر است. برای اندازه‌گیری این، مدل‌های زیرمجموعه‌ای از مجموعه آزمون را ارزیابی می‌کنیم که دانش‌آموزان برای اولین بار با یک عنوان تعامل دارند. نام این زیر مجموعه ارزیابی را «رمان» گذاشتیم.

ما متوجه شدیم که STUDY از همه مدل‌های آزمایش‌شده دیگر در تقریباً هر برشی که با آن ارزیابی کردیم، بهتر عمل می‌کند.

در این شکل عملکرد چهار مدل Study، Individual، KNN و SAMN را با هم مقایسه می کنیم. ما عملکرد را با hits@5 اندازه‌گیری می‌کنیم، یعنی چقدر احتمال دارد که مدل عنوان بعدی را که کاربر در 5 توصیه برتر مدل بخواند پیشنهاد دهد. ما مدل را در کل مجموعه آزمایشی (همه) و همچنین تقسیم‌های جدید و غیرادامهی ارزیابی می‌کنیم. ما می بینیم که STUDY به طور مداوم از سه مدل دیگر ارائه شده در همه تقسیم ها بهتر عمل می کند.

اهمیت گروه بندی مناسب

در قلب الگوریتم STUDY، سازماندهی کاربران به گروه‌ها و استنتاج مشترک بر روی چندین کاربر که در یک گروه هستند در یک پاس رو به جلو مدل است. ما یک مطالعه فرسایشی انجام دادیم که در آن به اهمیت گروه‌بندی‌های واقعی مورد استفاده در عملکرد مدل نگاه کردیم. در مدل ارائه شده ما همه دانش آموزانی را که در یک سطح کلاس و مدرسه هستند با هم گروه بندی می کنیم. سپس با گروه‌هایی که توسط همه دانش‌آموزان در همان سطح کلاس و منطقه تعریف شده‌اند آزمایش می‌کنیم و همچنین همه دانش‌آموزان را در یک گروه واحد با یک زیرمجموعه تصادفی که برای هر پاس رو به جلو استفاده می‌شود، قرار می‌دهیم. ما همچنین این مدل ها را با مدل فردی برای مرجع مقایسه می کنیم.

ما دریافتیم که استفاده از گروه‌هایی که بیشتر بومی‌سازی شده بودند مؤثرتر بود، به طوری که گروه‌بندی سطح مدرسه و کلاس بهتر از گروه‌بندی سطح منطقه و کلاس بود. این امر از این فرضیه پشتیبانی می کند که مدل STUDY به دلیل ماهیت اجتماعی فعالیت هایی مانند خواندن موفق است – انتخاب های خواندن افراد احتمالاً با انتخاب های خواندن اطرافیانشان مرتبط است. هر دوی این مدل ها از دو مدل دیگر (تک گروهی و انفرادی) که در آن سطح پایه برای گروه بندی دانش آموزان استفاده نمی شود، عملکرد بهتری داشتند. این نشان می دهد که داده های کاربران با سطوح خواندن و علایق مشابه برای عملکرد مفید است.

کار آینده

این کار محدود به توصیه‌های مدل‌سازی برای جمعیت‌های کاربر است که در آن ارتباطات اجتماعی همگن فرض می‌شود. در آینده، مدل سازی یک جمعیت کاربر که در آن روابط همگن نیستند، به عنوان مثال، جایی که به طور قطعی انواع مختلفی از روابط وجود دارد یا قدرت یا تأثیر نسبی روابط مختلف شناخته شده است، مفید خواهد بود.

سپاسگزاریها

این کار شامل تلاش‌های مشترک یک تیم چند رشته‌ای متشکل از محققان، مهندسان نرم‌افزار و کارشناسان موضوع آموزشی بود. از نویسندگان همکارمان: دیانا مینکو، لورن هارل و کاترین هلر از Google تشکر می‌کنیم. همچنین از همکارانمان در Learning Ally، جف هو، آکشات شاه، ارین واکر، و تایلر باستیان، و همکارانمان در گوگل، مارک رپنیک، آکی استرلا، فرناندو دیاز، اسکات سانر، امیلی سالکی و لو پرولیف تشکر می‌کنیم.

سئو PBN | خبر های جدید سئو و هک و سرور