15 مجموعه داده برتر Chatbot برای پروژه های NLP

عکس پروفایل نویسنده

@لیمارکلیمارک آمبالینا

ویرایشگرHackernoon در روز ، VR Gamer و Anime Binger در شب

یک چت بات موثر برای حل سریع سوالات کاربر بدون دخالت انسان به حجم گسترده ای از داده های آموزشی نیاز دارد. با این حال ، گلوگاه اصلی در توسعه chatbot ، به دست آوردن داده های گفتگوی واقع گرایانه و وظیفه محور برای آموزش این سیستم های مبتنی بر یادگیری ماشین است.

ما لیست نهایی بهترین مجموعه داده های مکالمه برای آموزش یک ربات چت را گردآوری کرده ایم که به داده های پاسخ به س questionال ، داده های پشتیبانی مشتری ، داده های گفتگو و داده های چند زبانه تقسیم شده است.

مجموعه داده های پرسش و پاسخ برای آموزش Chatbot

مجموعه داده های پرسش و پاسخ: این مجموعه شامل مقالات ویکی پدیا ، س questionsالهای فکتوئید به صورت دستی از آنها و پاسخهای این س questionsالات که به صورت دستی ایجاد شده اند ، برای استفاده در تحقیقات دانشگاهی.

WikiQA Corpus: مجموعه ای از جفت س questionالات و جملات که به صورت عمومی در دسترس است ، جمع آوری شده و برای تحقیق در مورد پاسخ دادن به سوال در حوزه باز حاشیه نویسی شده است. به منظور انعکاس نیاز واقعی اطلاعات عمومی کاربران ، آنها از گزارش های جستجوی بینگ به عنوان منبع سوال استفاده کردند. هر س questionال به یک صفحه ویکی پدیا پیوند داده می شود که به طور بالقوه پاسخ آن را دارد.

Yahoo Language Data: این صفحه مجموعه داده های QA را به طور دستی سرپرستی می کند از Yahoo Answers از Yahoo.

مجموعه TREC QA: TREC در پاسخ به سوالی …

سئو PBN | خبر های جدید سئو و هک و سرور