چه موقع بیانسه شروع به محبوب شدن کرد؟ – مقابله با یکی از رایج ترین مشکلات NLP: پرسش و پاسخ

تصویر
عکس پروفایل Valentin Biryukov Hacker Noon

@تصمیموکوفوالنتین بیروکوف

رئیس تحقیق و توسعه در Toloka.ai

سلام! امروز می خواهم نحوه حل یکی از مشکل ترین کارها در NLP – پاسخ به س –ال را توضیح دهم. ما با کمک Toloka-Kit – یک کتابخانه پایتون برای پروژه های برچسب گذاری داده ها که به دانشمندان داده و مهندسان ML در ساخت خطوط لوله مقیاس پذیر ML کمک می کند ، مجموعه داده SQuAD2.0 را برچسب گذاری خواهیم کرد. اما به عنوان مثال Vertex AI ، با خیال راحت گزینه دیگری را انتخاب کنید. بیایید شیرجه بزنیم

SQuAD چیست؟

مجموعه داده های پاسخ س Stanال استنفورد (SQuAD) برای آزمایش مدل های NLP و توانایی آنها در درک زبان طبیعی استفاده می شود. SQuAD2.0 شامل مجموعه ای از پاراگراف های مقاله های ویکی پدیا ، همراه با 100000 جفت سوال-پاسخ مشتق شده از این پاراگراف ها ، و 50،000 سوال غیر قابل پاسخ است. برای نشان دادن نتایج خوب در SQuAD2.0 ، یک مدل نه تنها باید به درستی به سوالات پاسخ دهد ، بلکه در وهله اول تعیین کند که آیا سوالی پاسخ دارد یا خیر ، و در صورت عدم جواب دادن از آن خودداری کند.

SQuAD2.0 محبوب ترین مجموعه داده های پاسخگوی س questionالات است: در بیش از 1000 مقاله ذکر شده است و در سه سال از زمان انتشار ، 85 مدل در جدول رده بندی آن منتشر شده است.

مشکل

وظیفه ما این است که بر اساس بخشی از مقاله ویکی پدیا پاسخ صحیح به یک سوال بدست آوریم. پاسخ بخشی از …

سئو PBN | خبر های جدید سئو و هک و سرور