برنامه وب جدید به محققان امکان می دهد ابزارهای هوش مصنوعی زبان را در زمان واقعی آزمایش و رتبه بندی کنند

نویسندگان:

(1) Martyna Wiącek، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(2) پیوتر ریباک، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(3) Łukasz Pszenny، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(4) Alina Wróblewska، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

یادداشت ویرایشگر: این قسمت 3 از 10 مطالعه ای است در مورد بهبود ارزیابی و مقایسه ابزارهای مورد استفاده در پیش پردازش زبان طبیعی. بقیه را در ادامه بخوانید.

چکیده و 1. مقدمه و آثار مرتبط

  1. بنچمارک NLPre

2.1. مفهوم تحقیق

2.2. سیستم بنچمارک آنلاین

2.3. پیکربندی

  1. معیار NLPre-PL

3.1. مجموعه داده ها

3.2. وظایف

  1. ارزیابی

4.1. روش شناسی ارزشیابی

4.2. سیستم های ارزیابی شده

4.3. نتایج

  1. نتیجه گیری
    • ضمیمه ها
    • قدردانی ها
    • مراجع کتابشناختی
    • مراجع منابع زبان

2.2. سیستم بنچمارک آنلاین

سیستم معیار شامل سه بخش اصلی است: مخزن داده، سیستم ارسال و ارزیابی، و تابلوی امتیازات. مخزن داده توضیحاتی از وظایف NLPre، مجموعه داده ها و معیارهای ارزیابی و همچنین پیوندهایی به مجموعه داده ها ارائه می دهد.

سیستم ارسال و ارزیابی مدل به محققین اجازه می‌دهد تا با ارائه پیش‌بینی‌های آن برای مجموعه‌های آزمایشی مدل جدید را ارزیابی کنند.

Source link