چارچوب جدید قول می دهد هوش مصنوعی را برای درک بهتر زبان های سخت مانند لهستانی آموزش دهد.

نویسندگان:

(1) Martyna Wiącek، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(2) پیوتر ریباک، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(3) Łukasz Pszenny، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

(4) Alina Wróblewska، موسسه علوم کامپیوتر، آکادمی علوم لهستان.

یادداشت ویرایشگر: این قسمت 5 از 10 مطالعه ای است که در مورد بهبود ارزیابی و مقایسه ابزارهای مورد استفاده در پیش پردازش زبان طبیعی انجام می شود. بقیه را در ادامه بخوانید.

چکیده و 1. مقدمه و آثار مرتبط

  1. بنچمارک NLPre

2.1. مفهوم تحقیق

2.2. سیستم بنچمارک آنلاین

2.3. پیکربندی

  1. معیار NLPre-PL

3.1. مجموعه داده ها

3.2. وظایف

  1. ارزیابی

4.1. روش شناسی ارزشیابی

4.2. سیستم های ارزیابی شده

4.3. نتایج

  1. نتیجه گیری
    • ضمیمه ها
    • قدردانی ها
    • مراجع کتابشناختی
    • مراجع منابع زبان

3. معیار NLPre-PL

3.1. مجموعه داده ها

جدول 1: خلاصه مجموعه داده های منبع (NKJP1M و PDB-UD) و مجموعه داده های NLPre-PL (به صورت توکن). توضیحات: POS - مجموعه برچسب بخشی از گفتار. DEP - طرح وابستگی؛ میانگین t/s – میانگین تعداد نشانه ها در هر جملهجدول 1: خلاصه مجموعه داده های منبع (NKJP1M و PDB-UD) و مجموعه داده های NLPre-PL (به صورت توکن). توضیحات: POS - مجموعه برچسب بخشی از گفتار. DEP - طرح وابستگی؛ میانگین t/s – میانگین تعداد نشانه ها در هر جمله

NKJP1M (Przepiórkowski و همکاران، 2018) زیرشاخه NKJP1M مجموعه ملی لهستان (Przepiórkowski و همکاران، 2012) به صورت دستی بر اساس مجموعه برچسب NKJP حاشیه نویسی می شود (Szałkiewicz and Przepiórkowski، و afterwardgset در خط 2012 اصلاح شده است) (Woliński، 2019). این زیرمجموعه متعادل از متون و رونویسی های متنوع با موضوع و ژانر برای آموزش لهستانی استفاده می شود.

Source link