چرا الگوریتم های کلاسیک هنوز در پردازش زبان طبیعی مدرن اهمیت دارند؟

  1. چکیده و مقدمه

  2. دامنه و وظیفه

    2.1. منابع داده و پیچیدگی

    2.2. تعریف وظیفه

  3. کار مرتبط

    3.1. بررسی اجمالی تحقیق متن کاوی و NLP

    3.2. متن کاوی و NLP در استفاده در صنعت

    3.3. متن کاوی و NLP برای تهیه

    3.4. نتیجه گیری از بررسی ادبیات

  4. روش پیشنهادی

    4.1. دانش دامنه

    4.2. استخراج محتوا

    4.3. منطقه بندی لات

    4.4. تشخیص آیتم لات

    4.5. تجزیه زیادی

    4.6. تجزیه XML، پیوستن به داده ها، و توسعه شاخص های ریسک

  5. آزمایش و نمایش

    5.1. ارزیابی مولفه

    5.2. نمایش سیستم

  6. بحث

    6.1. تمرکز “صنعت” پروژه

    6.2. ناهمگونی داده ها، ماهیت چند زبانه و چند وظیفه ای

    6.3. معضل انتخاب های الگوریتمی

    6.4. هزینه داده های آموزشی

  7. نتیجه گیری، قدردانی و مراجع

6.3. معضل انتخاب های الگوریتمی

روش طبقه‌بندی ما مبتنی بر الگوریتم‌های یادگیری ماشین کلاسیک است و از شبکه‌های عصبی عمیق‌تر آموزش‌دیده بر روی مجموعه داده‌های بسیار بزرگ به‌عنوان «مدل‌های زبانی» استفاده نمی‌کند، مانند BERT معروف (Delvin et al., 2018). نشان داده شده است که این مدل ها معیارهای جدیدی را برای طیف وسیعی از وظایف NLP تعیین می کنند. با این حال، ما به دلایل عملی از BERT یا روش‌های مبتنی بر مدل زبان مشابه استفاده نکردیم.

اول اینکه چنین مدل هایی …

Source link