جدول پیوندها
-
چکیده و مقدمه
-
دامنه و وظیفه
2.1. منابع داده و پیچیدگی
2.2. تعریف وظیفه
-
کار مرتبط
3.1. بررسی اجمالی تحقیق متن کاوی و NLP
3.2. متن کاوی و NLP در استفاده در صنعت
3.3. متن کاوی و NLP برای تهیه
3.4. نتیجه گیری از بررسی ادبیات
-
روش پیشنهادی
4.1. دانش دامنه
4.2. استخراج محتوا
4.3. منطقه بندی لات
4.4. تشخیص آیتم لات
4.5. تجزیه زیادی
4.6. تجزیه XML، پیوستن به داده ها، و توسعه شاخص های ریسک
-
آزمایش و نمایش
5.1. ارزیابی مولفه
5.2. نمایش سیستم
-
بحث
6.1. تمرکز “صنعت” پروژه
6.2. ناهمگونی داده ها، ماهیت چند زبانه و چند وظیفه ای
6.3. معضل انتخاب های الگوریتمی
6.4. هزینه داده های آموزشی
-
نتیجه گیری، قدردانی و مراجع
7. نتیجه گیری
متن کاوی و NLP چندین دهه است که زمینه های تحقیقاتی ثابت شده است. تکنیک های آنها همچنین به طور گسترده در صنایع برای توسعه و استقرار سیستم های هوشمند برای تجزیه و تحلیل خودکار داده های متنی در مقیاس بزرگ مورد استفاده قرار گرفته است. با این حال، ادبیات تحت سلطه تحقیقاتی است که از روشهای نظارتی مبتنی بر دادههای به خوبی تنظیم شده حمایت میکنند. راه حل ها در چنین “محیط آزمایشگاهی” اغلب به خوبی به سناریوهای عملی منتقل نمی شوند. در عوض، متن صنعتی را گزارش می کند…