نویسندگان:
(1) Ziqi Zhang*، دانشکده اطلاعات، دانشگاه شفیلد، Regent Court، شفیلد، UKS1 4DP ([email protected])
(2) Tomas Jasaitis، Vamstar Ltd.، لندن ([email protected])
(3) ریچارد فریمن، Vamstar Ltd.، لندن ([email protected])
(4) رویدا آلفرجانی، دانشکده اطلاعات، دانشگاه شفیلد، دادگاه ریجنت، شفیلد، UKS1 4DP ([email protected])
(5) آدام فانک، دانشکده اطلاعات، دانشگاه شفیلد، ریجنت کورت، شفیلد، UKS1 4DP ([email protected]).
جدول پیوندها
-
چکیده و مقدمه
-
دامنه و وظیفه
2.1. منابع داده و پیچیدگی
2.2. تعریف وظیفه
-
کار مرتبط
3.1. بررسی اجمالی تحقیق متن کاوی و NLP
3.2. متن کاوی و NLP در استفاده در صنعت
3.3. متن کاوی و NLP برای تهیه
3.4. نتیجه گیری از بررسی ادبیات
-
روش پیشنهادی
4.1. دانش دامنه
4.2. استخراج محتوا
4.3. منطقه بندی لات
4.4. تشخیص آیتم لات
4.5. تجزیه فراوان
4.6. تجزیه XML، پیوستن به داده ها، و توسعه شاخص های ریسک
-
آزمایش و نمایش
5.1. ارزیابی مولفه
5.2. نمایش سیستم
-
بحث
6.1. تمرکز “صنعت” پروژه
6.2. ناهمگونی داده ها، ماهیت چند زبانه و چند وظیفه ای
6.3. معضل انتخاب های الگوریتمی
6.4. هزینه داده های آموزشی
-
نتیجه گیری، قدردانی و …