جدول پیوندها
-
چکیده و مقدمه
-
دامنه و وظیفه
2.1. منابع داده و پیچیدگی
2.2. تعریف وظیفه
-
کار مرتبط
3.1. بررسی اجمالی تحقیق متن کاوی و NLP
3.2. متن کاوی و NLP در استفاده در صنعت
3.3. متن کاوی و NLP برای تهیه
3.4. نتیجه گیری از بررسی ادبیات
-
روش پیشنهادی
4.1. دانش دامنه
4.2. استخراج محتوا
4.3. منطقه بندی لات
4.4. تشخیص آیتم لات
4.5. تجزیه فراوان
4.6. تجزیه XML، پیوستن به داده ها، و توسعه شاخص های ریسک
-
آزمایش و نمایش
5.1. ارزیابی مولفه
5.2. نمایش سیستم
-
بحث
6.1. تمرکز “صنعت” پروژه
6.2. ناهمگونی داده ها، ماهیت چند زبانه و چند وظیفه ای
6.3. معضل انتخاب های الگوریتمی
6.4. هزینه داده های آموزشی
-
نتیجه گیری، قدردانی و مراجع
4. روش پیشنهادی
شکل 5 نمای کلی از گردش کار ما را نشان می دهد. همانطور که قبلا ذکر شد، این مقاله بر استخراج اطلاعات ساختار یافته و مواردی که اغلب در XML های مناقصه و جایزه (خط میانی) گم نمی شوند، تمرکز دارد. این در بخش های 4.1 تا 4.5 پوشش داده خواهد شد. در بخش 4.6، ما به طور خلاصه به سایر بخش های گردش کار می پردازیم.
با توجه به مجموعه ای از اسناد پیوست مناقصه مرتبط با یک آگهی مناقصه، اولین گام ما (استخراج محتوا) استفاده از استخراج داده های مختلف است…