چگونه Vamstar محتوای مربوطه را برای تعداد زیادی در اسناد مناقصه شناسایی می کند

  1. چکیده و مقدمه

  2. دامنه و وظیفه

    2.1. منابع داده و پیچیدگی

    2.2. تعریف وظیفه

  3. کار مرتبط

    3.1. بررسی اجمالی تحقیق متن کاوی و NLP

    3.2. متن کاوی و NLP در استفاده در صنعت

    3.3. متن کاوی و NLP برای تهیه

    3.4. نتیجه گیری از بررسی ادبیات

  4. روش پیشنهادی

    4.1. دانش دامنه

    4.2. استخراج محتوا

    4.3. منطقه بندی لات

    4.4. تشخیص آیتم لات

    4.5. تجزیه فراوان

    4.6. تجزیه XML، پیوستن به داده ها، و توسعه شاخص های ریسک

  5. آزمایش و نمایش

    5.1. ارزیابی مولفه

    5.2. نمایش سیستم

  6. بحث

    6.1. تمرکز “صنعت” پروژه

    6.2. ناهمگونی داده ها، ماهیت چند زبانه و چند وظیفه ای

    6.3. معضل انتخاب های الگوریتمی

    6.4. هزینه داده های آموزشی

  7. نتیجه گیری، قدردانی و مراجع

4.3. منطقه بندی لات

محتوای متن استخراج‌شده در بالا ممکن است حاوی اطلاعات مرتبط برای تعداد زیادی باشد یا نباشد. بنابراین، این مؤلفه با فیلتر کردن محتوای متن سر و کار دارد تا حوزه‌های محتوای مربوطه را برای پردازش بیشتر شناسایی کند (یعنی «منطقه‌بندی» به محتوای مناسب). ما روی دو کار تمرکز می کنیم: 1) انتخاب صفحات مربوطه. 2) انتخاب جداول مربوطه. ما «ارتباط» را شامل توصیفی از مقدار زیادی (مرجع زیادی) و/یا موارد آن (اقلام زیادی) تعریف می کنیم. و برای هر دو، ما…

Source link