چرا روش های نظارت شده در مبارزه NLP در برنامه های کاربردی دنیای واقعی؟

بررسی ادبیات ما نشان می‌دهد که، علی‌رغم تحقیقات قابل‌توجه در زمینه‌های متن کاوی و NLP، روش‌های نظارت شده بر اساس داده‌های به‌خوبی انتخاب‌شده که به خوبی به سناریوهای عملی منتقل نمی‌شوند، غالب است. این تا حدی با تعداد مطالعات صنعتی متن کاوی/NLP که روش‌های مبتنی بر قانون و استفاده از واژه‌نامه‌های دامنه را در بر می‌گرفت، منعکس می‌شود، به‌جز چند حوزه (مثلاً حوزه قانونی) که منابع با کیفیت بالا فراوان هستند. اکثر مطالعات صنعتی به وظایف منفرد و گاهی ساده‌شده نیز نگاه می‌کنند، اما یک فرآیند کامل را به‌صورت سرتاسری گزارش نمی‌کنند، به‌ویژه با فقدان جزئیات در مورد نحوه برخورد با ناهمگونی و ناسازگاری داده‌ها با روش‌های آنها. علاوه بر این، هیچ کار قبلی روی حوزه مراقبت های بهداشتی متمرکز نشده است. کار ما این شکاف ها را برطرف خواهد کرد.

نویسندگان:

(1) Ziqi Zhang*، دانشکده اطلاعات، دانشگاه شفیلد، Regent Court، شفیلد، UKS1 4DP ([email protected])

(2) Tomas Jasaitis، Vamstar Ltd.، لندن ([email protected])

(3) ریچارد فریمن، Vamstar Ltd.، لندن ([email protected])

(4) رویدا آلفرجانی، دانشکده اطلاعات، دانشگاه شفیلد، دادگاه ریجنت، شفیلد، UKS1 4DP ([email protected])

(5) آدام فانک، دانشکده اطلاعات، دانشگاه شفیلد، رجنت کورت، شفیلد، …

Source link