بررسی ادبیات ما نشان میدهد که، علیرغم تحقیقات قابلتوجه در زمینههای متن کاوی و NLP، روشهای نظارت شده بر اساس دادههای بهخوبی انتخابشده که به خوبی به سناریوهای عملی منتقل نمیشوند، غالب است. این تا حدی با تعداد مطالعات صنعتی متن کاوی/NLP که روشهای مبتنی بر قانون و استفاده از واژهنامههای دامنه را در بر میگرفت، منعکس میشود، بهجز چند حوزه (مثلاً حوزه قانونی) که منابع با کیفیت بالا فراوان هستند. اکثر مطالعات صنعتی به وظایف منفرد و گاهی سادهشده نیز نگاه میکنند، اما یک فرآیند کامل را بهصورت سرتاسری گزارش نمیکنند، بهویژه با فقدان جزئیات در مورد نحوه برخورد با ناهمگونی و ناسازگاری دادهها با روشهای آنها. علاوه بر این، هیچ کار قبلی روی حوزه مراقبت های بهداشتی متمرکز نشده است. کار ما این شکاف ها را برطرف خواهد کرد.
نویسندگان:
(1) Ziqi Zhang*، دانشکده اطلاعات، دانشگاه شفیلد، Regent Court، شفیلد، UKS1 4DP ([email protected])
(2) Tomas Jasaitis، Vamstar Ltd.، لندن ([email protected])
(3) ریچارد فریمن، Vamstar Ltd.، لندن ([email protected])
(4) رویدا آلفرجانی، دانشکده اطلاعات، دانشگاه شفیلد، دادگاه ریجنت، شفیلد، UKS1 4DP ([email protected])
(5) آدام فانک، دانشکده اطلاعات، دانشگاه شفیلد، رجنت کورت، شفیلد، …