نویسندگان:
(1) آتاناسیوس آنجلاکیس، مرکز پزشکی دانشگاه آمستردام، دانشگاه آمستردام – مرکز علوم داده، موسسه تحقیقات بهداشت عمومی آمستردام، آمستردام، هلند
(2) آندری راس، دن هاگ، هلند.
جدول پیوندها
چکیده
افزایش داده ها (DA) تعمیم مدل را در بینایی کامپیوتر افزایش می دهد، اما ممکن است سوگیری هایی را ایجاد کند که دقت کلاس را به طور ناموزونی تحت تاثیر قرار دهد. مطالعه ما این تحقیق را گسترش میدهد و سوگیری کلاس خاص DA را در مجموعه دادههای مختلف، از جمله آنهایی که از ImageNet مجزا هستند، از طریق برش تصادفی بررسی میکند. ما این پدیده را با ResNet50، EfficientNetV2S و SWIN ViT ارزیابی کردیم، و کشف کردیم که در حالی که مدلهای باقیمانده اثرات سوگیری مشابهی را نشان میدهند، Vision Transformers استحکام بیشتری یا دینامیک تغییر یافته نشان میدهند. این یک رویکرد ظریف برای انتخاب مدل را نشان می دهد که بر کاهش تعصب تاکید دارد. ما همچنین یک روش «پیشبینی استحکام تقویت دادهها» را برای مدیریت مؤثرتر سوگیریهای ناشی از DA، کاهش چشمگیر تقاضاهای محاسباتی (آموزش 112 مدل به جای 1860؛ کاهش ضریب 16.2) در حالی که همچنان روندهای سوگیری اساسی را ثبت میکنیم، اصلاح کردیم.
1 مقدمه
یادگیری ماشینی به طور کلی به عنوان هدف سیستم ها برای حل، یا “یادگیری” یک کار خاص یا مجموعه ای از وظایف (مانند رگرسیون، طبقه بندی، ترجمه ماشینی، …) تعریف می شود.