یک رویکرد داده محور برای تعصب خاص کلاس در تقویت داده های تصویر: چکیده و مقدمه

نویسندگان:

(1) آتاناسیوس آنجلاکیس، مرکز پزشکی دانشگاه آمستردام، دانشگاه آمستردام – مرکز علوم داده، موسسه تحقیقات بهداشت عمومی آمستردام، آمستردام، هلند

(2) آندری راس، دن هاگ، هلند.

چکیده

افزایش داده ها (DA) تعمیم مدل را در بینایی کامپیوتر افزایش می دهد، اما ممکن است سوگیری هایی را ایجاد کند که دقت کلاس را به طور ناموزونی تحت تاثیر قرار دهد. مطالعه ما این تحقیق را گسترش می‌دهد و سوگیری کلاس خاص DA را در مجموعه داده‌های مختلف، از جمله آن‌هایی که از ImageNet مجزا هستند، از طریق برش تصادفی بررسی می‌کند. ما این پدیده را با ResNet50، EfficientNetV2S و SWIN ViT ارزیابی کردیم، و کشف کردیم که در حالی که مدل‌های باقیمانده اثرات سوگیری مشابهی را نشان می‌دهند، Vision Transformers استحکام بیشتری یا دینامیک تغییر یافته نشان می‌دهند. این یک رویکرد ظریف برای انتخاب مدل را نشان می دهد که بر کاهش تعصب تاکید دارد. ما همچنین یک روش «پیش‌بینی استحکام تقویت داده‌ها» را برای مدیریت مؤثرتر سوگیری‌های ناشی از DA، کاهش چشمگیر تقاضاهای محاسباتی (آموزش 112 مدل به جای 1860؛ کاهش ضریب 16.2) در حالی که همچنان روندهای سوگیری اساسی را ثبت می‌کنیم، اصلاح کردیم.

1 مقدمه

یادگیری ماشینی به طور کلی به عنوان هدف سیستم ها برای حل، یا “یادگیری” یک کار خاص یا مجموعه ای از وظایف (مانند رگرسیون، طبقه بندی، ترجمه ماشینی، …) تعریف می شود.

Source link