WildlifeDatasets: یک ابزار منبع باز برای شناسایی مجدد حیوانات: ارزیابی عملکرد

6. ارزیابی عملکرد

بینش‌های حاصل از مطالعات فرسایشی ما منجر به ایجاد MegaDescriptors – مدل‌های مبتنی بر ترانسفورماتور Swin بهینه‌سازی شده با از دست دادن ArcFace و فراپارامترهای بهینه با استفاده از همه مجموعه داده‌های شناسایی مجدد حیوانات در دسترس عموم شد.

به منظور تأیید نتایج مورد انتظار، ما یک مقایسه مشابه در یادگیری متریک در مقابل حذف ویژگی‌های محلی انجام می‌دهیم و MegaDescriptor را با CLIP (ViT-L/p14-336)، ImageNet-1k (Swin-B/p4-) مقایسه می‌کنیم. w7-224) و مدل های از پیش آموزش دیده DINOv2 (ViT-L/p14-518). MegaDescriptor پیشنهادی با ستون فقرات Swin-L/p4-w12-384 به طور مداوم بر روی همه مجموعه‌های داده عمل می‌کند و از همه روش‌ها در تمام ۲۹ مجموعه داده عملکرد بهتری دارد. شایان ذکر است، مدل پایه مدرن تقریباً برای هر کار بینایی – DINOv2 – با اندازه ورودی بسیار بالاتر (518 × 518) و ستون فقرات بزرگتر در شناسایی مجدد حیوانات عملکرد ضعیفی دارد.

جدول 4. عملکرد شناسایی مجدد حیوانات.  ما MegaDescriptor-L (Swin-L/p4-w12-384) را در بین مدل های از پیش آموزش دیده موجود مقایسه می کنیم، به عنوان مثال، ImageNet-1k (Swin-B/p4-w7-224)، CLIP (ViT-L/p14-336)، و DINOv2 (ViT-L/p14-518).  MegaDescriptor-L پیشنهادی عملکرد ثابتی را در تمام مجموعه‌های داده ارائه می‌دهد و از همه روش‌ها در تمام ۲۹ مجموعه داده بهتر است.جدول 4. عملکرد شناسایی مجدد حیوانات.  ما MegaDescriptor-L (Swin-L/p4-w12-384) را در بین مدل های از پیش آموزش دیده موجود مقایسه می کنیم، به عنوان مثال، ImageNet-1k (Swin-B/p4-w7-224)، CLIP (ViT-L/p14-336)، و DINOv2 (ViT-L/p14-518).  MegaDescriptor-L پیشنهادی عملکرد ثابتی را در تمام مجموعه‌های داده ارائه می‌دهد و از همه روش‌ها در تمام ۲۹ مجموعه داده بهتر است.

6.1. عملکرد دامنه دیده شده و دیده نشده

این بخش نشان می‌دهد که چگونه MegaDescriptor پیشنهادی می‌تواند به طور موثر از ویژگی‌های آموخته‌شده از مجموعه داده‌های مختلف و توانایی آن برای تعمیم فراتر از مجموعه داده‌هایی که در ابتدا به‌خوبی تنظیم شده بود، استفاده کند. با انجام این آزمایش، ما سعی می‌کنیم عملکرد MegaDescriptor را در Seen (شناخته) و Unseen Domain (ناشناس) تقلید کنیم.

ما قابلیت های تعمیم را با استفاده از…

Source link