مجموعه داده‌ها و روش‌های ارزیابی برای وظایف تقسیم‌بندی واژگان باز

نویسندگان:

(1) Zhaoqing Wang، دانشگاه سیدنی و AI2Robotics.

(2) Xiaobo Xia، دانشگاه سیدنی.

(3) Ziye Chen، دانشگاه ملبورن.

(4) Xiao He، AI2Robotics.

(5) Yandong Guo، AI2Robotics؛

(6) مینگ مینگ گونگ، دانشگاه ملبورن و دانشگاه هوش مصنوعی محمد بن زاید.

(7) Tongliang Liu، دانشگاه سیدنی.

چکیده و 1. مقدمه

2. آثار مرتبط

3. روش و 3.1. تعریف مشکل

3.2. پایه و 3.3. چارچوب Uni-OVSeg

4. آزمایشات

4.1. جزئیات پیاده سازی

4.2. نتایج اصلی

4.3. مطالعه ابلیشن

5. نتیجه گیری

6. تأثیرات و مراجع گسترده تر

الف. جزئیات چارچوب

ب. تقسیم بندی سریع

ج. تجسم

4.1. جزئیات پیاده سازی

مجموعه داده ها. در طول آموزش، ما به طور تصادفی زیر مجموعه 30٪ را از مجموعه داده SA-1B نمونه برداری می کنیم [34]که حاوی حدود 3 میلیون تصویر و 0.3 میلیارد ماسک است. اگرچه این نظارت ماسک های باینری متنوعی را ارائه می دهد، اما فاقد کلاس معنایی برای هر ماسک است. علاوه بر این، پیروی از Chen et al. [8]، ما حدود 1.3 میلیون جفت تصویر-متن را جمع آوری می کنیم و از یک مدل بزرگ بینایی-زبان برای اصلاح آنها استفاده می کنیم. پس از آن، ما از تجزیه کننده مبتنی بر ChatGPT برای استخراج موجودیت هایی با کلمات توصیفی از این توضیحات متنی استفاده می کنیم.

ارزیابی و معیارها ما مدل خود را عمدتاً بر روی سه مورد ارزیابی می کنیم …

Source link