نویسندگان:
(1) Zhaoqing Wang، دانشگاه سیدنی و AI2Robotics.
(2) Xiaobo Xia، دانشگاه سیدنی.
(3) Ziye Chen، دانشگاه ملبورن.
(4) Xiao He، AI2Robotics.
(5) Yandong Guo، AI2Robotics؛
(6) مینگ مینگ گونگ، دانشگاه ملبورن و دانشگاه هوش مصنوعی محمد بن زاید.
(7) Tongliang Liu، دانشگاه سیدنی.
جدول پیوندها
چکیده و 1. مقدمه
2. آثار مرتبط
3. روش و 3.1. تعریف مشکل
3.2. پایه و 3.3. چارچوب Uni-OVSeg
4. آزمایشات
4.1. جزئیات پیاده سازی
4.2. نتایج اصلی
4.3. مطالعه ابلیشن
5. نتیجه گیری
6. تأثیرات و مراجع گسترده تر
الف. جزئیات چارچوب
ب. تقسیم بندی سریع
ج. تجسم
الف. جزئیات چارچوب
ورودی ها. برای تصاویر ورودی، ابتدا یک چرخش افقی تصادفی برای هر تصویر اعمال می کنیم. پس از آن، تصویر به طور تصادفی با وضوح در محدوده 716 × 716 تا 1075 × 1075 رزولوشن مقیاس بندی می شود. در نهایت، یک برش با وضوح 896 × 896 از تصویر مقیاس شده استخراج می شود تا به عنوان ورودی استفاده شود. در مورد نام دسته ها، ما با استفاده از یک دستور یک جمله می سازیم و با استفاده از رمزگذاری جفت بایت با حروف کوچک (BPE) آن را نشانه گذاری می کنیم. برای اعلان بصری، یک شبکه یکنواخت از نقاط با ابعاد h × w ایجاد می کنیم که با مرکز پیکسل ها تراز است.
کلیپ…