جدول پیوندها
چکیده و 1 مقدمه
2. کارهای مرتبط
3. روش و 3.1. معماری
3.2. ضرر و 3.3. جزئیات پیاده سازی
4. بررسی داده ها
4.1. مجموعه داده های آموزشی
4.2. معیار ارزیابی
5. آزمایش ها و 5.1. معیارها
5.2. خطوط پایه
5.3. مقایسه با روش های SOTA
5.4. نتایج کیفی و 5.5. مطالعه ابلیشن
6. محدودیت ها و بحث
7. نتیجه گیری و مراجع
الف. مقایسه کیفی اضافی
ب. استنباط در مورد تصاویر تولید شده توسط هوش مصنوعی
ج. جزئیات مدیریت داده
4. بررسی داده ها
4.1. مجموعه داده های آموزشی
ما از تمام 55 دسته ShapeNetCore.v2 استفاده می کنیم [6] برای مجموع حدود 52 هزار مش، و همچنین بیش از 1000 دسته از Objaverse-LVIS [9] زیر مجموعه این زیرمجموعه Objaverse بهصورت دستی توسط کارگران جمعی فیلتر شده است تا بهجای سایر داراییها مانند اسکن صحنهها و ساختمانهای بزرگ، مشهای اشیاء را در خود جای دهد. پس از فیلتر Objaverse-LVIS برای حذف اجسام با حداقل هندسه (مثلاً اشیاء متشکل از یک صفحه) این مجموعه داده دارای 42K مش است. ادغام این دو منبع داده در مجموع بیش از 90 هزار مش شی 3 بعدی از بیش از 1000 دسته به ما می دهد.
ما از بلندر استفاده می کنیم [41] برای تولید تصاویر مصنوعی از مش های سه بعدی، و استخراج انواع حاشیه نویسی مفید: نقشه های عمق، ذات دوربین، و ژست شی و دوربین. زیرا شی …