HyperHuman معیار جدیدی را برای واقع گرایی و دقت ژست در تولید تصویر انسانی تعیین می کند

نویسندگان:

(1) Xian Liu، Snap Inc.، CUHK با کارهای انجام شده در طول دوره کارآموزی در Snap Inc.

(2) جیان رن، شرکت اسنپ با نویسنده مسئول: [email protected];

(3) Aliaksandr Siarohin، Snap Inc.

(4) ایوان اسکوروخودوف، شرکت اسنپ؛

(5) Yanyu Li، Snap Inc.

(6) داهوا لین، CUHK؛

(7) Xihui Liu، HKU;

(8) Ziwei Liu، NTU;

(9) سرگئی تولیاکوف، شرکت اسنپ.

چکیده و 1 مقدمه

2 کارهای مرتبط

3 رویکرد ما و 3.1 مقدمات و تنظیم مشکل

3.2 مدل نفوذ ساختاری پنهان

3.3 پالایشگر هدایت شده ساختار

4 مجموعه داده انسان آیه

5 آزمایش

5.1 نتایج اصلی

5.2 مطالعه فرسایش

6 بحث و مراجع

یک ضمیمه و A.1 نتایج کمی اضافی

A.2 جزئیات بیشتر پیاده سازی و A.3 نتایج بیشتر مطالعه Ablation

A.4 جزئیات بیشتر مطالعه کاربر

الف.5 تأثیر استحکام بذر و مدل تصادفی و تأثیر مرزی الف.6 و ملاحظات اخلاقی

A.7 نتایج مقایسه بیشتر و A.8 نتایج کیفی اضافی

A.9 مجوزها

5.1 نتایج اصلی

معیارهای ارزیابی ما معیارهای پرکاربرد را برای مقایسه جامع از سه منظر اتخاذ می کنیم: 1) کیفیت تصویر. FID، KID، و FIDCLIP برای انعکاس کیفیت و تنوع استفاده می شود. 2) تراز متن-تصویر، که در آن شباهت CLIP بین متن و جاسازی تصویر گزارش شده است. 3) دقت ژست. ما از …

Source link