جدول پیوندها
چکیده و 1 مقدمه
2. کارهای مرتبط
3. روش و 3.1. استراتژی هدایت ترکیبی
3.2. رسیدگی به هویت های چندگانه
3.3. آموزش
4. آزمایشات
4.1. جزئیات پیاده سازی
4.2. نتایج
5. نتیجه گیری و مراجع
5. نتیجه گیری
در این مقاله، ما یک رویکرد نوآورانه برای تولید متن به تصویر ارائه میکنیم که به طور خاص بر حفظ هویت در تصاویر سنتز شده تمرکز دارد. روش ما به طور قابل توجهی کارایی فرآیند تولید تصویر را تسریع و افزایش می دهد. محور رویکرد ما، استراتژی هدایت ترکیبی است که تصاویر سبک و صورت را با پیامهای متنی ترکیب میکند و فرآیند تولید تصویر را به شیوهای منسجم هدایت میکند. یکی از ویژگیهای برجسته روش ما توانایی آن در ترکیب تصاویر چند انسانی است که به لطف مکانیسمهای توجه متقابل چند هویتی توسعهیافته ما است. ارزیابی های تجربی گسترده ما، هم از نظر کیفی و هم کمی، مزایای روش ما را نشان داده است. از چندین جنبه کلیدی، به ویژه در کارایی و توانایی حفظ یکپارچگی هویت در تصاویر سنتز شده، از مدل های پایه و کارهای قبلی پیشی می گیرد.
محدودیت و تأثیرات اجتماعی. در مقایسه با آثار موجود مانند DreamBooth [43]، که تصاویری از موضوعات مختلف مانند حیوانات و اشیاء را ترکیب می کند، مدل ما …