بعدی برای توسعه SDXL چیست؟

نویسندگان:

(1) داستین پودل، هوش مصنوعی پایداری، تحقیقات کاربردی؛

(2) Zion English، Stability AI، Applied Research.

(3) کایل لیسی، هوش مصنوعی پایداری، تحقیقات کاربردی.

(4) آندریاس بلاتمن، هوش مصنوعی پایداری، تحقیقات کاربردی؛

(5) تیم داکهورن، هوش مصنوعی پایداری، تحقیقات کاربردی؛

(6) یوناس مولر، هوش مصنوعی پایداری، تحقیقات کاربردی.

(7) جو پنا، هوش مصنوعی پایداری، تحقیقات کاربردی؛

(8) رابین رومباخ، هوش مصنوعی پایداری، تحقیقات کاربردی.

چکیده و 1 مقدمه

2 بهبود انتشار پایدار

2.1 معماری و مقیاس

2.2 میکرو تهویه

2.3 آموزش چند جنبه

2.4 Autoencoder بهبود یافته و 2.5 قرار دادن همه چیز در کنار هم

3 کار آینده

ضمیمه

A قدردانی

B محدودیت ها

مدل های انتشار C

D مقایسه با وضعیت هنر

مقایسه E با Midjourney نسخه 5.1

F در مورد ارزیابی FID مدلهای بنیادی متن-تصویر مولد

G مقایسه اضافی بین خط لوله SDXL تک مرحله ای و دو مرحله ای

مراجع

3 کار آینده

این گزارش یک تحلیل اولیه از پیشرفت‌های مدل پایه انتشار پایدار برای سنتز متن به تصویر ارائه می‌کند. در حالی که ما به بهبودهای قابل توجهی در کیفیت تصویر ترکیبی، پایبندی و ترکیب بندی سریع دست یابیم، در ادامه، چند جنبه را مورد بحث قرار می دهیم که معتقدیم این مدل ممکن است بیشتر بهبود یابد:

• تک مرحله ای: در حال حاضر، ما تولید…

Source link