مدل هوش مصنوعی مولد: GANs (بخش 3)

توجه: در بالا تصویری است که توسط Stable Diffusion تولید شده است. یک نمونه کلاسیک از هوش مصنوعی مولد!

به پایان هیجان انگیز سری Generative AI خوش آمدید. در قسمت 1 این سری، اجزای مختلف GAN ها را کشف کردیم. در حالی که در بخش 2، یک مفهوم بسیار مهم از آنتروپی متقاطع بررسی شده است. قبل از رفتن به این وبلاگ، لطفاً قسمت 1 و قسمت 2 را نیز مطالعه کنید. در این قسمت پایانی قصد داریم سری به نسخه های پیشرفته GAN ها بزنیم.

وبلاگ‌های قبلی توضیح می‌دهند که یک مدل پایه کلی از GANها چگونه به نظر می‌رسد و چه توابعی از دست دادن اساسی برای آن استفاده می‌شود. با گذشت زمان، پیشرفت‌های مختلفی در این زمینه صورت گرفته است و GAN‌ها توانسته‌اند محتوای بهتر و بهتری را با قابلیت‌های اضافی بر اساس برنامه‌های کاربردی مختلف تولید کنند. بیایید اینها را بررسی کنیم:

تکنیک های پیشرفته در GAN ها:

GANهای شرطی (cGAN)

سناریویی را تصور کنید که در آن – به جای اینکه فقط تصاویری از مجموعه ای از تصاویر تولید کنید – می توانید آنچه را که قرار است تولید شود، توصیف کنید. cGAN ها توانایی تولید تصاویر بر اساس توضیحات را دارند. به عنوان مثال، “تصویر یک گربه با خز سیاه و عینک زدن را ایجاد کنید”.

اما چگونه cGAN ها می توانند این کار را در جایی که GAN ها نمی توانند انجام دهند؟

دلیل: GAN ها معمولاً تصاویر را بر اساس نویز تصادفی ایجاد می کنند (به قسمت 1 مراجعه کنید)، در حالی که در cGAN ها، نویز تنظیم می شود …

Source link