ارزیابی امکان سنجی و دقت مدل های تربیت طوطی

چکیده و مقدمه

پیشینه و انگیزه

آموزش طوطی: امکان سنجی و ارزیابی

نسل PT-AE: دیدگاه قابل انتقال و ادراک مشترک

بهینه سازی حملات PT-AE جعبه سیاه

ارزیابی های تجربی

کار مرتبط

نتیجه گیری و مراجع

ضمیمه

III. آموزش طوطی: امکان سنجی و ارزیابی

در این بخش به بررسی امکان سنجی ایجاد گفتار طوطی برای آموزش طوطی می پردازیم. از آنجایی که گفتار طوطی، گفتار تک شات است که با روش VC سنتز شده است، ابتدا پیشرفته ترین روش VC را معرفی می کنیم، سپس یک روش دو مرحله ای برای تولید گفتار طوطی پیشنهاد می کنیم و در نهایت ارزیابی می کنیم که چگونه یک مدل PT می تواند یک عدد را تقریب بزند. مدل GT

A. تبدیل صدای یک شات

ترکیب داده ها: تولید داده با ویژگی های خاص معمولاً در حوزه تصویر استفاده می شود، از جمله تبدیل داده های موجود از طریق افزایش داده ها [92]، [98]، [80]، [98]، تولید داده های آموزشی مشابه از طریق شبکه های متخاصم مولد (GAN) [50]، [35]، [18]و ایجاد تغییرات جدید از داده های موجود توسط رمزگذارهای خودکار متغیر (VAE) [62]، [48]، [53]، [24]. این رویکردها را می توان در حوزه صوتی مانند تقویت گفتار نیز یافت [63]، [90]، [64]، [69]، سنتز گفتار مبتنی بر GAN [33]، [65]، [59]، [21]و سنتز گفتار مبتنی بر VAE [62]، [55]، [117]. به طور خاص، VC …

Source link