OpenVoice: شبیه سازی فوری صدای همه کاره – آزمایش

نویسندگان:

(1) Zengyi Qin، MIT و MyShell.ai و (ایمیل: [email protected])

(2) Wenliang Zhao، دانشگاه Tsinghua;

(3) Xumin Yu، دانشگاه Tsinghua;

(4 ) Xin Sun، MyShell.ai;

چکیده و مقدمه

رویکرد
آزمایش کنید

بحث و مراجع

3 آزمایش کنید

ارزیابی شبیه سازی صدا به دلایل متعددی دشوار است. اول، مطالعات تحقیقاتی مختلف (به عنوان مثال، [8]، [2]) معمولاً مجموعه های آموزشی و تست متفاوتی دارند. مقایسه عددی می تواند ذاتاً ناعادلانه باشد. حتی معیارهای آنها مانند میانگین امتیاز نظر را می توان با جمع سپاری ارزیابی کرد، تنوع و دشواری مجموعه آزمون به طور قابل توجهی بر نتایج تأثیر می گذارد. به عنوان مثال، اگر بسیاری از نمونه‌ها در مجموعه آزمایشی صداهای عصبی هستند که بر میانگین توزیع صدای انسان تمرکز می‌کنند، در این صورت دستیابی به نتایج شبیه‌سازی صدا برای اکثر روش‌ها نسبتاً آسان است. دوم، مطالعات مختلف معمولاً مجموعه‌های آموزشی متفاوتی دارند، که در آن مقیاس و تنوع تأثیر قابل‌توجهی بر نتایج خواهد داشت. سوم، مطالعات مختلف می‌توانند تمرکز متفاوتی بر عملکردهای اصلی خود داشته باشند. OpenVoice عمدتاً شبیه‌سازی رنگ تن، کنترل انعطاف‌پذیر بر پارامترهای سبک، و آسان کردن شبیه‌سازی صدای چندزبانه حتی بدون داده‌های انبوه بلندگو برای یک زبان جدید است. اینها…

Source link