نویسندگان:
(1) آبراهام اوودونی، Intron Health، Masakhane، و این نویسنده به طور مساوی کمک کردند.
(2) Aditya Yadavalli، Karya، Masakhane، و این نویسنده به طور مساوی کمک کردند.
(3) کریس Emezuem، موسسه هوش مصنوعی Mila Quebec، Lanfrica، Masakhane، و این نویسنده به همان اندازه مشارکت داشتند.
(4) Tobi Olatunji، Intron Health و Masakhane، و این نویسنده به همان اندازه مشارکت داشتند.
(5) کلینتون امباتاکو، هوش مصنوعی شنبه لاگوس.
جدول پیوندها
چکیده و 1 مقدمه
2 کارهای مرتبط
3 AccentFold
4 AccentFold چه اطلاعاتی را ضبط می کند؟
5 مطالعه تجربی AccentFold
6 نتیجه گیری، محدودیت ها و مراجع
5 مطالعه تجربی AccentFold
5.1 فرمول مسئله
در این مطالعه تجربی، ما تصمیم گرفتیم بفهمیم که چینهای تاکیدی چقدر برای عملکرد ASR شات صفر سطح تاکیدی آموزنده هستند. برای دستیابی به این هدف، ما وظیفه آزمایشی خود را به صورت زیر طراحی کردیم: فرض کنید که مولد مجموعه داده اوراکل زیر را داریم:
5.2 راه اندازی آزمایشی
جزئیات تنظیم دقیق: ما از یک مدل XLSR از پیش آموزش دیده (Conneau et al., 2020) برای آزمایشات خود استفاده می کنیم. مدل XLSR مدل wav2vec 2.0 (Baevski et al., 2020) را به تنظیمات بین زبانی گسترش می دهد و برای به دست آوردن بازنمایی گفتار بین زبانی از طریق استفاده از یک مدل تکی که از قبل با استفاده از شکل موج های گفتاری خام از انواع مختلف آموزش داده شده است، آموزش داده شده است. زبان ها …