نویسندگان:
(1) آبراهام اوودونی، Intron Health، Masakhane، و این نویسنده به طور مساوی کمک کردند.
(2) Aditya Yadavalli، Karya، Masakhane، و این نویسنده به طور مساوی کمک کردند.
(3) کریس Emezuem، موسسه هوش مصنوعی Mila Quebec، Lanfrica، Masakhane، و این نویسنده به همان اندازه مشارکت داشتند.
(4) Tobi Olatunji، Intron Health و Masakhane، و این نویسنده به همان اندازه مشارکت داشتند.
(5) کلینتون امباتاکو، هوش مصنوعی شنبه لاگوس.
جدول پیوندها
چکیده و 1 مقدمه
2 کارهای مرتبط
3 AccentFold
4 AccentFold چه اطلاعاتی را ضبط می کند؟
5 مطالعه تجربی AccentFold
6 نتیجه گیری، محدودیت ها و مراجع
3 AccentFold
این بخش به تشریح مراحل مربوط به توسعه AccentFold میپردازد.
3.1 مجموعه داده
ما از مجموعه داده Afrispeech-200 (Olatunji et al., 2023b) برای این کار استفاده می کنیم، یک مجموعه گفتار پان آفریقایی برجسته با بیش از 200 ساعت ضبط صدا، 120 لهجه، 2463 سخنران منحصر به فرد، 57٪ زن، از 13 کشور برای بالینی و دامنه عمومی ASR. تا جایی که ما می دانیم، این مجموعه متنوع ترین لهجه های آفریقایی است و بنابراین تمرکز کار ما است. جدول 1 آمار مجموعه داده کامل را نشان می دهد و جدول 3 بر آمار تاکیدی مجموعه داده Afrispeech-200 تمرکز دارد. با 120 لهجه، مجموعه داده طیف گسترده ای از لهجه های آفریقایی را پوشش می دهد. کل مجموعه داده می تواند …