فنآوریهای فعالشده با صدا، مانند Google Home یا Google Assistant، میتوانند به افراد کمک کنند کارهایی مانند برقراری تماس تلفنی با شخصی، تنظیم نور خانه یا پخش آهنگ مورد علاقهشان را انجام دهند – همه با صدای آنها. اما این فناوریها ممکن است برای میلیونها نفر در سراسر جهان که گفتار غیر استاندارد دارند، به خوبی کار نکنند. در سال 2019، پروژه Euphonia ابتکاری تحقیقاتی خود را با هدف یافتن راههایی برای استفاده از هوش مصنوعی برای دسترسی بیشتر به فناوری تشخیص گفتار راهاندازی کردیم.
امروز، ما در حال گسترش این تعهد به دسترسی از طریق مشارکت در پروژه دسترسی به گفتار، همکاری بین محققان دانشگاه ایلینویز Urbana-Champaign و پنج شرکت فناوری از جمله Google هستیم. این دانشگاه با گروههای حمایتی مانند تیم گلیسون و بنیاد دیویس فینی کار میکند تا مجموعه دادههایی از گفتار آسیبدیده ایجاد کند که میتواند به سرعت بخشیدن به بهبود تشخیص خودکار گفتار (ASR) برای جوامعی که این سازمانها از آنها حمایت میکنند کمک کند.
از زمان راهاندازی پروژه Euphonia، ما این فرصت را داشتهایم که با سازمانهای اجتماعی برای جمعآوری مجموعهای از نمونههای گفتار از بیش از 2000 نفر کار کنیم. این مجموعه از گفتهها به محققان پروژه Euphonia اجازه داده است تا سیستمهای تشخیص گفتار استاندارد را برای درک دقیقتر گفتار غیراستاندارد تطبیق دهند و در نهایت میزان خطای متوسط کلمات را به طور متوسط بیش از 80% کاهش دهند. این نتایج امیدوارکننده پایهای را برای Project Relate ایجاد کرد، یک برنامه اندرویدی که به افراد امکان میدهد نمونههایی از صدای خود را ارسال کنند و یک مدل تشخیص گفتار شخصیشده دریافت کنند که گفتار آنها را با دقت بیشتری درک میکند. همچنین توسعه Project Euphonia را تشویق کرد که شامل زبانهای دیگری مانند فرانسوی، ژاپنی و اسپانیایی باشد.
هنوز کارهای زیادی باید انجام شود تا سیستمهای ASR که میتوانند صدای همه را بدون توجه به الگوی گفتار درک کنند، انجام دهیم. با این حال، واضح است که مجموعه دادههای بزرگتر و متنوعتر و همکاری با جوامعی که میخواهیم به آنها برسیم، به ما کمک میکند تا به جایی که میخواهیم برویم. به همین دلیل است که ما اشتراکگذاری نسخههای ضبطشده خود را در پروژه دسترسی به گفتار برای شرکتکنندگان Project Euphonia آسان میکنیم. امید ما این است که با در دسترس قرار دادن این مجموعه داده ها در اختیار تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه، از جمله افراد دارای معلولیت، کمک کنیم.