روش‌های جدیدی که تشخیص گفتار را برای همه کارآمد می‌کنیم

فن‌آوری‌های فعال‌شده با صدا، مانند Google Home یا Google Assistant، می‌توانند به افراد کمک کنند کارهایی مانند برقراری تماس تلفنی با شخصی، تنظیم نور خانه یا پخش آهنگ مورد علاقه‌شان را انجام دهند – همه با صدای آنها. اما این فناوری‌ها ممکن است برای میلیون‌ها نفر در سراسر جهان که گفتار غیر استاندارد دارند، به خوبی کار نکنند. در سال 2019، پروژه Euphonia ابتکاری تحقیقاتی خود را با هدف یافتن راه‌هایی برای استفاده از هوش مصنوعی برای دسترسی بیشتر به فناوری تشخیص گفتار راه‌اندازی کردیم.

امروز، ما در حال گسترش این تعهد به دسترسی از طریق مشارکت در پروژه دسترسی به گفتار، همکاری بین محققان دانشگاه ایلینویز Urbana-Champaign و پنج شرکت فناوری از جمله Google هستیم. این دانشگاه با گروه‌های حمایتی مانند تیم گلیسون و بنیاد دیویس فینی کار می‌کند تا مجموعه داده‌هایی از گفتار آسیب‌دیده ایجاد کند که می‌تواند به سرعت بخشیدن به بهبود تشخیص خودکار گفتار (ASR) برای جوامعی که این سازمان‌ها از آنها حمایت می‌کنند کمک کند.

از زمان راه‌اندازی پروژه Euphonia، ما این فرصت را داشته‌ایم که با سازمان‌های اجتماعی برای جمع‌آوری مجموعه‌ای از نمونه‌های گفتار از بیش از 2000 نفر کار کنیم. این مجموعه از گفته‌ها به محققان پروژه Euphonia اجازه داده است تا سیستم‌های تشخیص گفتار استاندارد را برای درک دقیق‌تر گفتار غیراستاندارد تطبیق دهند و در نهایت میزان خطای متوسط ​​کلمات را به طور متوسط ​​بیش از 80% کاهش دهند. این نتایج امیدوارکننده پایه‌ای را برای Project Relate ایجاد کرد، یک برنامه اندرویدی که به افراد امکان می‌دهد نمونه‌هایی از صدای خود را ارسال کنند و یک مدل تشخیص گفتار شخصی‌شده دریافت کنند که گفتار آنها را با دقت بیشتری درک می‌کند. همچنین توسعه Project Euphonia را تشویق کرد که شامل زبان‌های دیگری مانند فرانسوی، ژاپنی و اسپانیایی باشد.

هنوز کارهای زیادی باید انجام شود تا سیستم‌های ASR که می‌توانند صدای همه را بدون توجه به الگوی گفتار درک کنند، انجام دهیم. با این حال، واضح است که مجموعه داده‌های بزرگتر و متنوع‌تر و همکاری با جوامعی که می‌خواهیم به آنها برسیم، به ما کمک می‌کند تا به جایی که می‌خواهیم برویم. به همین دلیل است که ما اشتراک‌گذاری نسخه‌های ضبط‌شده خود را در پروژه دسترسی به گفتار برای شرکت‌کنندگان Project Euphonia آسان می‌کنیم. امید ما این است که با در دسترس قرار دادن این مجموعه داده ها در اختیار تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه، از جمله افراد دارای معلولیت، کمک کنیم.

سئو PBN | خبر های جدید سئو و هک و سرور