جستجوی صوتی Google – آیا تا به حال امکان پذیر است؟

آیا هرگز برای Google امکان ایجاد فهرست محتوای صوتی وجود دارد که کاربران بتوانند مانند صفحات وب از طریق آن جستجو کنند؟

نتایج آزمایشات اولیه ، که گوگل در یک مقاله وبلاگ منتشر کرده است ، نشان می دهد انجام جستجو صوتی دشوارتر از آن است که به نظر می رسد.

جزئیات این آزمایشات در مقاله ای به قلم تیم اولسون ، SVP مشارکت های استراتژیک دیجیتال در KQED به اشتراک گذاشته شده است.

گوگل با یک همکاری مشترک KQED در تلاش است تا صدا را بیشتر قابل فهم کند.

با کمک KUNGFU.AI ، یک ارائه دهنده خدمات هوش مصنوعی ، Google و KQED آزمایشاتی را برای تعیین نحوه رونویسی صدا به روش سریع و بدون خطا انجام دادند.

آنچه کشف کردند در اینجا است.

مشکلات جستجوی صوتی

بزرگترین مانع ایجاد امکان جستجوی صوتی این واقعیت است که صدا قبل از جستجو و مرتب سازی باید به متن تبدیل شود.

تبلیغات

ادامه مطلب را در زیر بخوانید

در حال حاضر هیچ راهی برای رونویسی دقیق صدا به گونه ای وجود ندارد که امکان پیدا کردن سریع آن را فراهم کند.

تنها راهی که امکان جستجوی صوتی در مقیاس جهانی وجود دارد ، رونویسی خودکار است. ناشران از نسخه های دستی زمان و تلاش زیادی می گیرند.

اولسون از KQED اشاره می کند که چگونه نوار دقت برای رونویسی صوتی باید بالا باشد ، به ویژه هنگامی که صحبت از فهرست بندی اخبار صوتی می شود. پیشرفت های صورت گرفته تاکنون در گفتار به متن در حال حاضر با آن استانداردها مطابقت ندارد.

محدودیت های فن آوری گفتار به متن فعلی

Google با استفاده از جدیدترین ابزار گفتار به متن در مجموعه اخبار صوتی ، آزمایشاتی را با KQED و KUNGFU.AI انجام داد.

محدودیتهایی در توانایی هوش مصنوعی در شناسایی اسامی مناسب (که به آنها نهادهای نامگذاری شده نیز می گویند) کشف شد.

تبلیغات

ادامه مطلب را در زیر بخوانید

اشخاص نامگذاری شده برای درک دقیق بعضی اوقات نیاز به زمینه دارند تا دقیقاً مشخص شوند ، که هوش مصنوعی همیشه ندارد.

اولسون مثالی از اخبار صوتی KQED را بیان می کند که شامل سخنرانی پر از اشخاص نام برده و متناسب با منطقه خلیج است:

“صدای محلی اخبار KQED سرشار از ارجاعات به اشخاص نامدار مربوط به موضوعات ، افراد ، مکان ها و سازمان هایی است که متناسب با منطقه منطقه خلیج هستند. بلندگوها از کلمات اختصاری مانند “CHP” برای بزرگراه کالیفرنیا و “شبه جزیره” برای منطقه ای که از سانفرانسیسکو تا سن خوزه پوشیده شده استفاده می کنند. شناسایی این موارد برای هوش مصنوعی دشوارتر است. “

وقتی موجودیت های نامگذاری شده درک نشوند ، هوش مصنوعی بهترین حدس را در مورد گفته ها می زند. با این حال ، این یک راه حل غیرقابل قبول برای جستجوی وب است ، زیرا یک رونویسی نادرست می تواند معنای کل گفته ها را تغییر دهد.

بعدی چیست

کار در زمینه جستجوی صوتی با برنامه هایی برای دسترسی گسترده فناوری به هنگام توسعه ، ادامه خواهد یافت.

دیوید استولر ، سرپرست شریک اخبار و انتشارات در Google ، می گوید وقتی کار روی این پروژه به پایان برسد ، این فناوری به طور آشکار به اشتراک گذاشته می شود.

“یکی از ارکان ابتکار جدید Google جوجه کشی رویکردهای جدید برای مشکلات دشوار است. پس از تکمیل ، این فناوری و بهترین روش های مرتبط به طور آشکار به اشتراک گذاشته می شوند و تأثیر پیش بینی شده را بسیار گسترش می دهند. “

اولسون از KQED می گوید ، مدلهای یادگیری ماشینی امروز از اشتباهات خود درس نمی گیرند ، جایی که انسان ممکن است لازم باشد وارد عمل شود.

مرحله بعدی آزمایش یک حلقه بازخورد است که در آن اتاق های خبر با شناسایی خطاهای رایج در رونویسی به بهبود مدل های یادگیری ماشین کمک می کنند.

تبلیغات

ادامه مطلب را در زیر بخوانید

“ما اطمینان داریم که در آینده نزدیک ، پیشرفت در این مدل گفتار به متن به تبدیل سریعتر صدا به متن کمک می کند و در نهایت به افراد کمک می کند تا اخبار صوتی را به طور موثرتری پیدا کنند.”

منبع: گوگل

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>