زبان آموزان انگلیسی اکنون می توانند صحبت کردن را در جستجو – وبلاگ تحقیقاتی گوگل تمرین کنند

یادگیری زبان می تواند فرصت های جدیدی را در زندگی فرد باز کند. این می تواند به افراد کمک کند با فرهنگ های مختلف ارتباط برقرار کنند، به جهان سفر کنند و شغل خود را ارتقا دهند. تخمین زده می شود که زبان انگلیسی به تنهایی 1.5 میلیارد زبان آموز در سراسر جهان دارد. با این حال، دستیابی به مهارت در یک زبان جدید دشوار است، و بسیاری از زبان آموزان کمبود فرصت برای تمرین فعالانه صحبت کردن و دریافت بازخورد عملی را به عنوان مانعی برای یادگیری ذکر می کنند.

ما هیجان‌زده هستیم که ویژگی جدیدی از جستجوی Google را اعلام کنیم که به افراد کمک می‌کند صحبت کردن را تمرین کنند و مهارت‌های زبانی خود را بهبود بخشند. ظرف چند روز آینده، کاربران اندروید در آرژانتین، کلمبیا، هند (هندی)، اندونزی، مکزیک و ونزوئلا می‌توانند از طریق تمرین مکالمه تعاملی به زبان انگلیسی از پشتیبانی زبان بیشتری از Google برخوردار شوند – در آینده به کشورها و زبان‌های بیشتری گسترش خواهند یافت. جستجوی Google در حال حاضر یک ابزار ارزشمند برای زبان آموزان است که ترجمه، تعاریف و منابع دیگر را برای بهبود واژگان ارائه می دهد. اکنون زبان آموزان در حال ترجمه هستند به یا از جانب انگلیسی در تلفن‌های اندرویدی آن‌ها تجربه جدیدی از تمرین مکالمه انگلیسی را با بازخورد شخصی پیدا می‌کند.

ویژگی جدید جستجوی گوگل به زبان آموزان اجازه می دهد
برای تمرین گفتن کلمات در متن

به فراگیران پیام های واقعی ارائه می شود و سپس پاسخ های گفتاری خود را با استفاده از یک کلمه واژگان ارائه شده تشکیل می دهند. آنها در جلسات تمرینی 3 تا 5 دقیقه ای شرکت می کنند، بازخورد شخصی دریافت می کنند و گزینه ثبت نام برای یادآوری های روزانه برای ادامه تمرین را دارند. تنها با یک گوشی هوشمند و مقداری زمان با کیفیت، زبان آموزان می توانند در هر زمان و هر مکان با سرعت خود تمرین کنند.

فعالیت هایی با بازخورد شخصی، برای تکمیل ابزارهای یادگیری موجود

ویژگی جدید تمرین صحبت کردن در جستجوی Google که برای استفاده در کنار سایر خدمات و منابع آموزشی، مانند آموزش شخصی، برنامه های تلفن همراه و کلاس ها طراحی شده است، ابزار دیگری برای کمک به زبان آموزان در سفر است.

ما با زبان شناسان، معلمان، و کارشناسان آموزشی ESL/EFL همکاری کرده ایم تا یک تجربه تمرین گفتاری موثر و انگیزشی ایجاد کنیم. زبان‌آموزان واژگان را در زمینه‌های معتبر تمرین می‌کنند، و مطالب در فواصل زمانی پویا برای افزایش ماندگاری تکرار می‌شوند – رویکردهایی که شناخته شده‌اند در کمک به زبان‌آموزان برای تبدیل شدن به سخنرانان مطمئن موثر هستند. همانطور که یکی از شرکای ما به اشتراک گذاشت:

“صحبت کردن در یک زمینه خاص مهارتی است که زبان آموزان اغلب فرصت تمرین آن را ندارند. بنابراین این ابزار برای تکمیل کلاس ها و سایر منابع بسیار مفید است.” – جودیت کورموس، استاد دانشگاه لنکستر

ما همچنین از همکاری با چندین شریک یادگیری زبان برای ارائه محتوایی که به ایجاد آنها کمک می کنند و ارتباط آنها با زبان آموزان در سراسر جهان هیجان زده هستیم. ما مشتاقانه منتظر گسترش بیشتر این برنامه و همکاری با هر شریک علاقه مند هستیم.

مطالب پیشنهادی  پیش‌آموزش منطقه‌ای برای تشخیص اشیا با واژگان باز با ترانسفورماتورهای بینایی – وبلاگ تحقیقاتی گوگل

بازخورد در زمان واقعی شخصی

هر یادگیرنده متفاوت است، بنابراین ارائه بازخورد شخصی در زمان واقعی بخش کلیدی تمرین موثر است. پاسخ ها برای ارائه پیشنهادات و اصلاحات مفید و در زمان واقعی تجزیه و تحلیل می شوند.

سیستم می دهد بازخورد معنایی، نشان می دهد که آیا پاسخ آنها به سؤال مربوط است و ممکن است توسط یک طرف گفتگو قابل درک باشد یا خیر. بازخورد گرامر بینش هایی را در مورد بهبودهای دستوری احتمالی و مجموعه ای از نمونه پاسخ در سطوح مختلف پیچیدگی زبان، پیشنهادهای ملموسی برای راه‌های جایگزین برای پاسخ دادن در این زمینه ارائه می‌دهد.

بازخورد از سه عنصر تشکیل شده است: تحلیل معنایی، تصحیح دستور زبان، و پاسخ های مثال.

ترجمه متنی

در میان چندین فناوری جدید که توسعه داده‌ایم، ترجمه متنی توانایی ترجمه کلمات و عبارات جداگانه را فراهم می‌کند در متن. در طول جلسات تمرین، زبان آموزان می توانند روی هر کلمه ای که نمی فهمند ضربه بزنند تا ترجمه آن کلمه را با توجه به متن آن ببینند.

نمونه ای از ویژگی ترجمه متنی.

این یک کار فنی دشوار است، زیرا کلمات منفرد به طور جداگانه اغلب دارای چندین معانی جایگزین هستند و کلمات متعدد می توانند خوشه هایی از معنا را تشکیل دهند که باید به صورت هماهنگ ترجمه شوند. رویکرد جدید ما کل جمله را ترجمه می‌کند، سپس تخمین می‌زند که چگونه کلمات موجود در متن اصلی و متن ترجمه شده با یکدیگر ارتباط دارند. این معمولاً به عنوان مشکل هم ترازی کلمات شناخته می شود.

مثالی از یک جفت جمله ترجمه شده و تراز کلمات آن. یک مدل تراز یادگیری عمیق، کلمات مختلفی را که معنی ایجاد می‌کنند برای پیشنهاد ترجمه به هم متصل می‌کند.

فناوری کلیدی که این قابلیت را فعال می کند، یک مدل یادگیری عمیق جدید است که با همکاری تیم مترجم گوگل به نام Deep Aligner توسعه یافته است. ایده اصلی این است که یک مدل زبان چندزبانه آموزش داده شده بر روی صدها زبان، سپس یک مدل تراز جدید را بر روی مجموعه‌ای از نمونه‌های هم‌ترازی کلمات (به شکل بالا برای مثال ببینید) که توسط متخصصان انسانی ارائه شده است، برای چندین جفت زبان تنظیم کنید. پس از این، مدل واحد می‌تواند هر جفت زبانی را به‌طور دقیق تراز کند و به نرخ خطای هم‌ترازی پیشرفته برسد (AER، معیاری برای اندازه‌گیری کیفیت هم‌ترازی کلمات، جایی که کمتر بهتر است). این مدل جدید منجر به بهبود چشمگیر کیفیت تراز در تمام جفت‌های زبان آزمایش شده شده است و میانگین AER را از 25% به 5% در مقایسه با رویکردهای تراز مبتنی بر مدل‌های مارکوف پنهان (HMM) کاهش می‌دهد.

نرخ خطای تراز (کمتر بهتر) بین انگلیسی (EN) و سایر زبان ها.

این مدل همچنین در APIهای ترجمه Google گنجانده شده است، به عنوان مثال، قالب‌بندی فایل‌های PDF ترجمه شده و وب‌سایت‌ها در کروم، ترجمه زیرنویس‌های یوتیوب و بهبود API ترجمه Google Cloud را بسیار بهبود می‌بخشد.

بازخورد گرامر

برای فعال کردن بازخورد دستور زبان برای زبان گفتاری تاکیدی، تیم‌های تحقیقاتی ما مدل‌های تصحیح دستور زبان را برای متن نوشتاری (به وبلاگ و مقاله مراجعه کنید) برای کار روی رونویسی‌های تشخیص خودکار گفتار (ASR) به‌ویژه برای مورد گفتار تاکیدی اقتباس کردند. مرحله کلیدی تنظیم دقیق مدل متن نوشته شده بر روی مجموعه ای از رونوشت های انسانی و ASR از گفتار تاکیدی، با اصلاحات دستور زبان ارائه شده توسط متخصص بود. علاوه بر این، با الهام از کار قبلی، تیم ها یک نمایش خروجی مبتنی بر ویرایش جدید ایجاد کردند که از همپوشانی زیاد بین ورودی ها و خروجی ها استفاده می کند که به ویژه برای جملات ورودی کوتاه رایج در تنظیمات یادگیری زبان مناسب است.

مطالب پیشنهادی  نقشه های زبان بصری برای ناوبری ربات - وبلاگ هوش مصنوعی گوگل

نمایش ویرایش را می توان با استفاده از یک مثال توضیح داد:

  • ورودی: من1 صبح2 بنابراین3 بد4 پخت و پز5
  • تصحیح: من1 صبح2 بنابراین3 بد4 در5 پخت و پز6
  • ویرایش ها: (‘at’, 4, preposition, 4)

در بالا، “at” کلمه ای است که در موقعیت 4 درج شده است و “PREPOSITION” نشان می دهد که این یک خطا در موارد اضافه است. ما از تگ خطا برای انتخاب آستانه های پذیرش وابسته به برچسب استفاده کردیم که مدل را بیشتر بهبود بخشید. این مدل یادآوری مشکلات گرامری را از 4.6٪ به 35٪ افزایش داد.

چند نمونه خروجی از مدل ما و یک مدل آموزش داده شده بر روی پیکره های نوشته شده:

مثال 1 مثال 2

ورودی کاربر (گفتار رونویسی شده)

من با حرفه ام زندگی می کنم. به یک کارت کارآمد و قابل اعتماد نیاز دارم.

مدل گرامر مبتنی بر متن

من با حرفه ام زندگی می کنم. به یک کارت کارآمد و قابل اعتماد نیاز دارم.

مدل جدید بهینه شده برای گفتار

من با حرفه ام زندگی می کنم. به یک کارت کارآمد و قابل اعتماد نیاز دارم.

تحلیل معنایی

هدف اصلی مکالمه این است که قصد خود را به وضوح بیان کنیم. بنابراین، ما یک ویژگی طراحی کردیم که به صورت بصری به یادگیرنده ارتباط برقرار می کند که آیا پاسخ آنها با زمینه مرتبط بوده و توسط یک شریک قابل درک است یا خیر. این یک مشکل فنی دشوار است، زیرا پاسخ های گفتاری زبان آموزان اولیه می تواند از نظر نحوی غیر متعارف باشد. ما باید با دقت این فناوری را متعادل می‌کردیم تا بر وضوح هدف به جای صحت نحو تمرکز کنیم.

سیستم ما از ترکیبی از دو رویکرد استفاده می کند:

  1. حساسیت طبقه‌بندی: مدل‌های زبانی بزرگ مانند LaMDA یا PalM برای ارائه پاسخ‌های طبیعی در یک مکالمه طراحی شده‌اند، بنابراین جای تعجب نیست که آنها در عکس به خوبی عمل می‌کنند: قضاوت در مورد اینکه آیا یک پاسخ داده شده از نظر متنی معقول است یا خیر.
  2. شباهت به پاسخ های خوب: ما از یک معماری رمزگذار برای مقایسه ورودی یادگیرنده با مجموعه ای از پاسخ های خوب شناخته شده در یک فضای تعبیه معنایی استفاده کردیم. این مقایسه سیگنال مفید دیگری را در مورد ارتباط معنایی ارائه می‌کند و کیفیت بازخوردها و پیشنهاداتی را که ارائه می‌دهیم بهبود می‌بخشد.
این سیستم بازخوردی را در مورد اینکه آیا پاسخ مربوط به اعلان است یا خیر، ارائه می دهد و توسط یک شریک ارتباطی قابل درک است.

توسعه محتوا به کمک ML

فعالیت‌های عملی موجود ما ترکیبی از محتوای ایجاد شده توسط متخصصان انسانی و محتوایی را ارائه می‌کند که با کمک هوش مصنوعی و بررسی انسانی ایجاد شده است. این شامل اعلان‌های گفتاری، تمرکز کلمات، و همچنین مجموعه‌ای از پاسخ‌های نمونه است که پاسخ‌های معنادار و متنی را نشان می‌دهد.

هنگامی که یادگیرنده بازخورد دریافت می کند و هنگامی که روی دکمه راهنما ضربه می زند، فهرستی از پاسخ های نمونه ارائه می شود.

از آنجایی که زبان آموزان سطوح مختلف توانایی دارند، پیچیدگی زبانی محتوا باید به طور مناسب تنظیم شود. کار قبلی بر روی تخمین پیچیدگی زبان بر متنی با طول پاراگراف یا طولانی تر تمرکز دارد که به طور قابل توجهی با نوع پاسخ هایی که سیستم ما پردازش می کند متفاوت است. بنابراین، مدل‌های جدیدی را توسعه دادیم که می‌توانند پیچیدگی یک جمله، عبارت، یا حتی تک تک کلمات را تخمین بزنند. این چالش برانگیز است زیرا حتی یک عبارت متشکل از کلمات ساده می تواند برای یک زبان آموز سخت باشد (به عنوان مثال، “بیایید به تعقیب و گریز”). با استفاده از مجموعه بزرگی از نمونه‌های دارای برچسب LLM، از قبل آموزش داده شده و سپس با استفاده از مجموعه داده‌های برچسب‌گذاری شده با متخصص انسانی تنظیم دقیق شده است.

میانگین مربعات خطای عملکرد رویکردهای مختلف در برآورد دشواری محتوا در مجموعه متنوعی از 450 متن مکالمه (متن / رونویسی). ردیف بالا: ارزیاب‌های انسانی اقلام را در مقیاسی از 0.0 تا 5.0، تقریباً با مقیاس CEFR (از A1 تا C2) برچسب‌گذاری کردند. چهار ردیف پایین: مدل های مختلف کار یکسانی را انجام دادند و ما تفاوت را به اجماع متخصصان انسانی نشان می دهیم.

با استفاده از این مدل، می‌توانیم دشواری آیتم‌های متنی را ارزیابی کنیم، طیف متنوعی از پیشنهادات را ارائه کنیم و مهم‌تر از همه، فراگیران را متناسب با سطوح توانایی‌شان به چالش بکشیم. برای مثال، با استفاده از مدل خود برای برچسب‌گذاری نمونه‌ها، می‌توانیم سیستم خود را برای ایجاد اعلان‌های گفتاری در سطوح مختلف پیچیدگی زبان تنظیم کنیم.

کلمات تمرکز بر واژگان، که توسط سوالات استخراج می شوند
گیتار سیب شیر نر
ساده دوست داری چی بازی کنی؟ میوه دوست داری؟ آیا گربه های بزرگ را دوست دارید؟
حد واسط آیا آلات موسیقی می نوازی؟ میوه مورد علاقه ات چیه؟ حیوان مورد علاقه شما چیست؟
مجتمع از نواختن چه ساز زهی لذت می برید؟ از خوردن کدام نوع میوه به دلیل بافت ترد و طعم شیرین آن لذت می برید؟ آیا از تماشای شکارچیان بزرگ و قدرتمند لذت می برید؟

علاوه بر این، از تخمین دشواری محتوا برای افزایش تدریجی دشواری کار در طول زمان و انطباق با پیشرفت یادگیرنده استفاده می شود.

نتیجه

با این آخرین به‌روزرسانی‌ها، که در چند روز آینده عرضه می‌شوند، جستجوی Google حتی مفیدتر شده است. اگر کاربر اندروید در هند (هندی)، اندونزی، آرژانتین، کلمبیا، مکزیک یا ونزوئلا هستید، آن را با ترجمه امتحان کنید. به یا از جانب انگلیسی با گوگل

ما مشتاق هستیم که در آینده به کشورها و زبان های بیشتری گسترش دهیم و به زودی محتوای تمرینی شریک را ارائه دهیم.

سپاسگزاریها

افراد زیادی در توسعه این پروژه مشارکت داشتند. در میان بسیاری دیگر، ما از مشاوران خارجی خود در زمینه یادگیری زبان تشکر می کنیم: جفری داویتز، جودیت کورموس، دبورا هیلی، آنیتا بولز، سوزان گار، آندریا ریوز، بردلی اوپاتز، و آن مک کواد.

سئو PBN | خبر های جدید سئو و هک و سرور
مطالب پیشنهادی  یک مدل آب و هوای عصبی پیشرفته موجود در محصولات Google - وبلاگ تحقیقاتی Google