یادگیری زبان می تواند فرصت های جدیدی را در زندگی فرد باز کند. این می تواند به افراد کمک کند با فرهنگ های مختلف ارتباط برقرار کنند، به جهان سفر کنند و شغل خود را ارتقا دهند. تخمین زده می شود که زبان انگلیسی به تنهایی 1.5 میلیارد زبان آموز در سراسر جهان دارد. با این حال، دستیابی به مهارت در یک زبان جدید دشوار است، و بسیاری از زبان آموزان کمبود فرصت برای تمرین فعالانه صحبت کردن و دریافت بازخورد عملی را به عنوان مانعی برای یادگیری ذکر می کنند.
ما هیجانزده هستیم که ویژگی جدیدی از جستجوی Google را اعلام کنیم که به افراد کمک میکند صحبت کردن را تمرین کنند و مهارتهای زبانی خود را بهبود بخشند. ظرف چند روز آینده، کاربران اندروید در آرژانتین، کلمبیا، هند (هندی)، اندونزی، مکزیک و ونزوئلا میتوانند از طریق تمرین مکالمه تعاملی به زبان انگلیسی از پشتیبانی زبان بیشتری از Google برخوردار شوند – در آینده به کشورها و زبانهای بیشتری گسترش خواهند یافت. جستجوی Google در حال حاضر یک ابزار ارزشمند برای زبان آموزان است که ترجمه، تعاریف و منابع دیگر را برای بهبود واژگان ارائه می دهد. اکنون زبان آموزان در حال ترجمه هستند به یا از جانب انگلیسی در تلفنهای اندرویدی آنها تجربه جدیدی از تمرین مکالمه انگلیسی را با بازخورد شخصی پیدا میکند.
![]() |
ویژگی جدید جستجوی گوگل به زبان آموزان اجازه می دهد برای تمرین گفتن کلمات در متن |
به فراگیران پیام های واقعی ارائه می شود و سپس پاسخ های گفتاری خود را با استفاده از یک کلمه واژگان ارائه شده تشکیل می دهند. آنها در جلسات تمرینی 3 تا 5 دقیقه ای شرکت می کنند، بازخورد شخصی دریافت می کنند و گزینه ثبت نام برای یادآوری های روزانه برای ادامه تمرین را دارند. تنها با یک گوشی هوشمند و مقداری زمان با کیفیت، زبان آموزان می توانند در هر زمان و هر مکان با سرعت خود تمرین کنند.
فعالیت هایی با بازخورد شخصی، برای تکمیل ابزارهای یادگیری موجود
ویژگی جدید تمرین صحبت کردن در جستجوی Google که برای استفاده در کنار سایر خدمات و منابع آموزشی، مانند آموزش شخصی، برنامه های تلفن همراه و کلاس ها طراحی شده است، ابزار دیگری برای کمک به زبان آموزان در سفر است.
ما با زبان شناسان، معلمان، و کارشناسان آموزشی ESL/EFL همکاری کرده ایم تا یک تجربه تمرین گفتاری موثر و انگیزشی ایجاد کنیم. زبانآموزان واژگان را در زمینههای معتبر تمرین میکنند، و مطالب در فواصل زمانی پویا برای افزایش ماندگاری تکرار میشوند – رویکردهایی که شناخته شدهاند در کمک به زبانآموزان برای تبدیل شدن به سخنرانان مطمئن موثر هستند. همانطور که یکی از شرکای ما به اشتراک گذاشت:
“صحبت کردن در یک زمینه خاص مهارتی است که زبان آموزان اغلب فرصت تمرین آن را ندارند. بنابراین این ابزار برای تکمیل کلاس ها و سایر منابع بسیار مفید است.” – جودیت کورموس، استاد دانشگاه لنکستر
ما همچنین از همکاری با چندین شریک یادگیری زبان برای ارائه محتوایی که به ایجاد آنها کمک می کنند و ارتباط آنها با زبان آموزان در سراسر جهان هیجان زده هستیم. ما مشتاقانه منتظر گسترش بیشتر این برنامه و همکاری با هر شریک علاقه مند هستیم.
بازخورد در زمان واقعی شخصی
هر یادگیرنده متفاوت است، بنابراین ارائه بازخورد شخصی در زمان واقعی بخش کلیدی تمرین موثر است. پاسخ ها برای ارائه پیشنهادات و اصلاحات مفید و در زمان واقعی تجزیه و تحلیل می شوند.
سیستم می دهد بازخورد معنایی، نشان می دهد که آیا پاسخ آنها به سؤال مربوط است و ممکن است توسط یک طرف گفتگو قابل درک باشد یا خیر. بازخورد گرامر بینش هایی را در مورد بهبودهای دستوری احتمالی و مجموعه ای از نمونه پاسخ در سطوح مختلف پیچیدگی زبان، پیشنهادهای ملموسی برای راههای جایگزین برای پاسخ دادن در این زمینه ارائه میدهد.
![]() |
بازخورد از سه عنصر تشکیل شده است: تحلیل معنایی، تصحیح دستور زبان، و پاسخ های مثال. |
ترجمه متنی
در میان چندین فناوری جدید که توسعه دادهایم، ترجمه متنی توانایی ترجمه کلمات و عبارات جداگانه را فراهم میکند در متن. در طول جلسات تمرین، زبان آموزان می توانند روی هر کلمه ای که نمی فهمند ضربه بزنند تا ترجمه آن کلمه را با توجه به متن آن ببینند.
![]() |
نمونه ای از ویژگی ترجمه متنی. |
این یک کار فنی دشوار است، زیرا کلمات منفرد به طور جداگانه اغلب دارای چندین معانی جایگزین هستند و کلمات متعدد می توانند خوشه هایی از معنا را تشکیل دهند که باید به صورت هماهنگ ترجمه شوند. رویکرد جدید ما کل جمله را ترجمه میکند، سپس تخمین میزند که چگونه کلمات موجود در متن اصلی و متن ترجمه شده با یکدیگر ارتباط دارند. این معمولاً به عنوان مشکل هم ترازی کلمات شناخته می شود.
![]() |
مثالی از یک جفت جمله ترجمه شده و تراز کلمات آن. یک مدل تراز یادگیری عمیق، کلمات مختلفی را که معنی ایجاد میکنند برای پیشنهاد ترجمه به هم متصل میکند. |
فناوری کلیدی که این قابلیت را فعال می کند، یک مدل یادگیری عمیق جدید است که با همکاری تیم مترجم گوگل به نام Deep Aligner توسعه یافته است. ایده اصلی این است که یک مدل زبان چندزبانه آموزش داده شده بر روی صدها زبان، سپس یک مدل تراز جدید را بر روی مجموعهای از نمونههای همترازی کلمات (به شکل بالا برای مثال ببینید) که توسط متخصصان انسانی ارائه شده است، برای چندین جفت زبان تنظیم کنید. پس از این، مدل واحد میتواند هر جفت زبانی را بهطور دقیق تراز کند و به نرخ خطای همترازی پیشرفته برسد (AER، معیاری برای اندازهگیری کیفیت همترازی کلمات، جایی که کمتر بهتر است). این مدل جدید منجر به بهبود چشمگیر کیفیت تراز در تمام جفتهای زبان آزمایش شده شده است و میانگین AER را از 25% به 5% در مقایسه با رویکردهای تراز مبتنی بر مدلهای مارکوف پنهان (HMM) کاهش میدهد.
![]() |
نرخ خطای تراز (کمتر بهتر) بین انگلیسی (EN) و سایر زبان ها. |
این مدل همچنین در APIهای ترجمه Google گنجانده شده است، به عنوان مثال، قالببندی فایلهای PDF ترجمه شده و وبسایتها در کروم، ترجمه زیرنویسهای یوتیوب و بهبود API ترجمه Google Cloud را بسیار بهبود میبخشد.
بازخورد گرامر
برای فعال کردن بازخورد دستور زبان برای زبان گفتاری تاکیدی، تیمهای تحقیقاتی ما مدلهای تصحیح دستور زبان را برای متن نوشتاری (به وبلاگ و مقاله مراجعه کنید) برای کار روی رونویسیهای تشخیص خودکار گفتار (ASR) بهویژه برای مورد گفتار تاکیدی اقتباس کردند. مرحله کلیدی تنظیم دقیق مدل متن نوشته شده بر روی مجموعه ای از رونوشت های انسانی و ASR از گفتار تاکیدی، با اصلاحات دستور زبان ارائه شده توسط متخصص بود. علاوه بر این، با الهام از کار قبلی، تیم ها یک نمایش خروجی مبتنی بر ویرایش جدید ایجاد کردند که از همپوشانی زیاد بین ورودی ها و خروجی ها استفاده می کند که به ویژه برای جملات ورودی کوتاه رایج در تنظیمات یادگیری زبان مناسب است.
نمایش ویرایش را می توان با استفاده از یک مثال توضیح داد:
- ورودی: من1 صبح2 بنابراین3 بد4 پخت و پز5
- تصحیح: من1 صبح2 بنابراین3 بد4 در5 پخت و پز6
- ویرایش ها: (‘at’, 4, preposition, 4)
در بالا، “at” کلمه ای است که در موقعیت 4 درج شده است و “PREPOSITION” نشان می دهد که این یک خطا در موارد اضافه است. ما از تگ خطا برای انتخاب آستانه های پذیرش وابسته به برچسب استفاده کردیم که مدل را بیشتر بهبود بخشید. این مدل یادآوری مشکلات گرامری را از 4.6٪ به 35٪ افزایش داد.
چند نمونه خروجی از مدل ما و یک مدل آموزش داده شده بر روی پیکره های نوشته شده:
مثال 1 | مثال 2 | |||
ورودی کاربر (گفتار رونویسی شده) |
من با حرفه ام زندگی می کنم. | به یک کارت کارآمد و قابل اعتماد نیاز دارم. | ||
مدل گرامر مبتنی بر متن |
من با حرفه ام زندگی می کنم. | به یک کارت کارآمد و قابل اعتماد نیاز دارم. | ||
مدل جدید بهینه شده برای گفتار |
من با حرفه ام زندگی می کنم. | به یک کارت کارآمد و قابل اعتماد نیاز دارم. |
تحلیل معنایی
هدف اصلی مکالمه این است که قصد خود را به وضوح بیان کنیم. بنابراین، ما یک ویژگی طراحی کردیم که به صورت بصری به یادگیرنده ارتباط برقرار می کند که آیا پاسخ آنها با زمینه مرتبط بوده و توسط یک شریک قابل درک است یا خیر. این یک مشکل فنی دشوار است، زیرا پاسخ های گفتاری زبان آموزان اولیه می تواند از نظر نحوی غیر متعارف باشد. ما باید با دقت این فناوری را متعادل میکردیم تا بر وضوح هدف به جای صحت نحو تمرکز کنیم.
سیستم ما از ترکیبی از دو رویکرد استفاده می کند:
- حساسیت طبقهبندی: مدلهای زبانی بزرگ مانند LaMDA یا PalM برای ارائه پاسخهای طبیعی در یک مکالمه طراحی شدهاند، بنابراین جای تعجب نیست که آنها در عکس به خوبی عمل میکنند: قضاوت در مورد اینکه آیا یک پاسخ داده شده از نظر متنی معقول است یا خیر.
- شباهت به پاسخ های خوب: ما از یک معماری رمزگذار برای مقایسه ورودی یادگیرنده با مجموعه ای از پاسخ های خوب شناخته شده در یک فضای تعبیه معنایی استفاده کردیم. این مقایسه سیگنال مفید دیگری را در مورد ارتباط معنایی ارائه میکند و کیفیت بازخوردها و پیشنهاداتی را که ارائه میدهیم بهبود میبخشد.
![]() |
این سیستم بازخوردی را در مورد اینکه آیا پاسخ مربوط به اعلان است یا خیر، ارائه می دهد و توسط یک شریک ارتباطی قابل درک است. |
توسعه محتوا به کمک ML
فعالیتهای عملی موجود ما ترکیبی از محتوای ایجاد شده توسط متخصصان انسانی و محتوایی را ارائه میکند که با کمک هوش مصنوعی و بررسی انسانی ایجاد شده است. این شامل اعلانهای گفتاری، تمرکز کلمات، و همچنین مجموعهای از پاسخهای نمونه است که پاسخهای معنادار و متنی را نشان میدهد.
![]() |
هنگامی که یادگیرنده بازخورد دریافت می کند و هنگامی که روی دکمه راهنما ضربه می زند، فهرستی از پاسخ های نمونه ارائه می شود. |
از آنجایی که زبان آموزان سطوح مختلف توانایی دارند، پیچیدگی زبانی محتوا باید به طور مناسب تنظیم شود. کار قبلی بر روی تخمین پیچیدگی زبان بر متنی با طول پاراگراف یا طولانی تر تمرکز دارد که به طور قابل توجهی با نوع پاسخ هایی که سیستم ما پردازش می کند متفاوت است. بنابراین، مدلهای جدیدی را توسعه دادیم که میتوانند پیچیدگی یک جمله، عبارت، یا حتی تک تک کلمات را تخمین بزنند. این چالش برانگیز است زیرا حتی یک عبارت متشکل از کلمات ساده می تواند برای یک زبان آموز سخت باشد (به عنوان مثال، “بیایید به تعقیب و گریز”). با استفاده از مجموعه بزرگی از نمونههای دارای برچسب LLM، از قبل آموزش داده شده و سپس با استفاده از مجموعه دادههای برچسبگذاری شده با متخصص انسانی تنظیم دقیق شده است.
![]() |
میانگین مربعات خطای عملکرد رویکردهای مختلف در برآورد دشواری محتوا در مجموعه متنوعی از 450 متن مکالمه (متن / رونویسی). ردیف بالا: ارزیابهای انسانی اقلام را در مقیاسی از 0.0 تا 5.0، تقریباً با مقیاس CEFR (از A1 تا C2) برچسبگذاری کردند. چهار ردیف پایین: مدل های مختلف کار یکسانی را انجام دادند و ما تفاوت را به اجماع متخصصان انسانی نشان می دهیم. |
با استفاده از این مدل، میتوانیم دشواری آیتمهای متنی را ارزیابی کنیم، طیف متنوعی از پیشنهادات را ارائه کنیم و مهمتر از همه، فراگیران را متناسب با سطوح تواناییشان به چالش بکشیم. برای مثال، با استفاده از مدل خود برای برچسبگذاری نمونهها، میتوانیم سیستم خود را برای ایجاد اعلانهای گفتاری در سطوح مختلف پیچیدگی زبان تنظیم کنیم.
کلمات تمرکز بر واژگان، که توسط سوالات استخراج می شوند | ||||||
گیتار | سیب | شیر نر | ||||
ساده | دوست داری چی بازی کنی؟ | میوه دوست داری؟ | آیا گربه های بزرگ را دوست دارید؟ | |||
حد واسط | آیا آلات موسیقی می نوازی؟ | میوه مورد علاقه ات چیه؟ | حیوان مورد علاقه شما چیست؟ | |||
مجتمع | از نواختن چه ساز زهی لذت می برید؟ | از خوردن کدام نوع میوه به دلیل بافت ترد و طعم شیرین آن لذت می برید؟ | آیا از تماشای شکارچیان بزرگ و قدرتمند لذت می برید؟ |
علاوه بر این، از تخمین دشواری محتوا برای افزایش تدریجی دشواری کار در طول زمان و انطباق با پیشرفت یادگیرنده استفاده می شود.
نتیجه
با این آخرین بهروزرسانیها، که در چند روز آینده عرضه میشوند، جستجوی Google حتی مفیدتر شده است. اگر کاربر اندروید در هند (هندی)، اندونزی، آرژانتین، کلمبیا، مکزیک یا ونزوئلا هستید، آن را با ترجمه امتحان کنید. به یا از جانب انگلیسی با گوگل
ما مشتاق هستیم که در آینده به کشورها و زبان های بیشتری گسترش دهیم و به زودی محتوای تمرینی شریک را ارائه دهیم.
سپاسگزاریها
افراد زیادی در توسعه این پروژه مشارکت داشتند. در میان بسیاری دیگر، ما از مشاوران خارجی خود در زمینه یادگیری زبان تشکر می کنیم: جفری داویتز، جودیت کورموس، دبورا هیلی، آنیتا بولز، سوزان گار، آندریا ریوز، بردلی اوپاتز، و آن مک کواد.