گوگل یک تحقیق موفقیت آمیز در زمینه پردازش زبان طبیعی به نام Chain of Thought Prompting را اعلام کرد که وضعیت فن آوری های پیشرفته مانند PalM و LaMDA را به سطح قابل توجهی ارتقا می دهد.
این واقعیت که Chain of Thought Prompting می تواند PALM و LaMDA را با این نرخ های قابل توجه بهبود بخشد، موضوع بزرگی است.
LaMDA و PalM
این تحقیق آزمایشهایی را با استفاده از دو مدل زبان، مدل زبان برای کاربردهای گفتگو (LaMDA) و مدل زبان مسیرها (PaLM) انجام داد.
LaMDA یک مدل متمرکز بر مکالمه است، مانند یک ربات چت، اما همچنین می تواند برای بسیاری از برنامه های کاربردی دیگر که نیاز به صحبت کردن و گفتگو دارند، استفاده شود.
PaLM مدلی است که از آنچه گوگل معماری هوش مصنوعی Pathways می نامد پیروی می کند که در آن یک مدل زبان برای یادگیری نحوه حل مشکلات آموزش می بیند.
پیش از این، مدلهای یادگیری ماشین برای حل یک نوع مشکل آموزش داده میشدند و اساساً برای انجام آن یک کار بهخوبی رها میشدند. اما برای انجام کار دیگری، گوگل باید مدل جدیدی را آموزش دهد.
معماری هوش مصنوعی Pathways راهی برای ایجاد مدلی است که می تواند مشکلاتی را حل کند که لزوماً قبلاً ندیده است.
همانطور که در توضیح Google PalM نقل شده است:
ما میخواهیم مدلی را آموزش دهیم که نهتنها میتواند بسیاری از وظایف مجزا را انجام دهد، بلکه مهارتهای موجود خود را برای یادگیری سریعتر و موثرتر از مهارتهای موجود استفاده کرده و ترکیب میکند.»
چکار میکند
مقاله تحقیقاتی سه پیشرفت مهم را برای استدلال زنجیرهای فکری فهرست میکند:
- این به مدل های زبان اجازه می دهد تا مسائل پیچیده چند مرحله ای را به ترتیبی از مراحل تجزیه کنند
- زنجیره فرآیند فکر به مهندسان اجازه می دهد تا به فرآیند نگاه کنند و زمانی که همه چیز اشتباه می شود، این به آنها امکان می دهد شناسایی کنند که کجا اشتباه بوده و آن را برطرف کنند.
- می تواند مسائل کلمه ریاضی را حل کند، می تواند استدلال عقل سلیم را انجام دهد و طبق مقاله پژوهشی می تواند (در اصل) هر مسئله مبتنی بر کلمه را که یک انسان می تواند حل کند.
وظایف استدلال چند مرحله ای
این تحقیق نمونهای از یک کار استدلال چند مرحلهای را ارائه میکند که مدلهای زبانی روی آن آزمایش میشوند:
س: کافه تریا 23 سیب داشت. اگر از 20 عدد برای ناهار استفاده کردند و 6 عدد دیگر خریدند، چند عدد سیب دارند؟
ج: کافه تریا در ابتدا 23 سیب داشت. برای تهیه ناهار از 20 عدد استفاده کردند. بنابراین آنها 23 – 20 = 3 داشتند. آنها 6 سیب دیگر خریدند، بنابراین آنها 3 + 6 = 9 دارند. پاسخ 9 است.
PalM یک مدل زبان پیشرفته است که بخشی از معماری هوش مصنوعی Pathways است. آنقدر پیشرفته است که می تواند توضیح دهد که چرا یک جوک خنده دار است.
با این حال، همانطور که PALM پیشرفته است، محققان ادعا می کنند که Chain of Thought Prompting به طور قابل توجهی این مدل ها را بهبود می بخشد، و این چیزی است که باعث می شود این تحقیق جدید بسیار شایسته توجه باشد.
گوگل آن را اینگونه توضیح می دهد:
استدلال زنجیره ای فکری به مدل ها اجازه می دهد تا مسائل پیچیده را به مراحل میانی تجزیه کنند که به صورت جداگانه حل می شوند.
علاوه بر این، ماهیت زنجیرهای فکر مبتنی بر زبان، آن را برای هر کاری که شخص میتواند از طریق زبان حل کند، قابل استفاده است.
سپس مقاله تحقیقاتی به این نکته اشاره میکند که وقتی مقیاس مدل افزایش مییابد، اعلان استاندارد واقعاً بهبود نمییابد.
اما با این رویکرد جدید، مقیاس تأثیر مثبت و قابل توجهی بر میزان عملکرد مدل دارد.
نتایج
Chain of Thought Prompting بر روی LaMDA و PalM با استفاده از دو مجموعه داده ریاضی مشکل کلمه آزمایش شد.
این مجموعه داده ها توسط محققان به عنوان راهی برای مقایسه نتایج در مورد مسائل مشابه برای مدل های زبانی مختلف استفاده می شود.
در زیر تصاویری از نمودارها را نشان می دهد که نتایج استفاده از Chain of Thought Prompting در LaMDA را نشان می دهد.
نتایج مقیاسگذاری LaMDA روی مجموعه داده MultiArith نشان میدهد که منجر به بهبود مختصری شده است. اما LaMDA هنگامی که با Chain of Thought Prompting مقیاس بندی می شود به طور قابل توجهی امتیاز بیشتری کسب می کند.
نتایج مربوط به مجموعه داده GSM8K یک بهبود متوسط را نشان می دهد.
این یک داستان متفاوت با مدل زبان PalM است.
همانطور که در نمودار بالا مشاهده میشود، سود حاصل از مقیاسگذاری PaLM با Chain of Thought Prompting بسیار زیاد است و برای هر دو مجموعه داده (MultiArith و GSM8K) بسیار زیاد است.
محققان نتایج را قابل توجه و یک وضعیت جدید از هنر می نامند:
در مجموعه دادههای GSM8K از مسائل کلمات ریاضی، PaLM عملکرد قابلتوجهی را هنگامی که به پارامترهای 540B مقیاسبندی میشود، نشان میدهد.
ترکیب زنجیره افکار با پارامتر 540B مدل PaLM منجر به عملکرد پیشرفته 58 درصدی می شود که از 55 درصد پیشرفت قبلی که با تنظیم دقیق GPT-3 175B در یک تمرین بزرگ به دست آمده بود، پیشی می گیرد. راه حل های بالقوه را از طریق یک تأیید کننده آموزش دیده تنظیم و رتبه بندی کنید.
علاوه بر این، کار پیگیری روی خودسازگاری نشان میدهد که عملکرد زنجیره افکار را میتوان با اخذ اکثریت رای از مجموعه گستردهای از فرآیندهای استدلال تولید شده، که منجر به دقت 74% در GSM8K میشود، بهبود بخشید.
نتیجه گیری
نتیجهگیری یک مقاله تحقیقاتی یکی از مهمترین بخشهایی است که میتوان بررسی کرد که آیا تحقیق پیشرفت کرده است یا بنبست است یا به تحقیقات بیشتری نیاز دارد.
بخش نتیجه گیری مقاله تحقیقاتی گوگل یک نکته بسیار مثبت دارد.
اشاره می کند:
“ما زنجیره افکار را به عنوان یک روش ساده و به طور گسترده برای تقویت استدلال در مدل های زبان بررسی کرده ایم.
از طریق آزمایشهایی روی استدلالهای حسابی، نمادین و عقل سلیم، متوجه میشویم که زنجیره پردازش فکر یک ویژگی نوظهور مقیاس مدل است که به مدلهای زبانی به اندازه کافی بزرگ اجازه میدهد تا وظایف استدلالی را انجام دهند که در غیر این صورت دارای منحنیهای مقیاسبندی مسطح هستند.
گسترش دامنه وظایف استدلالی که مدلهای زبانی میتوانند انجام دهند، امیدواریم الهامبخش کار بیشتر روی رویکردهای استدلال مبتنی بر زبان باشد.»
معنی آن این است که Chain of Thought Prompting ممکن است این پتانسیل را داشته باشد که Google را به طور قابل توجهی مدلهای مختلف زبان خود را بهبود بخشد، که به نوبه خود میتواند منجر به پیشرفتهای قابل توجهی در انواع کارهایی شود که Google میتواند انجام دهد.
استناد
مقاله هوش مصنوعی گوگل را بخوانید
مدل های زبان استدلال را از طریق زنجیره فکر انجام می دهند
مقاله تحقیق را دانلود و مطالعه کنید
زنجیره فکری که باعث برانگیختن استدلال در مدلهای زبانی بزرگ میشود (PDF)
!function(f,b,e,v,n,t,s) {if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}; if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)}(window,document,'script', 'https://connect.facebook.net/en_US/fbevents.js');
if( typeof sopp !== "undefined" && sopp === 'yes' ){ fbq('dataProcessingOptions', ['LDU'], 1, 1000); }else{ fbq('dataProcessingOptions', []); }
fbq('init', '1321385257908563');
fbq('track', 'PageView');
fbq('trackSingle', '1321385257908563', 'ViewContent', { content_name: 'google-chain-of-thought-prompting', content_category: 'news seo ' });
سئو PBN | خبر های جدید سئو و هک و سرور