بیایید بیشتر در مورد این قابلیت جدید و اینکه چگونه به بارد کمک میکند تا پاسخهایش را بهبود بخشد، به بررسی عمیقتر بپردازیم.
بهبود منطق و مهارت های استدلال
مدلهای زبان بزرگ (LLM) مانند موتورهای پیشبینی هستند – هنگامی که به آنها اعلان داده میشود، با پیشبینی کلماتی که احتمالاً بعداً میآیند، پاسخ ایجاد میکنند. در نتیجه، آنها در زبان و کارهای خلاقانه بسیار توانا بوده اند، اما در زمینه هایی مانند استدلال و ریاضی ضعیف تر هستند. برای کمک به حل مشکلات پیچیده تر با قابلیت های استدلال و منطق پیشرفته، تکیه صرف بر خروجی LLM کافی نیست.
روش جدید ما به Bard امکان تولید و اجرای کد را برای تقویت توانایی های استدلال و ریاضی خود می دهد. این رویکرد از دوگانگی به خوبی مطالعه شده در هوش انسانی الهام گرفته است، به ویژه در کتاب دانیل کانمن “تفکر، سریع و آهسته” که جداسازی “سیستم 1” و “سیستم 2” تفکر است.
- تفکر سیستم 1 سریع، شهودی و بی دردسر است. وقتی یک نوازنده جاز در جا بداهه می نویسد یا یک تایپ لمسی به کلمه ای فکر می کند و آن را روی صفحه نمایش می بیند، آنها از سیستم 1 تفکر استفاده می کنند.
- در مقابل، تفکر سیستم 2 آهسته، عمدی و پر تلاش است. هنگامی که در حال انجام بخش طولانی یا یادگیری نحوه نواختن یک ساز هستید، از سیستم 2 استفاده می کنید.
در این قیاس، می توان LLM ها را صرفاً تحت سیستم 1 در نظر گرفت که متن را به سرعت اما بدون تفکر عمیق تولید می کنند. این منجر به برخی از قابلیتهای باورنکردنی میشود، اما میتواند از راههای شگفتانگیزی کوتاه بیاید. (تصور کنید که سعی می کنید یک مسئله ریاضی را با استفاده از سیستم 1 به تنهایی حل کنید: شما نمی توانید متوقف شوید و حساب را انجام دهید، فقط باید اولین پاسخی را که به ذهنتان می رسد بیرون بیاورید.) محاسبات سنتی با تفکر سیستم 2 مطابقت دارد: فرمولی و غیر قابل انعطاف است، اما توالی صحیح مراحل می تواند نتایج چشمگیری مانند راه حل هایی برای تقسیم طولانی ایجاد کند.
با این آخرین بهروزرسانی، ما قابلیتهای LLM (سیستم 1) و کد سنتی (سیستم 2) را برای کمک به بهبود دقت در پاسخهای بارد ترکیب کردهایم. بارد از طریق اجرای کد ضمنی، اعلانهایی را شناسایی میکند که ممکن است از کد منطقی سود ببرند، آن را «زیر سرپوش» مینویسد، آن را اجرا میکند و از نتیجه برای ایجاد پاسخ دقیقتر استفاده میکند. تاکنون، ما شاهد بودهایم که این روش دقت پاسخهای باردا به کلمات و مسائل ریاضی مبتنی بر محاسبات را در مجموعه دادههای چالش داخلی ما تقریباً 30% بهبود داده است.
حتی با این پیشرفتها، Bard همیشه آن را درست نمیکند – به عنوان مثال، Bard ممکن است کدی را برای کمک به پاسخ سریع تولید نکند، کدی که تولید میکند ممکن است اشتباه باشد یا Bard ممکن است کد اجرا شده را در پاسخ خود لحاظ نکند. با تمام آنچه گفته شد، این توانایی بهبود یافته برای پاسخگویی با قابلیت های ساختارمند و منطق محور، گام مهمی در جهت مفیدتر کردن Bard است. در ادامه با ما همراه باشید.