پاسخ‌های دقیق‌تر، به Google Sheets صادر کنید

بیایید بیشتر در مورد این قابلیت جدید و اینکه چگونه به بارد کمک می‌کند تا پاسخ‌هایش را بهبود بخشد، به بررسی عمیق‌تر بپردازیم.

بهبود منطق و مهارت های استدلال

مدل‌های زبان بزرگ (LLM) مانند موتورهای پیش‌بینی هستند – هنگامی که به آنها اعلان داده می‌شود، با پیش‌بینی کلماتی که احتمالاً بعداً می‌آیند، پاسخ ایجاد می‌کنند. در نتیجه، آنها در زبان و کارهای خلاقانه بسیار توانا بوده اند، اما در زمینه هایی مانند استدلال و ریاضی ضعیف تر هستند. برای کمک به حل مشکلات پیچیده تر با قابلیت های استدلال و منطق پیشرفته، تکیه صرف بر خروجی LLM کافی نیست.

روش جدید ما به Bard امکان تولید و اجرای کد را برای تقویت توانایی های استدلال و ریاضی خود می دهد. این رویکرد از دوگانگی به خوبی مطالعه شده در هوش انسانی الهام گرفته است، به ویژه در کتاب دانیل کانمن “تفکر، سریع و آهسته” که جداسازی “سیستم 1” و “سیستم 2” تفکر است.

  • تفکر سیستم 1 سریع، شهودی و بی دردسر است. وقتی یک نوازنده جاز در جا بداهه می نویسد یا یک تایپ لمسی به کلمه ای فکر می کند و آن را روی صفحه نمایش می بیند، آنها از سیستم 1 تفکر استفاده می کنند.
  • در مقابل، تفکر سیستم 2 آهسته، عمدی و پر تلاش است. هنگامی که در حال انجام بخش طولانی یا یادگیری نحوه نواختن یک ساز هستید، از سیستم 2 استفاده می کنید.

در این قیاس، می توان LLM ها را صرفاً تحت سیستم 1 در نظر گرفت که متن را به سرعت اما بدون تفکر عمیق تولید می کنند. این منجر به برخی از قابلیت‌های باورنکردنی می‌شود، اما می‌تواند از راه‌های شگفت‌انگیزی کوتاه بیاید. (تصور کنید که سعی می کنید یک مسئله ریاضی را با استفاده از سیستم 1 به تنهایی حل کنید: شما نمی توانید متوقف شوید و حساب را انجام دهید، فقط باید اولین پاسخی را که به ذهنتان می رسد بیرون بیاورید.) محاسبات سنتی با تفکر سیستم 2 مطابقت دارد: فرمولی و غیر قابل انعطاف است، اما توالی صحیح مراحل می تواند نتایج چشمگیری مانند راه حل هایی برای تقسیم طولانی ایجاد کند.

با این آخرین به‌روزرسانی، ما قابلیت‌های LLM (سیستم 1) و کد سنتی (سیستم 2) را برای کمک به بهبود دقت در پاسخ‌های بارد ترکیب کرده‌ایم. بارد از طریق اجرای کد ضمنی، اعلان‌هایی را شناسایی می‌کند که ممکن است از کد منطقی سود ببرند، آن را «زیر سرپوش» می‌نویسد، آن را اجرا می‌کند و از نتیجه برای ایجاد پاسخ دقیق‌تر استفاده می‌کند. تاکنون، ما شاهد بوده‌ایم که این روش دقت پاسخ‌های باردا به کلمات و مسائل ریاضی مبتنی بر محاسبات را در مجموعه داده‌های چالش داخلی ما تقریباً 30% بهبود داده است.

حتی با این پیشرفت‌ها، Bard همیشه آن را درست نمی‌کند – به عنوان مثال، Bard ممکن است کدی را برای کمک به پاسخ سریع تولید نکند، کدی که تولید می‌کند ممکن است اشتباه باشد یا Bard ممکن است کد اجرا شده را در پاسخ خود لحاظ نکند. با تمام آنچه گفته شد، این توانایی بهبود یافته برای پاسخگویی با قابلیت های ساختارمند و منطق محور، گام مهمی در جهت مفیدتر کردن Bard است. در ادامه با ما همراه باشید.