بررسی عمیق این که چگونه سیستمهای هوش مصنوعی به طور ناگهانی قابلیتهای جدیدی به دست میآورند و چرا برای آینده فناوری اهمیت دارد.
وقتی GPT-4 OpenAI منتشر شد، محققان چیز جالبی را کشف کردند: میتوانست مشکلات ریاضی پیچیدهای را که سلف خود با آن دست و پنجه نرم میکرد، حل کند، کدهای کامپیوتری کاربردی بنویسد، و حتی امتحانات حرفهای را پشت سر بگذارد – تواناییهایی که به صراحت در آن برنامهریزی نشده بودند. این پدیده که به عنوان ظهور شناخته می شود، به یکی از جذاب ترین و بالقوه ترین جنبه های توسعه هوش مصنوعی مدرن تبدیل شده است.
تکامل غیرمنتظره توانایی های هوش مصنوعی
تصور کنید به کودکی خواندن را آموزش دهید. انتظار دارید که آنها تشخیص حروف، سپس کلمات اساسی و در نهایت جملات کامل را یاد بگیرند. اما چه می شود اگر در جایی از مسیر، ناگهان توانایی خود را در نوشتن شعر یا حل معادلات نشان دهند؟ این اساساً همان چیزی است که در مورد مدل های زبان بزرگ (LLM) اتفاق می افتد.
تحقیقات اخیر نشان داده است که این قابلیتهای نوظهور اغلب بهجای توسعه تدریجی، به طور ناگهانی در مقیاسهای مدل خاص ظاهر میشوند. به عنوان مثال، زمانی که مدل های زبان به آستانه های اندازه خاصی می رسند، به طور خود به خود توانایی هایی مانند:
- ضرب سه رقمی بدون آموزش ریاضی صریح
- درک و ایجاد قیاس
- استدلال منطقی و حل مسئله
- ضربه صفر…