OpenAI مدل هوش مصنوعی سریعتر و ارزانتر را با GPT-4o راه اندازی کرد | دانش مرکز داده

(بلومبرگ) – OpenAI نسخه سریعتر و ارزان‌تری از مدل هوش مصنوعی را راه‌اندازی می‌کند که زیربنای ربات چت خود، ChatGPT است، زیرا این استارت‌آپ تلاش می‌کند تا پیشتازی خود را در بازاری که به طور فزاینده‌ای شلوغ می‌شود حفظ کند.

در طی یک رویداد پخش زنده در روز دوشنبه، OpenAI GPT-4o را معرفی کرد. این نسخه به روز شده از مدل GPT-4 آن است که اکنون بیش از یک سال از عمر آن می گذرد. مدل جدید زبان بزرگ، آموزش داده شده بر روی حجم وسیعی از داده از اینترنت، در مدیریت متن، صدا و تصاویر در زمان واقعی بهتر خواهد بود. به روز رسانی ها در هفته های آینده در دسترس خواهند بود.

این شرکت گفت که در صورت پرسیدن یک سوال به صورت شفاهی، سیستم می تواند با یک پاسخ صوتی در میلی ثانیه پاسخ دهد، که امکان مکالمه روان تر را فراهم می کند. در نمایشی از این مدل، محققان OpenAI و مدیر ارشد فناوری میرا موراتی با ChatGPT جدید فقط با استفاده از صدای خود گفتگو کردند و نشان دادند که این ابزار می‌تواند پاسخ دهد. در طول ارائه، چت بات همچنین به نظر می رسید که گفتار را از یک زبان به زبان دیگر تقریباً بلافاصله ترجمه می کند و در یک نقطه به درخواست، بخشی از یک داستان را می خواند.

موراتی به بلومبرگ نیوز گفت: «این اولین بار است که ما جهشی بزرگ در تعامل و سهولت استفاده انجام می دهیم. “ما واقعاً این امکان را برای شما فراهم می کنیم که با ابزارهایی مانند ChatGPT همکاری کنید.”

این به‌روزرسانی تعدادی ویژگی را برای کاربران رایگان به ارمغان می‌آورد که قبلاً به کسانی که اشتراک پولی ChatGPT داشتند محدود می‌شد، مانند امکان جستجو در وب برای پاسخ به سؤالات، صحبت با ربات چت و شنیدن پاسخ با صداهای مختلف، و به آن دستور دهید تا جزئیاتی را که چت بات می تواند در آینده به خاطر بیاورد ذخیره کند.

انتشار GPT-4o آماده تکان دادن چشم انداز هوش مصنوعی است که به سرعت در حال تحول است، جایی که GPT-4 استاندارد طلایی باقی مانده است. تعداد فزاینده‌ای از استارت‌آپ‌ها و شرکت‌های فناوری بزرگ، از جمله Anthropic، Cohere و Alphabet Inc. Google، اخیراً مدل‌های هوش مصنوعی را ارائه کرده‌اند که می‌گویند در معیارهای خاص با عملکرد GPT-4 مطابقت دارند یا از آنها پیشی می‌گیرند.

اعلامیه OpenAI نیز یک روز قبل از کنفرانس توسعه دهندگان Google I/O منتشر می شود. انتظار می‌رود گوگل، پیشرو اولیه در فضای هوش مصنوعی، از این رویداد برای رونمایی از به‌روزرسانی‌های بیشتر هوش مصنوعی پس از مسابقه برای همگام شدن با OpenAI تحت حمایت مایکروسافت استفاده کند.

سام آلتمن، مدیر اجرایی OpenAI در روز دوشنبه در یک پست وبلاگ نادر گفت که در حالی که نسخه اصلی ChatGPT اشاره‌ای به نحوه استفاده از زبان برای تعامل با رایانه‌ها ارائه می‌دهد، استفاده از GPT-4o کاملاً متفاوت است.

حس می‌کند هوش مصنوعی از فیلم‌ها وجود دارد. و هنوز هم برای من کمی تعجب آور است که واقعی است.» او گفت. “رسیدن به زمان پاسخگویی در سطح انسانی و بیانگر تغییر بزرگی است.”

دو برابر سریعتر

به جای تکیه بر مدل‌های مختلف هوش مصنوعی برای پردازش ورودی‌های مختلف، GPT-4o – o مخفف omni است – صدا، متن و دید را در یک مدل ترکیب می‌کند و به آن اجازه می‌دهد سریع‌تر از مدل قبلی خود باشد. به عنوان مثال، اگر به سیستم یک درخواست تصویری بدهید، می تواند با یک تصویر پاسخ دهد. این شرکت گفت که مدل جدید دو برابر سریع‌تر و کارآمدتر است.

موراتی گفت: «وقتی سه مدل مختلف دارید که با هم کار می‌کنند، تأخیر زیادی در تجربه ایجاد می‌کنید و این تجربه غوطه‌ور شدن را می‌شکند. اما هنگامی که یک مدل دارید که به طور بومی در صدا، متن و بینایی دلیل می‌کند، تمام تأخیر را کاهش می‌دهید و می‌توانید با ChatGPT تعامل بیشتری داشته باشید، مانند اینکه ما اکنون در حال تعامل هستیم.»

اما مدل جدید با مشکلاتی روبرو شد. هنگامی که محققان در طول نمایش خود صحبت می کردند، صدا اغلب قطع می شد. سیستم هوش مصنوعی همچنین حضار را غافلگیر کرد که پس از مربیگری یک محقق در فرآیند حل یک مسئله جبر، با صدایی پر از عشوه گری به صدا درآمد: “وای، این لباسی است که شما به تن کرده اید.”

OpenAI امروز شروع به ارائه قابلیت‌های متن و تصویر جدید GPT-4o برای برخی از کاربران ChatGPT Plus و Team کرده است که به زودی این قابلیت‌ها را به کاربران سازمانی ارائه می‌کند. این شرکت نسخه جدید دستیار “حالت صوتی” خود را در هفته های آینده در دسترس کاربران ChatGPT Plus قرار خواهد داد.

به عنوان بخشی از به‌روزرسانی‌های خود، OpenAI گفت که به هر کسی امکان دسترسی به فروشگاه GPT خود را نیز می‌دهد که شامل ربات‌های چت سفارشی ساخته شده توسط کاربران است. قبلاً فقط برای مشتریان پولی در دسترس بود.

گمانه زنی ها در مورد راه اندازی بعدی OpenAI در هفته های اخیر به یک بازی سالن سیلیکون ولی تبدیل شده است. یک چت ربات مرموز جدید پس از اینکه در یک وب سایت بنچمارک نمایش داده شد و به نظر می رسد رقیب عملکرد GPT-4 است، در میان ناظران هوش مصنوعی سر و صدا ایجاد کرد. آلتمن ارجاعات چشمکی به چت ربات در X ارائه کرد که به شایعات مبنی بر اینکه شرکت او پشت آن بوده است، دامن زد. روز دوشنبه، یکی از کارکنان OpenAI در پلتفرم اجتماعی X تایید کرد که چت ربات مرموز در واقع GPT-4o است.

این شرکت در حال کار بر روی طیف گسترده ای از محصولات، از جمله فناوری صوتی و نرم افزار ویدئویی است. بلومبرگ قبلا گزارش داده بود OpenAI همچنین در حال توسعه یک ویژگی جستجو برای ChatGPT است.

روز جمعه، این شرکت برخی از شایعات را با بیان اینکه به‌زودی GPT-5 را راه‌اندازی نمی‌کند، یک نسخه مورد انتظار از مدل خود که برخی در دنیای فناوری انتظار دارند کاملاً از سیستم‌های هوش مصنوعی فعلی توانمندتر باشد، خنثی کرد. همچنین گفت که رویداد روز دوشنبه از محصول جستجوی جدیدی رونمایی نخواهد کرد، ابزاری که می تواند با گوگل رقابت کند. سهام گوگل در این اخبار بالاتر رفت.

اما پس از پایان رویداد، آلتمن به سرعت به این حدس و گمان ادامه داد. او در X نوشت: «به زودی چیزهای بیشتری برای به اشتراک گذاشتن خواهیم داشت.