انتشار LLM چیست و چرا اهمیت دارد؟

مقدمه

امروز ، آزمایشگاه های Inception اولین بار در دسترس تجاری را منتشر کردند انتشار مدل زبان بزرگ (DLLM) – رمزگذار جیوه ، و باعث ایجاد هم زدن بزرگ هر دو شد در جامعه تحقیقاتی و همچنین در صنعت هوش مصنوعی. برخلاف LLM های رگرسیون خودکار (تمام LLM هایی که امروزه می شناسید) ، انتشار LLM مانند ژنراتورهای تصویر مورد علاقه AI شما مانند انتشار پایدار کار می کند ، جایی که نتایج نهایی از ابری از متن gibberish بیرون می آید. یک مثال زیر را برای تجسم درخواست رمزگذار عطارد برای نوشتن یک برنامه پایتون برای تقسیم یک تصویر در نیمه ها مشاهده کنید:

نکات کلیدی

  • تحقیقات نشان می دهد LLM های انتشار نوع جدیدی از مدل زبان با استفاده از تکنیک های انتشار ، به طور بالقوه سریعتر و کارآمدتر از مدل های تنظیم خودکار هستند.
  • آزمایشگاه های Inception Mercury Coder را راه اندازی کردند ، یک انتشار در مقیاس تجاری LLM ، که ادعا می کند سرعت بیش از 1000 توکن/دوم ، 5-10 برابر سریعتر از رقبا است.
  • به نظر می رسد که LLM های انتشار می توانند فناوری مجدد خودکار را به چالش بکشند و قابلیت های جدیدی مانند بهبود استدلال و کنترل را ارائه دهند ، اما تأثیر کامل آنها هنوز در حال ظهور است.
  • آندره کارپتی و اندرو نگ ، هر دو محقق مشهور هوش مصنوعی ، با استقبال از ورود LLM انتشار آزمایشگاه آزمایشگاه آغاز شده اند.

درک LLM های انتشار

LLM های انتشار یک رویکرد جدید به زبان …

Source link