گوگل Gemma: مدل زبان باز سازگار با لپ تاپ را معرفی کرد

گوگل یک مدل زبان باز و بزرگ را بر اساس فناوری استفاده شده برای ایجاد Gemini منتشر کرد که قدرتمند و در عین حال سبک وزن است و برای استفاده در محیط هایی با منابع محدود مانند لپ تاپ یا زیرساخت ابری بهینه شده است.

Gemma می تواند برای ایجاد یک ربات چت، ابزار تولید محتوا و تقریباً هر چیز دیگری که یک مدل زبان می تواند انجام دهد استفاده شود. این ابزاری است که سئوکاران منتظر آن بوده اند.

این نسخه در دو نسخه یکی با دو میلیارد پارامتر (2B) و دیگری با هفت میلیارد پارامتر (7B) منتشر شده است. تعداد پارامترها پیچیدگی و قابلیت بالقوه مدل را نشان می دهد. مدل‌هایی با پارامترهای بیشتر می‌توانند به درک بهتری از زبان دست یابند و پاسخ‌های پیچیده‌تری ایجاد کنند، اما برای آموزش و اجرا به منابع بیشتری نیز نیاز دارند.

هدف از انتشار Gemma دموکراتیک کردن دسترسی به هوش مصنوعی پیشرفته است که آموزش داده شده است تا از جعبه ایمن و مسئولیت پذیر باشد، با یک جعبه ابزار برای بهینه سازی بیشتر آن برای ایمنی.

منتشر شده به عنوان یک مدل باز (نوعی منبع باز)

Gemma برای استفاده تجاری یا غیرتجاری تحت مجوز باز در دسترس هر کسی است. مجوز باز نوعی از مجوز منبع باز است، با یک تفاوت اصلی این است که مجوز باز با شرایط استفاده همراه است. در این مورد محدودیت هایی وجود دارد که از استفاده آن برای اهداف مخرب جلوگیری می کند.

گوگل در مورد آن در وبلاگ منبع باز خود پست کرد و توضیح داد که مجوزهای منبع باز به طور کلی آزادی کامل در انتخاب نحوه استفاده از فناوری ها را فراهم می کنند. اما آن‌ها احساس می‌کنند که با فناوری هوش مصنوعی، انتشار مدل‌های هوش مصنوعی تحت یک نوع منبع باز به نام مجوز باز که اجازه استفاده رایگان را می‌دهد اما استفاده از آن را در راه‌های مضر محدود می‌کند، انتخاب مسئولانه‌تری است و در غیر این صورت به کاربران استقلال می‌دهد تا با این فناوری نوآوری کنند. .

توضیح دهنده منبع باز درباره Gemma توضیح می دهد:

شرایط استفاده از مدل‌های Gemma آن‌ها را برای توسعه‌دهندگان، محققان و کاربران تجاری به‌صورت رایگان برای دسترسی و توزیع مجدد در دسترس قرار می‌دهد. کاربران همچنین برای ایجاد و انتشار انواع مدل آزاد هستند. در استفاده از مدل‌های Gemma، توسعه‌دهندگان موافقت می‌کنند که از استفاده‌های مضر اجتناب کنند، که نشان دهنده تعهد ما به توسعه مسئولانه هوش مصنوعی و در عین حال افزایش دسترسی به این فناوری است.

نوک کلاه به داون اندرسون (@dawnieando) برای اشاره به آن تمایز!

Gemma توسط DeepMind

این مدل به گونه ای طراحی شده است که سبک وزن و کارآمد باشد که آن را برای دستیابی به دستان بیشتر کاربران نهایی ایده آل می کند.

اعلامیه رسمی گوگل به نکات کلیدی زیر اشاره کرد:

  • ما وزن های مدل را در دو اندازه منتشر می کنیم: Gemma 2B و Gemma 7B. هر اندازه با انواع از پیش آموزش دیده و تنظیم شده توسط دستورالعمل منتشر می شود.
  • یک جعبه ابزار جدید AI Generative Responsible رهنمودها و ابزارهای ضروری را برای ایجاد برنامه های کاربردی هوش مصنوعی ایمن تر با Gemma ارائه می دهد.
  • ما زنجیره‌های ابزاری را برای استنتاج و تنظیم دقیق (SFT) در تمام چارچوب‌های اصلی: JAX، PyTorch، و TensorFlow از طریق Keras 3.0 بومی ارائه می‌کنیم.
  • نوت‌بوک‌های آماده برای استفاده Colab و Kaggle، در کنار ادغام با ابزارهای محبوبی مانند Hugging Face، MaxText، NVIDIA NeMo و TensorRT-LLM، شروع کار با Gemma را آسان می‌کند.
  • مدل‌های Gemma از پیش آموزش‌دیده و تنظیم‌شده می‌توانند روی لپ‌تاپ، ایستگاه کاری یا Google Cloud شما با استقرار آسان در Vertex AI و Google Kubernetes Engine (GKE) اجرا شوند.
  • بهینه‌سازی در چندین پلت‌فرم سخت‌افزاری هوش مصنوعی، عملکرد پیشرو در صنعت، از جمله پردازنده‌های گرافیکی NVIDIA و Google Cloud TPU را تضمین می‌کند.
  • شرایط استفاده اجازه استفاده تجاری و توزیع مسئولانه را برای همه سازمان ها، صرف نظر از اندازه، می دهد.

تجزیه و تحلیل جما

بر اساس تحلیلی که توسط Awni Hannun، دانشمند تحقیقاتی یادگیری ماشین در اپل انجام شده است، Gemma به گونه ای بهینه شده است که بسیار کارآمد باشد به گونه ای که برای استفاده در محیط های کم منابع مناسب باشد.

هانون مشاهده کرد که جما دارای واژگان 250000 (250k) توکن در مقابل 32k برای مدل های مشابه است. اهمیت آن در این است که Gemma می تواند طیف وسیع تری از کلمات را شناسایی و پردازش کند و به آن اجازه می دهد وظایف را با زبان پیچیده انجام دهد. تحلیل او نشان می دهد که این واژگان گسترده، تطبیق پذیری مدل را در انواع مختلف محتوا افزایش می دهد. او همچنین معتقد است که ممکن است به ریاضی، کد و سایر روش‌ها کمک کند.

همچنین اشاره شد که “وزن های تعبیه شده” عظیم هستند (750 میلیون). وزن‌های تعبیه‌شده اشاره‌ای به پارامترهایی هستند که به نگاشت کلمات به نمایش معانی و روابط آنها کمک می‌کنند.

یکی از ویژگی‌های مهمی که او به آن اشاره کرد این است که وزن‌های تعبیه‌شده، که اطلاعات دقیق درباره معانی و روابط کلمات را رمزگذاری می‌کنند، نه تنها در پردازش بخش ورودی، بلکه در تولید خروجی مدل نیز استفاده می‌شوند. این اشتراک‌گذاری، کارایی مدل را بهبود می‌بخشد و به آن اجازه می‌دهد تا درک بهتری از زبان را هنگام تولید متن اعمال کند.

برای کاربران نهایی، این به معنای پاسخ‌های (محتوا) دقیق‌تر، مرتبط‌تر و مناسب‌تر از مدل است که استفاده از آن را در تولید محتوا و همچنین برای چت‌بات‌ها و ترجمه‌ها بهبود می‌بخشد.

او توییت کرد:

این لغت در مقایسه با سایر مدل‌های منبع باز بسیار بزرگ است: 250K در مقابل 32k برای Mistral 7B

شاید به ریاضی / کد / روش های دیگر با دم سنگین نمادها کمک زیادی کند.

همچنین وزنه های تعبیه شده بزرگ هستند (حدود 750 میلیون پارامتر)، بنابراین با هد خروجی به اشتراک گذاشته می شوند.

در یک توییت بعدی، او همچنین به بهینه‌سازی در آموزش اشاره کرد که به طور بالقوه به پاسخ‌های مدل دقیق‌تر و دقیق‌تر تبدیل می‌شود، زیرا مدل را قادر می‌سازد تا در مرحله آموزش به طور مؤثرتری یاد بگیرد و سازگار شود.

او توییت کرد:

«وزن نرمال RMS دارای یک افست واحد است.

به جای “x * وزن” آنها “x * (1 + وزن)” را انجام می دهند.

من فرض می کنم این یک بهینه سازی آموزشی است. معمولاً وزن به 1 مقداردهی اولیه می شود، اما احتمالاً نزدیک به 0 مقداردهی اولیه می شود. مشابه هر پارامتر دیگری.

او ادامه داد که بهینه‌سازی‌های بیشتری در داده‌ها و آموزش وجود دارد، اما این دو عامل هستند که به‌ویژه برجسته هستند.

طراحی شده تا ایمن و مسئولیت پذیر باشد

یک ویژگی کلیدی مهم این است که از ابتدا برای ایمن بودن طراحی شده است که آن را برای استقرار برای استفاده ایده آل می کند. داده های آموزشی برای حذف اطلاعات شخصی و حساس فیلتر شد. گوگل همچنین از یادگیری تقویتی از بازخورد انسانی (RLHF) برای آموزش این مدل برای رفتار مسئولانه استفاده کرد.

بیشتر با تیم‌سازی مجدد دستی، آزمایش خودکار و قابلیت‌های فعالیت‌های ناخواسته و خطرناک بررسی شد.

گوگل همچنین یک جعبه ابزار برای کمک به کاربران نهایی برای بهبود بیشتر ایمنی منتشر کرد:

ما همچنین با Gemma یک Toolkit جدید هوش مصنوعی مولد مسئولیت‌پذیر را منتشر می‌کنیم تا به توسعه‌دهندگان و محققان کمک کنیم تا برنامه‌های هوش مصنوعی ایمن و مسئولانه را در اولویت قرار دهند. جعبه ابزار شامل:

  • طبقه بندی ایمنی: ما یک روش جدید برای ساخت طبقه بندی کننده های ایمنی قوی با حداقل نمونه ها ارائه می دهیم.
  • اشکال زدایی: یک ابزار اشکال زدایی مدل به شما کمک می کند رفتار جما را بررسی کنید و به مشکلات احتمالی رسیدگی کنید.
  • راهنمایی: می‌توانید بر اساس تجربه Google در توسعه و استقرار مدل‌های زبان بزرگ، به بهترین شیوه‌ها برای سازندگان مدل دسترسی داشته باشید.

اطلاعیه رسمی گوگل را بخوانید:

Gemma: معرفی جدیدترین مدل های باز

تصویر ویژه توسط Shutterstock/Photo For Everything

سئو PBN | خبر های جدید سئو و هک و سرور