Flash 1.5، Gemma 2 و Project Astra

1.5 Flash در خلاصه سازی، برنامه های چت، شرح تصاویر و ویدیوها، استخراج داده ها از اسناد و جداول طولانی و موارد دیگر برتری دارد. این به این دلیل است که توسط 1.5 Pro از طریق فرآیندی به نام “تقطیر” آموزش داده شده است، جایی که ضروری ترین دانش و مهارت ها از یک مدل بزرگتر به یک مدل کوچکتر و کارآمدتر منتقل می شود.

درباره 1.5 Flash در صفحه فناوری Gemini بیشتر بخوانید و در مورد در دسترس بودن و قیمت 1.5 Flash اطلاعاتی کسب کنید. به زودی جزئیات بیشتری را در گزارش فنی به روز شده Gemini 1.5 به اشتراک خواهیم گذاشت.

بهبود قابل توجه 1.5 Pro

در چند ماه گذشته، ما به طور قابل توجهی 1.5 Pro را بهبود بخشیده ایم، بهترین مدل ما برای عملکرد کلی در طیف وسیعی از وظایف.

فراتر از گسترش پنجره زمینه آن به 2 میلیون توکن، ما تولید کد، استدلال و برنامه ریزی منطقی، مکالمه چند نوبتی، و درک صدا و تصویر را از طریق داده ها و پیشرفت های الگوریتمی افزایش داده ایم. ما شاهد پیشرفت های قوی در معیارهای عمومی و داخلی برای هر یک از این وظایف هستیم.

1.5 Pro اکنون می‌تواند دستورالعمل‌های پیچیده و ظریف‌تری را دنبال کند، از جمله دستورالعمل‌هایی که رفتار سطح محصول شامل نقش، قالب و سبک را مشخص می‌کنند. ما کنترل پاسخ‌های مدل را برای موارد استفاده خاص، مانند ایجاد شخصیت و سبک پاسخ یک عامل گپ یا خودکارسازی گردش‌های کاری از طریق فراخوانی عملکردهای متعدد، بهبود بخشیده‌ایم. و ما به کاربران امکان دادیم تا با تنظیم دستورالعمل های سیستم، رفتار مدل را هدایت کنند.

ما درک صوتی را در Gemini API و Google AI Studio اضافه کردیم، بنابراین 1.5 Pro اکنون می‌تواند برای ویدیوهای آپلود شده در Google AI Studio بین تصویر و صدا استدلال کند. و ما اکنون در حال ادغام 1.5 Pro در محصولات Google، از جمله Gemini Advanced و در برنامه‌های Workspace هستیم.

اطلاعات بیشتر در مورد 1.5 Pro را در صفحه فناوری Gemini بخوانید. جزئیات بیشتر به زودی در گزارش فنی به روز شده Gemini 1.5 ما ارائه می شود.

Gemini Nano ورودی های چندوجهی را درک می کند

Gemini Nano فراتر از ورودی های متنی گسترش می یابد و تصاویر را نیز شامل می شود. با شروع Pixel، برنامه‌هایی که از Gemini Nano با Multimodality استفاده می‌کنند، می‌توانند دنیا را به روشی که مردم انجام می‌دهند درک کنند – نه فقط از طریق متن، بلکه از طریق بینایی، صدا و زبان گفتاری.

درباره Gemini 1.0 Nano در اندروید بیشتر بخوانید.