مقیاس بندی زبان-آموزش تصویر در بیش از 100 زبان

مقیاس بندی زبان-آموزش تصویر در بیش از 100 زبان

ارسال شده توسط شی چن و شیائو وانگ، مهندسان نرم افزار، تحقیقات گوگل مدل‌های زبان پیشرفته (به عنوان مثال، GPT، GLaM، PaLM و T5) قابلیت‌های متنوعی را نشان داده‌اند و با افزایش تعداد پارامترهای خود، به نتایج چشمگیری در سراسر وظایف و زبان‌ها دست یافته‌اند. مدل‌های زبان بینایی (VL) می‌توانند از مقیاس‌بندی مشابه برای رسیدگی …

ادامه مطلب

برنامه ریزی سلسله مراتبی عمیق از پیکسل

برنامه ریزی سلسله مراتبی عمیق از پیکسل

ارسال شده توسط Danijar Hafner، محقق دانشجو، Google Research تحقیقات در مورد چگونگی تصمیم گیری عوامل مصنوعی به سرعت از طریق پیشرفت در یادگیری تقویتی عمیق تکامل یافته است. در مقایسه با مدل‌های ML مولد مانند GPT-3 و Imagen، عوامل مصنوعی می‌توانند مستقیماً بر محیط خود از طریق اقداماتی مانند حرکت دادن بازوی ربات بر …

ادامه مطلب

بازبینی ترانسفورماتور ماسک از دیدگاه خوشه‌بندی

بازبینی ترانسفورماتور ماسک از دیدگاه خوشه‌بندی

ارسال شده توسط Qihang Yu، محقق دانشجو، و Liang-Chie Chen، دانشمند پژوهشی، تحقیقات گوگل تقسیم بندی پانوپتیک یک مشکل بینایی کامپیوتری است که به عنوان یک وظیفه اصلی برای بسیاری از برنامه های کاربردی دنیای واقعی عمل می کند. به دلیل پیچیدگی، کار قبلی اغلب تقسیم‌بندی پانوپتیک را به تقسیم‌بندی معنایی (تخصیص برچسب‌های معنایی، مانند …

ادامه مطلب

بازنویسی زیرنویس‌های تصویر برای پاسخ‌گویی به سؤالات تصویری ایجاد داده

بازنویسی زیرنویس‌های تصویر برای پاسخ‌گویی به سؤالات تصویری ایجاد داده

ارسال شده توسط Soravit Beer Changpinyo و Doron Kukliansky، مهندسان ارشد نرم افزار، Google Research پاسخگویی به سوال بصری (VQA) یک کار مفید یادگیری ماشینی (ML) است که به یک مدل برای پاسخ به یک سوال بصری در مورد یک تصویر نیاز دارد. چیزی که آن را چالش برانگیز می کند، ماهیت چند وظیفه ای …

ادامه مطلب

به سوی قابلیت اطمینان در سیستم های یادگیری عمیق

به سوی قابلیت اطمینان در سیستم های یادگیری عمیق

ارسال شده توسط داستین تران و بالاجی لاکشمینارایانان، دانشمندان پژوهشگر، تحقیقات گوگل مدل‌های یادگیری عمیق پیشرفت چشمگیری در بینایی، زبان و سایر روش‌ها داشته‌اند، به‌ویژه با افزایش پیش‌آموزش در مقیاس بزرگ. چنین مدل‌هایی زمانی دقیق‌تر هستند که برای داده‌های آزمایشی که از توزیع مشابه مجموعه آموزشی آن‌ها استخراج شده‌اند، اعمال شوند. با این حال، در …

ادامه مطلب

آموزش انتقال ساده برای توسعه مدل رادیوگرافی قفسه سینه

آموزش انتقال ساده برای توسعه مدل رادیوگرافی قفسه سینه

ارسال شده توسط Akib Uddin، مدیر محصول و Andrew Sellergren، مهندس نرم افزار، Google Health هر سال، نزدیک به یک میلیارد تصویر اشعه ایکس قفسه سینه (CXR) در سطح جهان برای کمک به تشخیص و مدیریت شرایط سلامتی از فروپاشی ریه تا بیماری‌های عفونی گرفته می‌شود. به طور کلی، CXR ها ارزان تر و در …

ادامه مطلب

آموزش عوامل ژنرالیست با ترانسفورماتورهای تصمیم گیری چند بازی

آموزش عوامل ژنرالیست با ترانسفورماتورهای تصمیم گیری چند بازی

ارسال شده توسط وینی زو، محقق دانشجو و Kuang-Huei Lee، مهندس نرم افزار، تحقیقات گوگل، تیم مغز روش‌های یادگیری تقویتی عمیق فعلی (RL) می‌توانند عوامل مصنوعی متخصصی را آموزش دهند که در تصمیم‌گیری در مورد وظایف مختلف فردی در محیط‌های خاص مانند Go یا StarCraft برتری داشته باشند. با این حال، پیشرفت اندکی برای گسترش …

ادامه مطلب

تکمیل کد ML-Enhanced بهره وری توسعه دهندگان را بهبود می بخشد

تکمیل کد ML-Enhanced بهره وری توسعه دهندگان را بهبود می بخشد

ارسال شده توسط Maxim Tabachnyk، مهندس نرم افزار کارکنان و Stoyan Nikolov، مدیر ارشد مهندسی، Google Research به روز رسانی – 2022/09/06: این پست برای حذف عبارتی در مورد کاهش مشاهده شده در سوئیچ‌های زمینه که نمی‌توان آن را با اهمیت آماری تأیید کرد، به‌روزرسانی شده است. افزایش پیچیدگی کد چالشی کلیدی برای بهره وری …

ادامه مطلب

مکالمات طبیعی با دستیار گوگل

مکالمات طبیعی با دستیار گوگل

ارسال شده توسط Tuan Anh Nguyen، مهندس نرم افزار کارکنان، دستیار Google، و Sourish Chaudhuri، مهندس نرم افزار کارکنان، تحقیقات گوگل در گفتگوهای طبیعی، هر بار که با هم صحبت می کنیم، نام افراد را نمی گوییم. در عوض، ما برای شروع مکالمات به مکانیسم‌های سیگنال‌دهی متنی تکیه می‌کنیم و تماس چشمی اغلب تنها چیزی …

ادامه مطلب

افزایش پس انتشار از طریق Local Loss Optimization

افزایش پس انتشار از طریق Local Loss Optimization

ارسال شده توسط احسان عمید، پژوهشگر، و روهان آنیل، مهندس اصلی، تحقیقات گوگل، تیم مغز در حالی که طراحی مدل و داده های آموزشی اجزای کلیدی موفقیت شبکه عصبی عمیق (DNN) هستند، روش بهینه سازی خاص مورد استفاده برای به روز رسانی پارامترهای مدل (وزن) کمتر مورد بحث قرار می گیرد. آموزش DNN ها شامل …

ادامه مطلب