دریاچه عمیق، خانه دریاچه ای برای یادگیری عمیق: بحث و محدودیت ها

نویسندگان:

(1) Sasun Hambardzumyan، Activeloop، Mountain View، CA، USA;

(2) Abhinav Tuli، Activeloop، Mountain View، CA، USA.

(3) Levon Ghukasyan، Activeloop، Mountain View، CA، USA.

(4) Fariz Rahman، Activeloop، Mountain View، CA، USA؛.

(5) Hrant Topchyan، Activeloop، Mountain View، CA، USA.

(6) دیوید ایسایان، Activeloop، Mountain View، CA، USA.

(7) Mark McQuade، Activeloop، Mountain View، CA، USA.

(8) Mikayel Harutyunyan، Activeloop، Mountain View، CA، USA.

(9) Tatevik Hakobyan، Activeloop، Mountain View، CA، USA.

(10) Ivo Stranic، Activeloop، Mountain View، CA، USA.

(11) Davit Buniatyan، Activeloop، Mountain View، CA، USA.

7. بحث و محدودیت ها

موارد استفاده اولیه Deep Lake شامل (الف) آموزش مدل یادگیری عمیق، (ب) کنترل نسل و نسخه داده، (ج) پرس و جو داده ها و تجزیه و تحلیل، (د) بازرسی و کنترل کیفیت داده ها است. ما NumPy را گرفتیم [55] آرایه ها به عنوان یک بلوک اساسی و پیاده سازی شده است

شکل 10: استفاده از GPU از یک دستگاه GPU 16xA100 در حین آموزش مدل CLIP پارامتر 1B [60].  مجموعه داده LAION-400M است [68] جریان از AWS us-east به مرکز داده مرکزی GCP us.  هر رنگ استفاده از واحد پردازش گرافیکی A100 را در طول آموزش نشان می دهد.شکل 10: استفاده از GPU از یک دستگاه GPU 16xA100 در حین آموزش مدل CLIP پارامتر 1B [60].  مجموعه داده LAION-400M است [68] جریان از AWS us-east به مرکز داده مرکزی GCP us.  هر رنگ استفاده از واحد پردازش گرافیکی A100 را در طول آموزش نشان می دهد.

کنترل نسخه، دیتالودرهای جریانی، موتور تجسم از ابتدا.

7.1 فضای طراحی قالب

فرمت ذخیره سازی تنسور (TSF) یک فرمت فایل باینری است که به طور خاص برای ذخیره تانسورها طراحی شده است که آرایه های چند بعدی مقادیر عددی هستند که در بسیاری از الگوریتم های یادگیری ماشین و یادگیری عمیق استفاده می شوند. فرمت TSF به گونه ای طراحی شده است که کارآمد و فشرده باشد، …

Source link