به عنوان سازندگان یک پلت فرم MLOps ، معمولاً از ما سال می شود که آیا بدون سرور معماری محاسبه مناسبی برای استقرار مدل ها است؟ صرفه جویی در هزینه های تبلیغ شده توسط بدون سرور برای بارهای ML مانند سایر بارهای کاری سنتی بسیار جذاب به نظر می رسد.
با این حال ، الزامات ویژه مدل های ML در رابطه با سخت افزار و منابع می تواند مانع استفاده از معماری های بدون سرور شود. برای ارائه بهترین راه حل به مشتریان خود ، ما معیارهای گسترده ای را برای مقایسه بدون سرور با رایانه های سنتی برای بارهای استنباطی اجرا کردیم. به طور خاص ، ما حجم کار استنباط را در سیستم های مختلف از جمله AWS Lambda ، Google Cloud Run و Verta ارزیابی کردیم.
این پست در مورد چگونگی شروع کار با استقرار مدل ها در AWS Lambda ، همراه با جوانب مثبت و منفی استفاده از این سیستم برای استنباط صحبت می کند.
AWS Lambda چیست؟
AWS lambda پیشنهاد بدون سرور AWS و بدون شک محبوب ترین چارچوب مبتنی بر ابر بدون سرور است. به طور خاص ، AWS Lambda یک سرویس محاسباتی است که کد را بر اساس تقاضا (یعنی در پاسخ به رویدادها) اجرا می کند و تهیه و مدیریت منابع محاسبه را برای اجرای کد شما به طور کامل مدیریت می کند. البته ، همانند پیشنهادات بدون سرور ، فقط هزینه استفاده از لامبدا را از شما می گیرد.
جذابیت اصلی AWS Lambda سهولت استفاده در چندین سطح است: اول ، توسعه دهنده …