DevOps همه چیز در مورد ادغام مجموعه مهارت های مختلف ، از جمله توسعه و عملیات ، در یک گردش کار منسجم است.
یک عنصر فزاینده مهم از مدل DevOps مهندسی قابلیت اطمینان سایت (SRE) است. در یک جلسه در رویداد Interop Digital 2020 در اکتبر گذشته ، جین گرول ، مدیر عامل موسسه DevOps ، گفت که مهندسان قابلیت اطمینان سایت بیشتر به DevOps تقاضا می کنند. مانند اکثر حوزه های فناوری ، روش مهندسی قابلیت اطمینان سایت ، نحوه ارتباط آن با موضوع گسترده تر DevOps و بهترین روش های موفقیت ، تفاوت های ظریف زیادی دارد.
در حالی که SRE اکنون یک منطقه گرم است ، منطقه ای است که طی چند سال گذشته در حال ساخت است.
تامی باتو از اکتبر 2015 عنوان مهندس قابلیت اطمینان سایت را دارد ، ابتدا برای دو سال در Dropbox و برای سه سال گذشته در مهندسی هرج و مرج فروشنده گرملین. وی به عنوان یک SRE ، تعدادی از مسئولیت ها را بر عهده دارد ، از جمله انجام کارهای پس از مرگ در مورد خاموشی ها و بهبود زمان متوسط برای پاسخگویی به مسائل ، ITPro امروز. بعنوان SRE ، بووت گفت كه ترجیح می دهد هر چه زودتر در فرآیند توسعه برنامه مشاركت داشته باشد تا به قابلیت اطمینان سرویس در معماری اصلی پروژه كمك كند.
Butow گفت: “من فکر می کنم با گذشت زمان ، مهندسان قابلیت اطمینان سایت بیشتر و فرصت های شغلی بیشتری پیدا می شود ، زیرا در واقع یک منطقه در حال رشد است.”
تقاطع DevOps و SRE
درباره چگونگی تلاقی DevOps و اصول مهندسی قابلیت اطمینان سایت یا اینکه باید دامنه جداگانه ای باشند ، بحث هایی وجود دارد.
لئونید بلکیند ، بنیانگذار و CTO راه اندازی اعتبار StackPulse، گفت ITPro امروز که وی مهندسی قابلیت اطمینان سایت را به عنوان اجرای اصول DevOps با هدف انعطاف پذیری خدمات نرم افزار تعریف می کند.
کیت مرکر ، مدیر ارشد عملیاتی نوبل 9، یکی دیگر از استارت آپ های قابلیت اطمینان ، گفت ITPro امروز که اصطلاحات “DevOps” و “SRE” اغلب مخلوط شده یا مورد سو or استفاده قرار می گیرند. در حالی که SRE و DevOps اصول مشابهی دارند ، مرکر گفت که شرکت وی در حال مشاهده پزشکان SRE است که در همه جا ظاهر می شوند و رویکردی کاملاً متمرکز برای بهبود قابلیت اطمینان خدمات نرم افزاری را دنبال می کنند.
“SRE به طور خاص در دستیابی به اهداف سطح خدمات تعریف شده توسط تجارت متمرکز است [SLOs] به طور مداوم و کارآمد ، در حالی که DevOps به اصطلاح عمومی تری برای زیرساخت توسعه دهنده و اتوماسیون زیرساخت تبدیل شده است “.
جایی که SRE در چرخه زندگی متناسب است
از نظر بلکیند ، مهندسی قابلیت اطمینان سایت در اولین مراحل چرخه عمر نرم افزار – در مرحله برنامه ریزی و معماری – آغاز می شود و سپس خود را در هر مرحله از راه “تزریق” می کند. وی افزود: داشتن قابلیت اطمینان عمیق در فرایند توسعه ، همان چیزی است که به آن امکان می دهد کارآمد باشد.
“در مورد آن فکر کنید ، چه آسان تر: گرفتن سیستمی که بدون هیچ گونه فکر قبلی در مورد قابلیت اطمینان آن در تولید ساخته شده است و تلاش برای اطمینان از آن ، یا فکر کردن در مورد چگونگی اطمینان از اطمینان آن از طریق برنامه ریزی ، توسعه ، تحویل ، بازسازی و غیره؟ ” بلکیند پرسید.
Merker این عقیده را دارد که SRE باید به طور عمیقی در توسعه محصول ادغام شود. وی گفت ، در توسعه مدرن ، قابلیت اطمینان به یک ویژگی اصلی محصول تبدیل شده است.
مرکر گفت: “اگر قابلیت اطمینان یک سرویس را به وضوح تعریف نکنید ، نمی توانید راه حل مناسب این نیازها را مهندسی کنید.”
استفاده از اهداف سطح سرویس برای اندازه گیری قابلیت اطمینان
طبق نظر بلکیند ، چارچوب مورد قبول صنعت برای اندازه گیری قابلیت اطمینان سرویس های نرم افزاری ، اهداف سطح خدمات است. این اهداف باید به اهداف تجاری مانند دسترسی و سطح خدمات برای کاربران برای یک سرویس یا برنامه خاص متصل شوند.
بلكیند گفت: “سپس کیفیت اطمینان سایت در بهبود اهداف سطح خدمات به عنوان تابعی از هزینه اندازه گیری می شود.” “فرآیندهای کارآمد مهندسی قابلیت اطمینان سایت باعث بهبود بیشتر SLO ها با هزینه کمتر برای سازمان می شود.”
از نظر مرکر ، مهمترین معیار ارزیابی SRE این است که آیا واقعاً مشتریان یک سازمان از خدماتی که ارائه می شود راضی هستند یا خیر.
وی گفت: “شما همچنین می خواهید بدانید كه قبل از وقوع آنها ، قبل از اینكه بر كاربران تأثیر بگذارد ، از چند قطره تقریباً از دست رفته جلوگیری می كنید.”
بهترین روشها برای SRE
از نظر بهترین روشها برای SRE ، مرکر توصیه می کند که در اولین قدم ، تعریف دقیق قابلیت اطمینان برای هر سرویس و سپس تعیین میزان غیرقابل اعتماد بودن سازمان برای تحمل آن در حالی که هنوز یک تجربه عالی به مشتریان نهایی ارائه می دهد ، باشد.
مرکر گفت: “با تنظیم استانداردهای قابل اعتماد و واضح برای اطمینان ، که معمولاً در اهداف سطح خدمات بیان می شوند ، یک سازمان می تواند با سرعت بیشتری عملکرد خود را شروع کند و بیش از انتظارات مشتری باشد.”
برای بلکیند ، بهترین روشها برای فعال کردن SRE شامل هر دو جنبه فنی و فرهنگی در سازمان است. وی گفت: در حالی که شباهتهای زیادی بین سازمانهایی وجود دارد که مهندسی قابلیت اطمینان سایت را کاملاً اتخاذ کرده اند ، اما در نهایت هر سازمانی تعادل مناسبی را پیدا می کند که متناسب با مدل تجاری و پشته فناوری آن باشد.
بلكیند گفت: “بزرگترین مانع در استفاده از مهندسی قابلیت اطمینان سایت ناتوانی در تغییر فرهنگ است.”