طبقه بندی داده ها: دستیابی به قابلیت مشاهده پایدار بدون مصالحه | دانش مرکز داده

قابلیت مشاهده، داده های سلامت برنامه و سیستم را قابل اجرا می کند. این به شرکت‌ها این امکان را می‌دهد تا به طور دقیق مسائل تأثیرگذار بر عملکرد را که در مرکز داده ایجاد می‌شوند، برطرف کنند و به طور ایده‌آل این موقعیت‌ها را قبل از اینکه تأثیر زیادی بر کسب‌وکار بگذارند شناسایی و حل کنند.

با توجه به اینکه میانگین هزینه از کار افتادگی تقریباً 5600 دلار در دقیقه است، جای تعجب نیست که بسیاری از سازمان‌ها سرمایه‌گذاری زیادی در شیوه‌های مشاهده‌پذیری انجام می‌دهند. بر اساس تخمین‌های اخیر، سازمان‌هایی که روش‌های مشاهده‌پذیری پیشرفته دارند، چهار برابر بیشتر احتمال دارد که موارد توقف برنامه‌ریزی نشده یا مشکلات خدمات جدی را در عرض چند دقیقه، نسبت به ساعت‌ها یا روزها حل کنند.

علاوه بر این، 90٪ از متخصصان فناوری اطلاعات معتقدند که مشاهده برای تجارت آنها مهم و استراتژیک است، در حالی که 91٪ مشاهده را در هر مرحله از چرخه عمر نرم افزار حیاتی می دانند. علاوه بر این، سازمان هایی که بر قابلیت مشاهده تسلط دارند، به طور متوسط ​​60٪ محصولات یا جریان های درآمد بیشتری را از تیم های توسعه تولید می کنند تا مبتدیان مشاهده پذیر.

خیلی بیشتر از یک چیز خوب؟

علیرغم مزایای مشاهده پذیری، چالشی وجود دارد که هر روز سخت تر می شود. افزایش ریز سرویس‌ها و تجربیات مشتری دیجیتالی، رشد گسترده‌ای در داده‌های مشاهده‌پذیری، از جمله گزارش‌ها، متریک‌ها و ردیابی‌ها ایجاد می‌کند. از بسیاری جهات، وضعیت مانند یک وان حمام پر از آب است: داده‌های بیش از حد باعث ایجاد هرج و مرج غیرقابل کنترل می‌شود، با تأثیر متناقض غلبه بر DevOps و متخصصان مهندسی قابلیت اطمینان سایت (SRE) به جای کمک به آنها.

برای مراکز داده معمولی، حجم داده‌های ورود به سیستم طی سه سال گذشته پنج برابر افزایش یافته است. در نتیجه، بسیاری از روش‌های مشاهده‌پذیری بسیار گران می‌شوند. طبق یک نظرسنجی اخیر از متخصصان DevOps و SRE، بیش از 90 درصد انتظار دارند که ابتکارات مشاهده پذیری آنها در سال آینده تحت بررسی شدیدتری در سطح C قرار گیرد.

بازی رولت روسی؟

تیم‌های DevOps و SRE که برای اجرای سریع و مطمئن برنامه‌ها و سیستم‌های مبتنی بر مرکز داده خود به ابتکارات مشاهده‌پذیری وابسته هستند، احساس می‌کنند که با یک معمای غیرممکن روبرو هستند. اگر آنها تمام داده های خود را حفظ کنند – که اکثریت قریب به اتفاق آنها هرگز مورد نیاز یا استفاده نیستند – از بودجه ذخیره سازی و تجزیه و تحلیل خود استفاده می کنند. در واقع، بیش از 90 درصد از متخصصان DevOps و SRE طبق گزارش‌ها بیش از حد یا افزایش غیرمنتظره در هزینه‌های مشاهده‌پذیری حداقل چند بار در هر سه ماهه، اگر نه بیشتر، تجربه کرده‌اند.

برای مبارزه با این مشکلات، تقریباً همه تیم‌های DevOps و SRE به طور منظم ورود گزارش را محدود می‌کنند – اغلب به‌طور تصادفی و بی‌مورد – به عنوان مکانیزمی برای کاهش هزینه‌ها. با این حال، خطر این رویکرد این است که این تیم‌ها ممکن است به‌طور تصادفی داده‌های مورد نیاز برای رفع یک مشکل یا داده‌های ارزشمندی را که می‌تواند به یک نقطه داغ در حال رشد هشدار دهد و در نتیجه پنجره‌ای برای اصلاح پیشگیرانه ایجاد کند دور می‌اندازند. به یاد داشته باشید: داده ها به طور تصاعدی غنی تر می شوند، هر چه تعداد بیشتری از آنها داشته باشید.

عواقب این رویکرد «داده‌ها از طریق تخلیه» می‌تواند شدید باشد، از جمله افزایش ریسک یا چالش‌های انطباق. از دست دادن بینش و تجزیه و تحلیل ارزشمند؛ و عدم شناسایی مشکل یا قطعی تولید. این رویکرد همچنین می‌تواند کاملاً بحث برانگیز باشد و باعث ایجاد تضاد بین بسیاری از تیم‌های DevOps و SRE در مورد اینکه کدام مجموعه داده‌ها باید نگهداری شوند و کدام‌ها می‌توانند دور ریخته شوند، می‌شود.

طبقه بندی داده ها: یک رسانه شاد

خوشبختانه، تکنیکی وجود دارد که به تیم‌های DevOps و SRE اجازه می‌دهد تا تمام داده‌های ارزشمند خود را حفظ کنند و در عین حال هزینه‌های ذخیره‌سازی بیش از حد را نیز حفظ کنند. و این رویکرد، طبقه بندی داده چند فروشنده است.

با توجه به انفجار در حجم داده‌های مشاهده‌پذیری، ذخیره همه داده‌ها در یک ردیف ذخیره‌سازی پریمیوم گران‌قیمت، مانند فهرست داده‌های گزارش، به سادگی پایدار نیست. درعوض، ترکیبی از بهترین ابزارها می‌تواند داده‌ها را بر اساس موارد استفاده (مثلاً تحلیل‌های بی‌درنگ، درخواست‌های موقت، انطباق) و کارایی هزینه‌های مورد نظر (مثلاً داغ و قابل جستجو) ساده‌سازی کرده و به مقصد ذخیره‌سازی بهینه خود منتقل کند. فهرست، ذخیره سازی اشیا).

به این ترتیب، تیم‌های DevOps و SRE می‌توانند تمام داده‌های خود را بدون صرف هزینه‌های بیش از حد برای ذخیره‌سازی و تجزیه و تحلیل، در اختیار داشته باشند. این سازش دردناک دیگر نیازی به انجام ندارد.

کاهش هزینه های داده

مرکز داده و امپراتوری برنامه های کاربردی امروزی به طور فزاینده ای گسترده و پیچیده می شوند و داده های بیشتری نسبت به اکثر تیم های DevOps و SRE تولید می کنند. با این حال، می توان با اطمینان گفت که همه داده ها از ارزش یکسانی برخوردار نیستند و نباید از تیم ها انتظار داشت که با همه داده ها به یک شکل رفتار کنند (و هزینه آن را بپردازند). کاهش مصرف داده ها و استفاده از بهترین ابزارها برای طبقه بندی مناسب داده ها می تواند باعث صرفه جویی زیادی در هزینه شود.

در طول سال آینده، ما انتظار داریم که طبقه بندی داده ها به طور گسترده ای مورد استفاده قرار گیرد، با خرید از سطوح مهندسی به سطوح اجرایی. علاوه بر این، ما انتظار داریم که شاهد افزایش تقاضا برای گزارش استفاده باشیم زیرا تیم‌های DevOps و SRE داده‌های مشاهده‌پذیری خود را به حداکثر می‌رسانند و از با ارزش‌ترین چیزها استفاده می‌کنند و در عین حال از سطوح ذخیره‌سازی کم‌هزینه نیز استفاده می‌کنند.


اوزان اونلو مدیر عامل شرکت دلتا لبه.