چگونه هوش مصنوعی و ML آماده تغییر بازی برای عملیات مرکز داده هستند | دانش مرکز داده

مراکز داده امروزی با چالشی روبرو هستند که در ابتدا حل کردن آن تقریبا غیرممکن به نظر می رسد. در حالی که عملیات هرگز شلوغ‌تر نبوده است، تیم‌ها برای کاهش مصرف انرژی تأسیسات خود به عنوان بخشی از اهداف کاهش کربن شرکت تحت فشار هستند. و گویی این به اندازه کافی دشوار نبود، افزایش چشمگیر قیمت برق استرس واقعی را بر بودجه مرکز داده وارد می کند.

با توجه به تمرکز مراکز داده بر پشتیبانی از خدمات فناوری «ضروری» که مردم به طور فزاینده ای برای حمایت از زندگی شخصی و حرفه ای خود از آنها تقاضا می کنند، جای تعجب نیست که عملیات مرکز داده هرگز شلوغ تر از این نبوده است. با توجه به روندهایی که هیچ نشانه ای از کند شدن نشان نمی دهند، ما شاهد افزایش شدید استفاده از داده های مرتبط با ویدئو، ذخیره سازی، نیازهای محاسباتی، ادغام هوشمند اینترنت اشیا و همچنین عرضه اتصال 5G هستیم. با این حال، با وجود این حجم کار فزاینده، واقعیت تاسف بار این است که بسیاری از امکانات حیاتی امروزی به سادگی به اندازه کافی کارآمد نیستند.

با توجه به اینکه میانگین مرکز داده بیش از 20 سال کار می کند، این واقعاً نباید تعجب آور باشد. بهره وری همیشه به طراحی اصلی یک تأسیسات مرتبط است – و بر اساس بارهای مورد انتظار فناوری اطلاعات که مدت هاست از آنها سبقت گرفته شده است. در عین حال تغییر یک عامل ثابت است، زیرا پلتفرم‌ها، طراحی تجهیزات، توپولوژی‌ها، نیازهای چگالی توان و نیازهای خنک‌کننده همگی با ادامه حرکت برای کاربردهای جدید در حال تکامل هستند. نتیجه یک زیرساخت مرکز داده جهانی است که مرتباً تطبیق بارهای IT فعلی و برنامه ریزی شده با زیرساخت حیاتی خود دشوار است. این امر تنها با افزایش تقاضای مراکز داده تشدید می‌شود و پیش‌بینی‌های تحلیل‌گران حاکی از آن است که حجم کاری حدود 20 درصد در سال از هم‌اکنون تا سال 2025 رشد خواهد کرد.

رویکردهای سنتی مرکز داده برای برآوردن این الزامات رو به افزایش در تلاش هستند. اولویت بندی در دسترس بودن تا حد زیادی با هزینه بهره وری به دست می آید، با اتکای بیش از حد به تجربه اپراتور و اعتماد به درستی مفروضات. متأسفانه، شواهد نشان می دهد که این مدل دیگر واقع بینانه نیست. تحقیقات EkkoSense نشان می‌دهد که میانگین 15 درصد از قفسه‌های فناوری اطلاعات در مراکز داده که خارج از دستورالعمل‌های دما و رطوبت ASHRAE کار می‌کنند، و مشتریان تا 60 درصد از ظرفیت خنک‌کننده خود را به دلیل ناکارآمدی‌ها از بین می‌برند. و این یک مشکل است، زیرا موسسه Uptime تخمین می زند که ارزش جهانی نسبت داده شده به سرمایش ناکارآمد و مدیریت جریان هوا حدود 18 میلیارد دلار است. این معادل 150 میلیارد کیلووات ساعت تلف شده است.

با توجه به اینکه 35 درصد از انرژی مورد استفاده در یک مرکز داده برای پشتیبانی از زیرساخت خنک‌کننده استفاده می‌شود، واضح است که رویکردهای سنتی بهینه‌سازی عملکرد، فرصت بزرگی را برای باز کردن بهبودهای بهره‌وری از دست می‌دهند. داده های EkkoSense نشان می دهد که یک سوم از قطعی های پیش بینی نشده مرکز داده به دلیل مسائل حرارتی ایجاد می شود. یافتن روشی متفاوت برای مدیریت این مشکل می‌تواند به تیم‌های عملیاتی راه بسیار خوبی برای تضمین بهبود در دسترس بودن و کارایی ارائه دهد.

محدودیت های نظارت سنتی
متأسفانه، تنها حدود 5 درصد از تیم‌های M&E در حال حاضر دمای تجهیزات مرکز داده خود را بر اساس رک به رک نظارت و گزارش می‌کنند. علاوه بر این، DCIM و راه‌حل‌های مانیتورینگ سنتی می‌توانند داده‌های روند را ارائه دهند و برای ارائه هشدار در هنگام رخ دادن نقض تنظیم شوند، اما این همان جایی است که متوقف می‌شود. آنها فاقد تجزیه و تحلیل هستند تا اطلاعات عمیق تری در مورد علت مسائل و نحوه حل آنها و اجتناب از آنها در آینده ارائه دهند.

تیم‌های عملیاتی تشخیص می‌دهند که این نوع نظارت سنتی محدودیت‌های خود را دارد، اما آنها همچنین می‌دانند که منابع و زمان کافی برای برداشتن داده‌هایی که دارند و تبدیل آن‌ها از نویز پس‌زمینه به اقدامات معنادار را ندارند. خبر خوب این است که اکنون راه حل های فناوری برای کمک به مراکز داده برای مقابله با این مشکل در دسترس است.

زمان آن فرا رسیده است که مراکز داده با یادگیری ماشینی و هوش مصنوعی کار خود را انجام دهند
استفاده از یادگیری ماشین و هوش مصنوعی یک الگوی جدید از نظر نحوه نزدیک شدن به عملیات مرکز داده ایجاد می کند. تیم‌های عملیاتی به‌جای غرق شدن در داده‌های عملکرد بیش از حد، اکنون می‌توانند از مزیت یادگیری ماشین برای جمع‌آوری داده‌ها در سطحی بسیار دقیق‌تر استفاده کنند – به این معنی که می‌توانند به نحوه عملکرد مرکز داده‌شان در زمان واقعی دسترسی پیدا کنند. نکته کلیدی این است که این قابلیت در دسترس باشد، و استفاده از تجسم‌های سه بعدی هوشمند راهی عالی برای تسهیل تفسیر داده‌های عملکرد در سطح عمیق‌تر برای تیم‌های مرکز داده است: برای مثال، با نشان دادن تغییرات و برجسته کردن ناهنجاری‌ها.

مرحله بعدی استفاده از یادگیری ماشین و تجزیه و تحلیل هوش مصنوعی برای ارائه بینش عملی است. با تقویت مجموعه داده‌های اندازه‌گیری شده با الگوریتم‌های یادگیری ماشین، تیم‌های مرکز داده می‌توانند فوراً از بینش‌های قابل درک برای کمک به حمایت از تصمیم‌های بهینه‌سازی بلادرنگ خود بهره ببرند. ترکیبی از جمع‌آوری داده‌های دانه‌ای بلادرنگ هر پنج دقیقه و تجزیه و تحلیل‌های یادگیری هوش مصنوعی/ماشین به عملیات‌ها اجازه می‌دهد تا نه تنها ببینند در امکانات حیاتی خود چه اتفاقی می‌افتد، بلکه بفهمند چرا – و دقیقاً چه کاری باید در مورد آن انجام دهند.

تجزیه و تحلیل‌های مبتنی بر هوش مصنوعی و یادگیری ماشینی همچنین می‌توانند بینش‌های مورد نیاز برای توصیه تغییرات عملی در مناطق کلیدی مانند نقاط تنظیم بهینه، طرح‌بندی پنجره‌های کف، عملکرد واحد خنک‌کننده و تنظیمات سرعت فن را آشکار کنند. تجزیه و تحلیل حرارتی همچنین مکان های بهینه قفسه را نشان می دهد. و از آنجایی که هوش مصنوعی تجسم‌های بی‌درنگ را امکان‌پذیر می‌کند، تیم‌های مرکز داده می‌توانند به سرعت بازخورد عملکردی را در مورد هر گونه تغییر عملی دریافت کنند.

کمک به عملیات مرکز داده برای ایجاد تفاوت فوری
با توجه به فشار برای کاهش مصرف کربن و به حداقل رساندن تأثیر افزایش قیمت برق، تیم‌های مرکز داده اگر می‌خواهند برخلاف اهداف قابلیت اطمینان و کارایی خود ارائه دهند، به سطوح جدیدی از پشتیبانی بهینه‌سازی نیاز دارند.

بهره‌گیری از جدیدترین روش‌های بهینه‌سازی مرکز داده مبتنی بر یادگیری ماشین و هوش مصنوعی می‌تواند با کاهش انرژی و مصرف خنک‌کننده – با نتایجی که در عرض چند هفته به دست می‌آیند – تفاوت ایجاد کند. تیم‌های مرکز داده با آوردن داده‌های گرانول به خط مقدم برنامه‌های بهینه‌سازی خود، قبلاً توانسته‌اند نه تنها خطرات حرارتی و انرژی را حذف کنند، بلکه کاهش هزینه‌های مصرف انرژی خنک‌کننده و انتشار کربن را به طور متوسط ​​تا ۳۰ درصد تضمین کرده‌اند. نادیده گرفتن تأثیری که این نوع پس انداز می تواند داشته باشد دشوار است – به ویژه در دوره افزایش سریع قیمت برق. روزهای معاوضه با ریسک و در دسترس بودن برای بهینه‌سازی، چیزی از گذشته است و قدرت هوش مصنوعی و یادگیری ماشینی در خط مقدم راه اندازی مرکز داده شما قرار دارد.

میخواهی بیشتر بدانی؟ برای وبینار چهارشنبه AFCOM در مورد این موضوع از اینجا ثبت نام کنید.

درباره نویسنده

تریسی کالینز نایب رئیس EkkoSense Americas است، شرکتی که برنامه ریزی واقعی ظرفیت M&E را برای برق، خنک کننده و فضا امکان پذیر می کند. او قبلاً مدیرعامل Simple Helix، یک اپراتور پیشرو مرکز داده Tier III در AL بود.

تریسی دارای بیش از 25 سال تجربه عمیق در صنعت مرکز داده است، که قبلاً به عنوان معاون راه حل های فناوری اطلاعات برای Vertiv و قبل از آن با Emerson Network Power خدمت کرده است. تریسی در نقش خود متعهد به چالش برانگیز رویکردهای سنتی برای مدیریت مرکز داده است – به ویژه از نظر حل چالش بهینه سازی متعادل کردن حجم کاری مرکز داده در حالی که در مقابل اهداف صرفه جویی انرژی شرکت ها نیز ارائه می شود.