وقفه های مرکز داده در سال 2020 کمتر بود اما خسارت بارتر بود: به موقع

همه گیری فقط یک عامل در میان بسیاری از افراد است که عامل تغییر الگوهای قطع مرکز داده در سال 2020 بودند. در حالی که به نظر می رسد تعداد کلی قطع مرکز داده در حال رشد است ، نرخ رشد زیرساخت آن با پیشی گرفتن از زیرساخت های فناوری اطلاعات – یعنی ، براساس اطلاعات جدید منتشر شده توسط موسسه Uptime ، امکانات فردی ممکن است کمتر دچار حوادث شوند.

اندی لارنس ، مدیر تحقیقاتی Uptime ، هفته گذشته در یک وبینار گفت: “شما ممکن است فکر کنید که به دلیل COVID تعداد بیشتری از وقایع رخ خواهد داد.” “در واقع ، در سال 2020 قطع جدی و شدید کمتر از سالهای گذشته بود. با این وجود … حتی اگر میزان قطعی در هر کیلووات بار IT کاهش یابد ، تأثیر و هزینه قطع قطعاً در حال افزایش است. این به دلیل وابستگی روزافزون به IT است. “

یافته های Uptime خبرهای خوبی برای صنعتی است که خود را در معرض تهدید سه گانه قرار داده است: تقاضای بسیار بیشتر کاربران IT برای خدمات فناوری اطلاعات از طریق راه دور ، پرسنل کمتری در محل برای رسیدگی به مسائل مربوط به خدمات و عوارض جانبی افراد کمتر در قدرت ایستگاه ها و امکانات خدمات الکتریکی. شاید در خوشبخت ترین شوک های احتمالی که می توان از برق دریافت کرد ، سال 2020 از نظر ارائه خدمات سال خوبی بود.

کریس براون ، Uptime CTO توضیح داد: “نتیجه مهم این است که [data center] قطع همچنان ادامه دارد. ما بدتر نمی شویم ، اما بهتر هم نمی شویم. ما به عنوان یک صنعت ، واقعاً باید بفهمیم که این قطع ها از کجا ناشی می شود و شروع به کشف چگونگی رفع آنها کنیم. “

داده های حاصل از نظرسنجی سالانه Uptime در سال 2021 با موضوع خاموشی مراکز داده و علل آنها مانند شمشیری دو لبه است. اگرچه تنها 6 درصد از پاسخ دهندگان گفتند كه تسهیلات آنها در سال 2020 دچار خاموشی شدید (“گروه آپتایم 5”) در مقایسه با 11 درصد برای سال 2019 شده است ، اما واقعیت تعداد كمتر ، ارزیابی روندهای موجود را دشوارتر می كند.

سوئیچ های انتقال استاتیک تحت بررسی دقیق در قطع مرکز داده

با تجزیه و تحلیل مستقیم Uptime از الگوی مصرف برق برای مشتریان خود ، با این حال ، متخصصان آن از داده های نظرسنجی برای نتیجه گیری استفاده کردند – و آنها آن چیزی نیستند که شما انتظار دارید. در حالی که سیستم های برق در محل بیشترین میزان وقایع قطع شده در مراکز داده مربوط به برق را از نظر حجمی ادامه می دهند ، این اجزای آن سیستم ها مانند باتری های UPS و سوئیچ های انتقال خودکار (ATS) هستند که بیشتر موارد مقصر احتمالی هستند.

“سوئیچ انتقال بین ژنراتور موتور و نرم افزار ،” اظهار داشت: براون ، “به طور معمول یک سوئیچ بسیار هوشمند است که به دنبال مشکلات برق از چند طریق است.” تغییر در فرکانس برق ، کاهش یا افزایش ناگهانی ولتاژ ، ممکن است حداقل به همان اندازه پایین آمدن ساده از برق ، علت وقوع برق باشد. وقتی ATS به روشی که باید کار می کند ، باید بتواند راه اندازی تولید برق پشتیبان در محل و انتقال بار به ژنراتور را تحریک کند.

در سالهای اخیر ، اجزای استاندارد ATS با لوازم جانبی سفارشی جایگزین شده اند ، براون به حضار گفت. تابلو برق مشخصات یک ATS را برای سایر اجزای برق پایین دست ارائه می دهد. چنین قطعات سفارشی تعداد کنترل بیشتری به تکنسین های تعمیر و نگهداری و در کنار آنها تعداد معاملات بصورت تصاعدی بیشتری بین اجزای سازنده ارائه می دهد که باید همیشه به صورت بهینه حفظ شوند. همه چیز باید بدون مشکل در آن لحظاتی از بین برود که طبق تعریف ، مشکل وجود دارد. علاوه بر این ، براون گفت ، این وقایع باید هماهنگ شوند.

وی گفت: “اگر سوئیچ انتقال خراب شود ، همان تأثیری خواهد داشت كه ژنراتورهای موتور از كار می افتند. پس شما فقط توان تأسیسات را ندارید. “

براون توضیح داد که برای کاهش هزینه های ساخت و ساز ، معماران به اپراتورهای تأسیسات توصیه می کنند که به اصطلاح سیستم های اضافی توزیع شده (DRS) نصب کنند. به نظر می رسد یک گزینه پرجمعیت و پرخرج است ، خصوصاً نحوه ارائه آن در ادبیات. در عمل ، استقرار به اندازه دو آرایه UPS مستقل است که هر کدام قادر به تحویل کل بار به تأسیسات هستند ، نه فقط بخشی. از آنجا که هر آرایه منفرد مستعد از کارافتادگی است (باز هم نه به طور کامل بلکه به طور کامل) ، اجزای ساکن ATS اغلب به جای چرخش در جای خود قرار می گیرند تا آرایه پشتیبان به جریان برق اصلی متصل شود.

“آنچه که با گذشت زمان مشاهده می کنیم این است که ، میزان سوئیچ های انتقال استاتیک مورد استفاده در مراکز داده در حال افزایش هستند تا به بهبود در دسترس بودن کمک کنند. یکی از نگرانی های من این است که آنها هنوز 22 درصد از قطعی های برق موجود در این لیست را تشکیل می دهند “، ادامه داد براون ، با اشاره به داده های نظرسنجی خود. “این واقعیت که آنها چنین یک بخش اساسی هستند … و یک قسمت فزاینده در حال رشد در آن سیستم های توزیع الکتریکی – و اینکه ما چندین قطره داریم – نگران من است. زیرا اگر با سوئیچ های انتقال استاتیک مشکل داریم ، تجهیزات IT بیشتر با قطع برق مواجه می شوند. “

دلایل نرم قطع مرکز داده های سخت

پاسخ دهندگان نظرسنجی به Uptime گفتند ، وقتی علت قطع برق در خارج از سایت قرار دارد ، احتمالاً دو برابر این مسئله مربوط به مشکل پیکربندی نرم افزار است – به عنوان مثال در شبکه شرکت مخابراتی – بیش از یک ظرفیت یا رویداد اضافه بار در شرکت تاسیسات.

Rhonda Ascierto ، معاون اصلی تحقیق در Uptime ، اظهار داشت: “مانند انواع نرم افزارها ، ما شاهد موارد پیکربندی بیشتری هستیم.” “این نیست که سخت افزار IT در حال خراب شدن است. این مشکلات در نحوه ارتباط سیستم ها و نحوه پیکربندی آنهاست. “

موسسه Uptimeبررسی قطعی مرکز داده موسسه Uptime 2021

Ascierto در ماه ژوئن گذشته توسط یک ارائه دهنده خدمات فیبر نوری به snafu پیکربندی مسیریابی اشاره کرد ، که اثر آبشار آن طوفان ترافیکی IP در شبکه داده T-Mobile بود و مشتریان را در سراسر کشور تحت تأثیر قرار داد. برخی از مشتریان از برقراری تماس 911 محروم بودند.

Ascierto گفت: “فقط ماهیت شبکه به این معنی است که شکست ها می توانند تعداد بسیار زیادی از مردم را تحت تأثیر قرار دهند.” “این تأثیرات می تواند واقعاً شدید باشد ، زیرا ما برای خدمات اضطراری به آن ارتباطات اعتماد می کنیم.”

در گزارش جدید Uptime ، همانند نسخه های قبلی ، خطای انسانی به عنوان علت ادامه قطع خدمات ذکر شده است. آیا از تیم Uptime پرسیدیم که آیا درس های سال COVID می تواند به عنوان یک شواهد شناخته شود ، که اتوماسیون بیشتر و بهتر در سیستم های قدرت می تواند احتمال قطع شدن ناشی از خطای انسانی را کاهش دهد و در نتیجه قابلیت اطمینان و کیفیت خدمات را بهبود بخشد؟

کریس براون به DCK گفت: “من فکر می کنم وقتی به سمت اتوماسیون می رویم می توانیم خاموشی کمتری را ببینیم.” “حداقل از نظر تاریخی ، از سیستمهای اتوماسیون برای جابجایی و هماهنگی مجدد سیستمهای توزیع برق و خنک کننده و مسیرها استفاده شده است. این امر بسیاری از تصمیم گیری ها را از دست بشر خارج کرد … اگرچه چالش بزرگ اتوماسیون این است که سیستم های رایانه ای فقط با ورود اطلاعات مناسب و برنامه ریزی مناسب برای تصمیم گیری می توانند تصمیم گیری کنند. آنها من فکر می کنم ، در اوایل ، اتوماسیون به برخی کمک می کند ، اما همچنین ممکن است برخی از مشکلات را ایجاد کند. اما همانطور که اتوماسیون را اصلاح می کنیم و برخی از مهارتهایی را که در طول سالها از دست داده ایم به دست می آوریم … من فکر می کنم اتوماسیون می تواند و باید شروع به کاهش تعداد قطعی ها کند [that are] فقط به دلیل خطای انسانی. “

“من فکر می کنم نیز قابل ذکر است ،” اضافه کرد Ascierto ، “که تا به امروز ، بیشتر توسعه و سرمایه گذاری که ما در زمینه های جدیدتر اتوماسیون تاسیسات دیده ایم بیشتر بر روی کارآیی متمرکز بوده است تا کاهش ریسک. من فکر می کنم ما هنوز چند سالی فاصله داریم که تأثیر اتوماسیون از نظر کاهش خطر و تعداد افراد کمتر در مراکز داده وجود داشته باشد. “

Ascierto افزود ، اما به طور ضد شهودی ، لزوماً نمی توان نتیجه گرفت كه كاهش خطای انسانی با افراد كمتری انجام می شود. وی به استفاده بیشتر از خدمات به اصطلاح “دستهای از راه دور” توسط تسهیلات مکان یابی اشاره کرد ، جایی که متخصصان فناوری اطلاعات و امکانات با مهارت و مجرب ، کارهایی را به نمایندگی از مستاجران در محل انجام می دهند. وی گفت: “شما می توانید استدلال كنید كه افراد حرفه ای و بسیار آموزش دیده ای كه در مراكز داده های همكاری كار می كنند ،” بیش از یك سال پیش ، زمانی كه مشتریان مجبور بودند این شرایط را برآورده كنند [themselves]، بدون آمادگی کامل. “

سئو PBN | خبر های جدید سئو و هک و سرور