قطعی AT&T بر قابلیت اطمینان شبکه تمرکز می کند | دانش مرکز داده

در 22 فوریه، یک قطع خدمات گسترده در خدمات تلفن همراه AT&T بر مشترکان سراسر کشور تأثیر گذاشت. اگرچه حجم گزارش‌های خاموشی صدها هزار نفر بود، اما این احتمالاً نوک کوه یخ است. آنچه در زیر خاموشی AT&T نهفته است، تعداد زیادی از مشترکین است که مشکلاتی را تجربه کرده‌اند اما آن‌ها را گزارش نکرده یا نمی‌توانند آن‌ها را گزارش کنند، و همچنین خدماتی را که از شبکه‌های تلفن همراه استفاده می‌کنند (مانند خدمات ردیابی، پایانه‌های فروش و غیره) تحت تأثیر قرار داده‌اند. .

این قطعی تقریباً 11 ساعت به طول انجامید و بر اساس تأثیرات قطعی های مشابه در گذشته در زمینه هایی مانند تراکنش های مالی و زنجیره تأمین، ما تأثیر آن بر اقتصاد ایالات متحده را 500 میلیون دلار برآورد می کنیم. در اینجا آنچه می دانیم اتفاق افتاده است و در آینده چه خواهد شد:

  • یک شبکه پیش پا افتاده تغییر دادن باعث قطعی گسترده شد AT&T رسماً بیانیه‌ای را در 22 فوریه منتشر کرد که این قطعی را به دلیل «… کاربرد و اجرای یک فرآیند نادرست که در حال گسترش شبکه‌مان بودیم، نه یک حمله سایبری…» نسبت می‌دهد – مشکل بزرگ چیست؟ برای بسیاری از ما در فناوری اطلاعات، فناوری‌های سلولی به‌عنوان پشتیبان فناوری زیربنایی برای شبکه‌های گسترده استفاده شده‌اند و تأثیر را حداقل می‌کنند. اما برای برخی از شرکت‌ها، اتصال سلولی راه نجات عملکردهای اصلی کسب‌وکار آنها مانند عملیات (به عنوان مثال، عملیات میدانی و ناوگان یا ردیابی و مدیریت دارایی) یا فروش (مانند پایانه‌های پرداخت، کیوسک‌ها و غیره) است. در این شرایط، قطعی مانند این می تواند ویرانگر باشد.
  • تحقیقات و قابل توجهی وجود خواهد داشت هزینه ها به AT&T… و در نهایت، مشتریان آن. زنجیره‌ای از رویدادها پس از قطعی رخ می‌دهد که با ارسال گزارش رسمی علت قطعی قطعی به FCC توسط AT&T آغاز می‌شود. به موازات آن، سازمان های دولتی ایالات متحده از تلاش ها برای رد هرگونه حمله سایبری احتمالی حمایت خواهند کرد. تخفیف‌ها و اعتبارات مشتریان و همچنین دعاوی حقوقی از سوی مصرف‌کنندگان و کسب‌وکارها به جریان خواهند افتاد. AT&T فرآیندها و بهبودهای فناوری را برای رسیدگی به علت(های) ریشه ای اجرا خواهد کرد و FCC مجبور خواهد شد قوانین خود را بازبینی کند. اگر از خاموشی راجرز در کانادا در 8 ژوئیه 2022 به عنوان راهنما استفاده کنیم، تخمین می زنیم که AT&T با توجه به مدت زمان خاموشی و نسبت جمعیت، که می تواند در یک برنامه سه ساله قرار گیرد، تا 1.5 میلیارد دلار تأثیر خواهد داشت. همانطور که توسط راجرز انجام شد (10 میلیارد دلار کانادا در طول 3 سال). اگر چنین طرح بهبودی توسط AT&T تنظیم شود، ما انتظار داریم که در مجاورت 20 تا 30 میلیارد دلار آمریکا باشد. این احتمال وجود دارد که مشتریان نتیجه این کار را در هزینه‌های بالاتر مشاهده کنند، مشابه آنچه که مشترکان راجرز چند ماه پس از قطع شدن آن تجربه کردند.

این خبر خوبی برای کسی نیست. مهم است که به یاد داشته باشید که شبکه ها همیشه قطع و کاهش عملکرد خواهند داشت. موضوع فیزیک، مداخله انسان و پیچیدگی تکنولوژی است. چیزی که این خبر را ارزشمند کرد این بود که این یک حامل بزرگ است که شرکت ها و شهروندان به آن وابسته هستند. به این دلایل، اپراتورها با بالاترین استانداردها نگهداری می شوند – اغلب با SLA های پنج 9 در دسترس برای یک سال. این بدان معناست که بیش از 5 دقیقه و 15 ثانیه در سال در دسترس نیستید. 11 ساعت پایین بودن… این یک توپ جدید است. درس های کلیدی برای اپراتورها و رهبران فناوری اطلاعات از این رویداد ناگوار چیست؟

  • رهبران فناوری اطلاعات باید قابلیت‌های اتصال بی‌سیم دستگاه پایانی خود را دوباره بررسی کنند. مخصوصاً برای شرکت‌هایی که به اتصال سلولی تک حامل متکی هستند، ممکن است زمان آن رسیده باشد که در این رویکرد تجدید نظر کنند و اینکه آیا فناوری‌های دیگر ممکن است نیازهای شما را بهتر برآورده کنند – به عنوان مثال، اجازه دادن به اتصال چند سیم کارت/eSIM اضافی یا داشتن چندین گزینه اتصال بی‌سیم. مانند ماهواره، LoRa، Sigfox، یا حتی WiFi در دستگاه های انتهایی شما. اما در اینجا چیزهای بیشتری برای یادگیری وجود دارد. به همان اندازه که ما شرکت های مخابراتی را به استانداردهای بالاتری نگاه می کنیم، می توانیم سعی کنیم از اشتباهات آنها جلوگیری کنیم…
  • همه سازمان های شبکه باید نظارت، دید، قابلیت مشاهده و سرمایه گذاری های هوش مصنوعی را تسریع بخشند. همانطور که در بالا ذکر شد، شبکه ها همیشه قطع و کاهش عملکرد خواهند داشت. با این حال، تیم‌های شبکه‌ای برای برنامه‌ریزی سخت‌گیرانه و اقدامات پیشگیرانه تاب‌آوری شناخته شده نیستند. به عنوان مثال، راه حل های نظارت بر شبکه معمولا یک فکر بعدی است. پس از بروز یک مشکل، به خصوص زمانی که نمی توان علت اصلی را پیدا کرد، تیم های شبکه روی یک راه حل نظارت سرمایه گذاری می کنند. بخشی از مسئله کمبود بودجه برای اصول اولیه در مقابل چشمک زدن مفاهیم جدید، مانند شبکه های مستقل، شبکه مبتنی بر هدف، و شبکه به عنوان یک سرویس است. اما این رویکرد چیزی نیست جز چسباندن شکاف بر روی بال هواپیما و باید به تدریج حذف شود. به روز بودن و تعمیر سریع برای تجربه مشتری ضروری است. این امر باعث می شود اتوماسیون شبکه، مدیریت عملکرد (از جمله قابلیت مشاهده، قابلیت مشاهده و AIOps)، تجزیه و تحلیل سریع برای تحلیلگران ریشه ای/CAST، و بهبودهای سیستمی از طریق هوش مصنوعی ضروری باشد. اتوماسیون و هوش مصنوعی هر قطعی را از بین نمی‌برد، اما می‌تواند به کشف و جلوگیری از بسیاری از قطع‌ها و کاهش عملکرد در حین اجرای شبیه‌سازی‌ها قبل از تغییرات یا مشکلات کمک کند.
  • شرکت های پیشرفته، مانند اپراتورها، باید به دنبال روش های پیشرفته باشند. انتظارات برای شرکت های بزرگ، به ویژه شرکت های حمل و نقل، حتی بالاتر است. دیگر صرف سرمایه گذاری کامل در موارد بالا کافی نیست. آن‌ها باید به شیوه‌های پیشرفته‌ای مانند پارچه‌های شبکه‌های تجاری، شبیه‌سازی/دوقلوهای دیجیتالی، ارتباطات رویدادهای بلادرنگ، و غیره فشار بیاورند. چرا اینها اینقدر مهم هستند؟ شبکه‌های تقسیم‌بندی‌شده گذشته اجزای گسسته‌ای بودند که به‌صورت دستی با تغییراتی که در هر نقطه شبکه، به‌طور متوالی و در یک دوره طولانی رخ می‌داد، کنترل می‌شدند. ظهور شبکه‌های تجاری در سطح تجاری که توسط نرم‌افزار کنترل می‌شوند، که در آن یک تغییر می‌تواند در صدها یا هزاران دستگاه به طور همزمان رخ دهد، نیاز به اجرای سناریوها از طریق دوقلوهای دیجیتال را برای اطمینان از درک کامل دامنه تغییر قبل از وقوع برای عناصری مانند تغییرات پیکربندی شبکه، به‌روزرسانی‌ها، ارتقاها و غیره. اپراتورها باید پذیرش این فناوری‌ها را تسریع بخشند – شبیه شبیه‌سازی‌هایی که صنعت هوافضا و هواپیما قبل از ساخت قطعات، هواپیما یا موشک انجام می‌دهد.

این مقاله در ابتدا در وبلاگ Forrester ظاهر شد

سئو PBN | خبر های جدید سئو و هک و سرور