در 22 فوریه، یک قطع خدمات گسترده در خدمات تلفن همراه AT&T بر مشترکان سراسر کشور تأثیر گذاشت. اگرچه حجم گزارشهای خاموشی صدها هزار نفر بود، اما این احتمالاً نوک کوه یخ است. آنچه در زیر خاموشی AT&T نهفته است، تعداد زیادی از مشترکین است که مشکلاتی را تجربه کردهاند اما آنها را گزارش نکرده یا نمیتوانند آنها را گزارش کنند، و همچنین خدماتی را که از شبکههای تلفن همراه استفاده میکنند (مانند خدمات ردیابی، پایانههای فروش و غیره) تحت تأثیر قرار دادهاند. .
این قطعی تقریباً 11 ساعت به طول انجامید و بر اساس تأثیرات قطعی های مشابه در گذشته در زمینه هایی مانند تراکنش های مالی و زنجیره تأمین، ما تأثیر آن بر اقتصاد ایالات متحده را 500 میلیون دلار برآورد می کنیم. در اینجا آنچه می دانیم اتفاق افتاده است و در آینده چه خواهد شد:
- یک شبکه پیش پا افتاده تغییر دادن باعث قطعی گسترده شد AT&T رسماً بیانیهای را در 22 فوریه منتشر کرد که این قطعی را به دلیل «… کاربرد و اجرای یک فرآیند نادرست که در حال گسترش شبکهمان بودیم، نه یک حمله سایبری…» نسبت میدهد – مشکل بزرگ چیست؟ برای بسیاری از ما در فناوری اطلاعات، فناوریهای سلولی بهعنوان پشتیبان فناوری زیربنایی برای شبکههای گسترده استفاده شدهاند و تأثیر را حداقل میکنند. اما برای برخی از شرکتها، اتصال سلولی راه نجات عملکردهای اصلی کسبوکار آنها مانند عملیات (به عنوان مثال، عملیات میدانی و ناوگان یا ردیابی و مدیریت دارایی) یا فروش (مانند پایانههای پرداخت، کیوسکها و غیره) است. در این شرایط، قطعی مانند این می تواند ویرانگر باشد.
- تحقیقات و قابل توجهی وجود خواهد داشت هزینه ها به AT&T… و در نهایت، مشتریان آن. زنجیرهای از رویدادها پس از قطعی رخ میدهد که با ارسال گزارش رسمی علت قطعی قطعی به FCC توسط AT&T آغاز میشود. به موازات آن، سازمان های دولتی ایالات متحده از تلاش ها برای رد هرگونه حمله سایبری احتمالی حمایت خواهند کرد. تخفیفها و اعتبارات مشتریان و همچنین دعاوی حقوقی از سوی مصرفکنندگان و کسبوکارها به جریان خواهند افتاد. AT&T فرآیندها و بهبودهای فناوری را برای رسیدگی به علت(های) ریشه ای اجرا خواهد کرد و FCC مجبور خواهد شد قوانین خود را بازبینی کند. اگر از خاموشی راجرز در کانادا در 8 ژوئیه 2022 به عنوان راهنما استفاده کنیم، تخمین می زنیم که AT&T با توجه به مدت زمان خاموشی و نسبت جمعیت، که می تواند در یک برنامه سه ساله قرار گیرد، تا 1.5 میلیارد دلار تأثیر خواهد داشت. همانطور که توسط راجرز انجام شد (10 میلیارد دلار کانادا در طول 3 سال). اگر چنین طرح بهبودی توسط AT&T تنظیم شود، ما انتظار داریم که در مجاورت 20 تا 30 میلیارد دلار آمریکا باشد. این احتمال وجود دارد که مشتریان نتیجه این کار را در هزینههای بالاتر مشاهده کنند، مشابه آنچه که مشترکان راجرز چند ماه پس از قطع شدن آن تجربه کردند.
این خبر خوبی برای کسی نیست. مهم است که به یاد داشته باشید که شبکه ها همیشه قطع و کاهش عملکرد خواهند داشت. موضوع فیزیک، مداخله انسان و پیچیدگی تکنولوژی است. چیزی که این خبر را ارزشمند کرد این بود که این یک حامل بزرگ است که شرکت ها و شهروندان به آن وابسته هستند. به این دلایل، اپراتورها با بالاترین استانداردها نگهداری می شوند – اغلب با SLA های پنج 9 در دسترس برای یک سال. این بدان معناست که بیش از 5 دقیقه و 15 ثانیه در سال در دسترس نیستید. 11 ساعت پایین بودن… این یک توپ جدید است. درس های کلیدی برای اپراتورها و رهبران فناوری اطلاعات از این رویداد ناگوار چیست؟
- رهبران فناوری اطلاعات باید قابلیتهای اتصال بیسیم دستگاه پایانی خود را دوباره بررسی کنند. مخصوصاً برای شرکتهایی که به اتصال سلولی تک حامل متکی هستند، ممکن است زمان آن رسیده باشد که در این رویکرد تجدید نظر کنند و اینکه آیا فناوریهای دیگر ممکن است نیازهای شما را بهتر برآورده کنند – به عنوان مثال، اجازه دادن به اتصال چند سیم کارت/eSIM اضافی یا داشتن چندین گزینه اتصال بیسیم. مانند ماهواره، LoRa، Sigfox، یا حتی WiFi در دستگاه های انتهایی شما. اما در اینجا چیزهای بیشتری برای یادگیری وجود دارد. به همان اندازه که ما شرکت های مخابراتی را به استانداردهای بالاتری نگاه می کنیم، می توانیم سعی کنیم از اشتباهات آنها جلوگیری کنیم…
- همه سازمان های شبکه باید نظارت، دید، قابلیت مشاهده و سرمایه گذاری های هوش مصنوعی را تسریع بخشند. همانطور که در بالا ذکر شد، شبکه ها همیشه قطع و کاهش عملکرد خواهند داشت. با این حال، تیمهای شبکهای برای برنامهریزی سختگیرانه و اقدامات پیشگیرانه تابآوری شناخته شده نیستند. به عنوان مثال، راه حل های نظارت بر شبکه معمولا یک فکر بعدی است. پس از بروز یک مشکل، به خصوص زمانی که نمی توان علت اصلی را پیدا کرد، تیم های شبکه روی یک راه حل نظارت سرمایه گذاری می کنند. بخشی از مسئله کمبود بودجه برای اصول اولیه در مقابل چشمک زدن مفاهیم جدید، مانند شبکه های مستقل، شبکه مبتنی بر هدف، و شبکه به عنوان یک سرویس است. اما این رویکرد چیزی نیست جز چسباندن شکاف بر روی بال هواپیما و باید به تدریج حذف شود. به روز بودن و تعمیر سریع برای تجربه مشتری ضروری است. این امر باعث می شود اتوماسیون شبکه، مدیریت عملکرد (از جمله قابلیت مشاهده، قابلیت مشاهده و AIOps)، تجزیه و تحلیل سریع برای تحلیلگران ریشه ای/CAST، و بهبودهای سیستمی از طریق هوش مصنوعی ضروری باشد. اتوماسیون و هوش مصنوعی هر قطعی را از بین نمیبرد، اما میتواند به کشف و جلوگیری از بسیاری از قطعها و کاهش عملکرد در حین اجرای شبیهسازیها قبل از تغییرات یا مشکلات کمک کند.
- شرکت های پیشرفته، مانند اپراتورها، باید به دنبال روش های پیشرفته باشند. انتظارات برای شرکت های بزرگ، به ویژه شرکت های حمل و نقل، حتی بالاتر است. دیگر صرف سرمایه گذاری کامل در موارد بالا کافی نیست. آنها باید به شیوههای پیشرفتهای مانند پارچههای شبکههای تجاری، شبیهسازی/دوقلوهای دیجیتالی، ارتباطات رویدادهای بلادرنگ، و غیره فشار بیاورند. چرا اینها اینقدر مهم هستند؟ شبکههای تقسیمبندیشده گذشته اجزای گسستهای بودند که بهصورت دستی با تغییراتی که در هر نقطه شبکه، بهطور متوالی و در یک دوره طولانی رخ میداد، کنترل میشدند. ظهور شبکههای تجاری در سطح تجاری که توسط نرمافزار کنترل میشوند، که در آن یک تغییر میتواند در صدها یا هزاران دستگاه به طور همزمان رخ دهد، نیاز به اجرای سناریوها از طریق دوقلوهای دیجیتال را برای اطمینان از درک کامل دامنه تغییر قبل از وقوع برای عناصری مانند تغییرات پیکربندی شبکه، بهروزرسانیها، ارتقاها و غیره. اپراتورها باید پذیرش این فناوریها را تسریع بخشند – شبیه شبیهسازیهایی که صنعت هوافضا و هواپیما قبل از ساخت قطعات، هواپیما یا موشک انجام میدهد.
این مقاله در ابتدا در وبلاگ Forrester ظاهر شد