تاریخچه ای از اختلالات Google Cloud و Data Center

علیرغم شهرت گوگل برای قابلیت اطمینان، قطعی ها چیز جدیدی نیستند خواه ناشی از به‌روزرسانی‌های نرم‌افزار، مشکلات شبکه، یا – در موارد کمتر – آتش‌سوزی مرکز داده، قطعی سرویس‌های Google می‌تواند باعث اختلال جدی برای کاربران شود.

در اینجا یک جدول زمانی از قطعی های مهم Google آورده شده است که علل، تأثیرات و پاسخ Google این حوادث را تحلیل می کند:

آوریل 2023: روز بارانی گوگل در پاریس

در آوریل 2023، Google Cloud با یک روز چالش برانگیز سیل، آتش سوزی مرکز داده و سایر مشکلات شبکه ابری Google که باعث اختلال در خدمات در چندین منطقه خدماتی می شود. ادامه مطلب

آگوست 2022: Google Data Center Fire

در 8 آگوست 2022، یک حادثه الکتریکی باعث آتش سوزی در محوطه مرکز داده گوگل در شورای بلوفس، آیووا شد و سه کارمند مجروح شدند. اگرچه آتش سوزی در همان روزی رخ داد که نقشه ها و خدمات جستجوی شرکت قطع شد گوگل گفت این دو حادثه ربطی نداشتند. ادامه مطلب

تاریخچه ای از اختلالات Google Cloud و Data Center

جولای 2022: مراکز داده گوگل توسط هیت لندن آفلاین شدند

در جولای 2022 دمای لندن به 40 درجه سانتیگراد رسید. گوگل و اوراکل مشکلاتی را با سیستم های خنک کننده خود تجربه کردند در گرما، باعث قطع و آفلاین شدن برخی وب سایت ها می شود. ادامه مطلب

دسامبر 2020: سرویس‌های Google از جمله جی‌میل، یوتیوب دچار قطعی شدید شدند

گوگل خاموشی در دسامبر 2020 Gmail، YouTube، Pokémon GO، Google Home و سایر محصولات در سطح جهانی را تحت تأثیر قرار داد. در حالی که خاموشی ها غیرمعمول نیستند، این قطعی خاص به دلیل تأثیر آن در سراسر مجموعه Alphabet قابل توجه بود. اکثر خدمات آسیب دیده ظرف یک ساعت به عملکرد خود بازگشتند. ادامه مطلب

مرتبط:مرکز داده بازیابی فاجعه: اقدامات ضروری برای تداوم کسب و کار

جولای 2018: اختلال Google Cloud Snapchat و Spotify را از کار انداخت

در جولای 2018، برنامه های محبوب، از جمله Snapchat و Spotify، به طور موقت پایین آمد پس از شکست خدمات رایانش ابری گوگل. در حالی که در ابتدا مشخص نبود چه چیزی باعث این قطعی شده است، گزارش‌هایی مبنی بر وقوع یک حادثه در داشبورد وضعیت ابری Google وجود دارد. ادامه مطلب

نوامبر 2017: خطای خطای مرکز داده، خدمات آفلاین Google Cloud را آغاز می کند

Memcache – بخشی از Google App Engine – در نوامبر 2017 سقوط کرد. با در دسترس نبودن Memcache، درخواست‌ها به سرویس Datastore رفتند و فعالیت‌های زیادی را ایجاد کردند که منجر به خطاها و مشکلات تاخیر شد. ادامه مطلب

آگوست 2016: گوگل توضیح می دهد که چه چیزی اشتباه باعث قطع PaaS شده است

در 11 اوت 2016، یک قطعی دو ساعته در Google App Engine 37 درصد از برنامه های میزبانی شده در منطقه مرکزی ایالات متحده را تحت تأثیر قرار داد. گوگل علت این حادثه را به‌روزرسانی نرم‌افزار مسیریاب ترافیکی می‌داند که باعث راه‌اندازی مجدد در طول تعمیر و نگهداری دوره‌ای استاندارد می‌شود، که مهندسین برنامه‌ها را بین مراکز داده جابجا می‌کنند. کاهش ظرفیت روتر در نهایت به بارگذاری بیش از حد منجر شد و تغییر مسیر ترافیک دستی گوگل برای حل مشکل کافی نبود تا زمانی که یک خطای پیکربندی که باعث عدم تعادل ترافیک می‌شد شناسایی و برطرف شد. ادامه مطلب

مرتبط:تاریخچه AWS Cloud و مرکز داده قطع می شود

Google-Cloud.jpg

آوریل 2016: Google پس از قطع شدن موتور محاسباتی Google، هزینه مشتریان Cloud را بازپرداخت می کند

یک قطعی 18 دقیقه ای در آوریل 2016 کاربران Google Cloud Engine را در چندین منطقه تحت تاثیر قرار داده است. پس از این حادثه، گوگل مدعی شد که تیم‌های مهندسی آن بر روی مجموعه وسیعی از سیستم‌های پیشگیری، شناسایی و کاهش با هدف افزودن دفاع اضافی کار می‌کنند و تا 25 درصد از هزینه‌های ماهانه کاربران را بازپرداخت می‌کند. ادامه مطلب

آگوست 2015: رعد و برق در بلژیک خدمات ابری گوگل را مختل کرد

در آگوست 2015، یک سری از رعد و برق در بلژیک برخی از سیستم های ذخیره سازی ابری را آفلاین کرد. گزارش‌ها ابتدا اعلام کرده بودند که صاعقه به سیستم‌های الکتریکی در یکی از مراکز داده آن در شهر کوچک سنت گیسلین اصابت کرده است، اما یک سخنگوی بعدا تایید کرد که یک شبکه برق محلی مورد اصابت قرار گرفته است. ادامه مطلب

مارس 2015: گوگل قطع شدن ابر را به وصله معیوب ردیابی می کند

در مارس 2015، برای دومین بار در یک ماه، Google Compute Engine دچار قطعی شد، برخی از کاربران تا 45 دقیقه با اختلال مواجه می شوند. این یک قطعی جزئی بود، به این معنی که برخی از کاربران تحت تأثیر قرار نگرفتند، برخی شاهد کاهش سرعت بودند، در حالی که برخی دیگر با مشکلاتی در تماس با ماشین‌های مجازی ابری خود مواجه شدند. گوگل یک مشکل وصله را به عنوان عامل ایجاد این مشکلات شناسایی کرد. این تغییر پیکربندی قبل از استقرار آزمایش شد، اما روی برخی از ماشین‌های مجازی در زمان فعال تأثیر گذاشت. ادامه مطلب

مرتبط:پاسخ به حادثه: درس های آموخته شده از آتش سوزی مرکز داده

فوریه 2015: موتور محاسباتی گوگل، AOL دچار قطعی های صبح زود

19 فوریه 2015، شاهد دو خاموشی در همان روز بودیم: موتور محاسباتی گوگل از کار افتاده بود در چندین منطقه برای حدود یک ساعت، و AOL یک قطعی طولانی را تجربه کرد که بیشتر صبح ادامه داشت. گوگل حادثه موتور محاسباتی گوگل را به دلیل مشکلات شبکه که باعث از دست رفتن اتصال در بسیاری از مناطق شد، مقصر دانست. سرویس ایمیل AOL پس از یک صبح مشکلات حل شد، با تاخیر AOL در افشای علت مشکل – برخی ادعا کردند مشکل شبکه وجود داشته است. ادامه مطلب

اکتبر 2014: چندین سرویس ابری Google از کار افتادند

کاربران سرویس های ابری گوگل مشکلاتی را با جیمیل تجربه کردید، Google Hangouts، Google Analytics، و سرویس امنیتی ایمیل گوگل Postini در اکتبر 2014. در حالی که این حادثه اکثر کاربران را تحت تاثیر قرار داد، نسبتاً سریع حل شد. ادامه مطلب

ژانویه 2014: قطع شدن برنامه وب جیمیل

در 24 ژانویه 2014، برنامه پر استفاده Gmail به دلیل یک اشکال داخلی که “پیکربندی نادرست” ایجاد می کرد، از کار افتاد. ادامه مطلب

دسامبر 2012: رفتار اشتباه Load Balancer در Google Outage ذکر شد

در دسامبر 2012، یک گزارش حادثه تایید کرد که علت قطعی اخیر جیمیل به‌روزرسانی نرم‌افزاری است که باعث ایجاد مشکل در شبکه، به‌ویژه در بار متعادل‌کننده‌های گوگل شده است. گوگل توضیح داد که “اشکال در به روز رسانی نرم افزار باعث شده است که بخشی از مراکز داده گوگل به اشتباه تفسیر شود که در دسترس نیستند.” این قطعی باعث ایجاد مشکلاتی برای دسترسی کاربران به Gmail شده بود و بسیاری از کاربران کروم نیز با خرابی مرورگر مواجه شدند. ادامه مطلب

فوریه 2010: وقتی برق در گوگل قطع شد

پس از قطع برق در فوریه 2010، گوگل مجموعه ای از گام هایی که قرار است برداشته شود را به اشتراک گذاشت برای رسیدگی به حادثه Google متعهد به تمرین‌های برنامه‌ریزی‌شده اضافی برای کارکنان آماده‌کار، ممیزی منظم اسناد عملیاتی، چارچوب خط‌مشی روشن برای مواقع اضطراری، و تغییر زیرساخت عمده در App Engine است. این قطعی بیش از دو ساعت برای Google App Engine از کار افتاده بود. ادامه مطلب

سپتامبر 2009: امواج روتر در قطع Gmail ذکر شد

در 1 سپتامبر 2009، الف قطع شدن جیمیل به این معنی که کاربران قادر به دسترسی به جیمیل از طریق رابط وب نبودند. گوگل اعلام کرد که علت آن دست کم گرفتن باری است که تعمیر و نگهداری معمول در برخی از سرورهای جیمیل روی روترهای پشتیبانی کننده وارد می کند. گوگل این مشکل را با آنلاین کردن روترهای اضافی برطرف کرد و گفت که سپس ظرفیت روتر Gmail را افزایش داده و اقدامات بیشتری را برای جلوگیری از تکرار این حادثه انجام می دهد. ادامه مطلب

ژوئیه 2009: موتور برنامه Google با خاموشی مواجه شد

در 2 ژوئیه 2009، Google App Engine را تجربه کرد تاخیر و نرخ خطا بالا، باعث ایجاد ساعت ها مشکلات عملکرد – همه برنامه هایی که به Datastore دسترسی دارند تحت تأثیر قرار گرفتند. ادامه مطلب

مه 2009: خاموشی مجدد برای Google

در 14 می 2009 خطایی در یکی از سیستم های گوگل رخ داد باعث هدایت ترافیک شد از طریق آسیا، ایجاد ترافیک. این حادثه حدود 14 درصد از کاربران را تحت تأثیر قرار داد و مشکلاتی در Google News، Gmail، و Google Calendar و سایر خدمات گزارش شد. ادامه مطلب

فوریه 2009: قطع جی میل با تمرکز بر شبکه اروپایی

قطعی جیمیل در 24 فوریه 2009، به دلیل اختلال در مراکز داده اروپایی آن. مشکلات غیرمنتظره به‌روزرسانی نرم‌افزار منجر به بیش از دو ساعت از کار افتادن کاربران Gmail شد. ادامه مطلب

آگوست 2008: قطع سرویس جیمیل

در 11 آگوست 2008، سرویس جیمیل قطع شد: بسیاری از کاربران جیمیل به دلیل مشکلی در سیستم مخاطبین مورد استفاده گوگل که مانع از بارگیری صحیح جیمیل می شد، نمی توانستند به ایمیل خود دسترسی پیدا کنند. ادامه مطلب

ژوئن 2008: Google App Engine قطع شد

در 17 ژوئن 2008، Google App Engine، پلت فرم محاسباتی ابزار برای توسعه دهندگان، چندین قطعی طولانی مدت را تجربه کرد که طی آن درصد قابل توجهی از درخواست ها منجر به خطا می شود. خطاها مربوط به Datastore بود. ادامه مطلب


Source link