Awaria chmury Amazona

White clouds on the blue sky. Nature background

Spora część serwisów internetowych trzyma swoje pliki w chmurze Amazon Web Services. Wystarczyło więc, że 28 lutego jedno z centrów danych AWS odmówiło posłuszeństwa, by padła połowa Internetu

Pierwsze kłopoty pojawiły się dzień wcześniej, ale 28 lutego wieczorem sytuacja była już naprawdę poważna. Serwery Amazon Web Services w jednym z centrów po prostu odmówiły posłuszeństwa, a wraz z nimi przestała działać część usług świadczonych przez tego operatora, w tym liczne strony i sklepy internetowe. Przykładowo przez dłuższy czas nie można było połączyć się z takimi portalami jak iFixit, Imgur, Quora i Giphy, pobrać programów z GitHuba ani skorzystać z usług Slack i Trello. Użytkownicy urządzeń Razera nie mogli ich natomiast skonfigurować, bo serwer nie odpowiadał. Jak na ironię nie działały również serwisy, na których sprawdza się dostępność innych stron, np. Is It Down Right Now i Down Detector. Użytkownicy zgłaszali również problemy z działaniem Aleksa, czyli asystenta głosowego Amazona.

Awaria i spowodowane nią problemy, a w konsekwencji poniesione straty finansowe zdenerwowały wielu managerów. Część klientów podeszła do sprawy ze zrozumieniem, ale w mediach społecznościowych pojawiło się bardzo dużo negatywnych wpisów. Na skutek awarii klienci AWS otrzymali wiele negatywnych opinii dotyczących swoich usług świadczonych za pośrednictwem AWS. Ponieważ skala awarii była przeogromna, Amazon na bieżąco informował o postępach prac naprawczych za pomocą swojego Twittera. Walka z problemem trwała kilka godzin i w końcu udało się przywrócić działanie serwerów, dzięki czemu użytkownicy odetchnęli z ulgą. To kolejny, po Cloudbleed, przykład, że centralizacja, choć ma swoje plusy, jest też sporym zagrożeniem. Błąd jednego podmiotu oznacza problemy setek, tysięcy, milionów…

Kto winien
Rozwiązania chmurowe idealnie sprawdzają się nie tylko przy przechowywaniu danych (np. Dropbox, Google Drive etc.), lecz także przy usługach hostingowych. Nie ma to jak dynamiczne tworzenie maszyn wirtualnych, do których w każdym momencie można dołożyć więcej pamięci RAM, dodatkową przestrzeń dyskową czy rdzeń procesora. Niestety, chmura to również kłopoty, o czym boleśnie przekonali się klienci korzystający z Amazon Web Services.

Dlaczego usługi chmurowe są tak popularne? Ponieważ pozwalają na bardzo efektywne wykorzystanie zasobów sprzętowych, dzięki czemu marnuje się bardzo niewiele zasobów obliczeniowych serwerów. Oznacza to, że zakup infrastruktury IT jest po prostu tańszy, bo nikt nie kupi serwera, który przez większość czasu będzie tylko pobierać prąd. Jednak czasami bywa tak, że nieodpowiednio zaprojektowane rozwiązania chmurowe są podatne na awarie. O ile uszkodzenie pojedynczego dysku twardego czy nawet całego serwera nikogo nie zaboli, o tyle poważna awaria całego magazynu danych może odbić się na całym systemie.

Czas na wnioski
Wszyscy, dla których dane są ważne, powinni więc potraktować incydent z AWS jako lekcję. Firmy powinny bowiem wiedzieć, gdzie znajdują się ich dane i jak szybko są w stanie je odzyskać. Don Foster, Sr. Director WW Solutions Marketing w firmie Commvault, przygotował mały poradnik odzyskiwania danych z chmury. Cztery punkty pomogą zrozumieć, jak ważne jest odpowiednie zarządzanie danymi, a ich wdrożenie ułatwi radzenie sobie z awariami operatorów chmury.

Jak odzyskać dane przechowywane w chmurze?

1. Zarządzaj danymi w regionie

Nie ma nic złego w umieszczaniu wszystkich swoich danych w jednej chmurze publicznej. Trzeba jednak wiedzieć, gdzie są one przechowywane. W przypadku problemów w jednym konkretnym regionie platforma do zarządzania danymi powinna dać jasny obraz danych pochodzących z innych. Przykładowo jeśli wszystkie dane firmy są przechowywane w jednym regionie, to konieczne jest zapewnienie pełnej kopii zapasowej danych przechowywanej w innym regionie, najlepiej jak najbardziej niezależnym i oddalonym od miejsca, gdzie znajdują się podstawowe dane. Takie podejście umożliwi szybkie odzyskanie danych w przypadku awarii i utrzymanie funkcjonowania firmy w czasie przerwy w dostawie usług operatora chmury. Co więcej, konieczne jest zagwarantowanie, by kopie zapasowe dla krytycznych danych i usług pochodzących z chmury były zawsze dostępne. Zautomatyzowanie backupu i możliwość weryfikacji kopii zapasowych znacznie to ułatwia, oszczędzając firmom niepotrzebnych strat, a managerom wiele stresu.

2. Poznaj lokalizację swoich danych

Firmy powinny mieć dostęp do informacji o lokalizacjach, w których przechowywane są wszystkie ich dane. Błędem jest zakładanie,że po przeniesieniu danych do chmury publicznej ich kopie są przechowywane w wielu regionach. Konieczne są: aktywne zarządzanie procesem  przechowywania danych i pełna wiedza o miejscu ich przechowywania. Potrzebna jest także tablica, która szybko pokaże, które dane są dotknięte konkretną awarią, i umożliwi przygotowanie krótkiego raportu. Takie podejście pomoże w szybkim podjęciu decyzji o działaniu, takim jak odzyskanie utraconych w jednym miejscu danych z kopii zapasowej przechowywanej gdzie indziej.

3. Zawsze miej plan B

Niestety, samo umieszczenie kopii zapasowej danych poza regionem ich przechowywania nie jest wystarczające, podobnie jak robienie kopii danych on-site. Potrzebna jest elastyczność przekładająca się na możliwość przenoszenia danych między różnymi lokalizacjami i różnymi platformami. Sama kopia zapasowa w formacie Amazon AMI nie zda się na wiele, jeśli infrastruktura firmowa jest oparta np. na rozwiązaniach MS Hyper-V czy VMware. W przypadku niedostępności źródła danych konieczne jest uruchomienie ich jednoczesnego odzyskiwania na miejscu, poza nim, a także między różnymi platformami hiperwizorów.

4. Opracuj strategię zarządzania danymi

Profesjonalne podejście i sprawdzenie podwykonawcy pomogą w osiągnięciu celów związanych z zarządzaniem danymi, a to znacznie ułatwi funkcjonowanie całej firmy i pomoże osiągnąć cele biznesowe. Commvault rozmawia o zarządzaniu danymi w chmurze z klientami na całym świecie. Takie awarie jak AWS to często czynnik mobilizujący do poważnego zastanowienia się nad kwestią strategii zarządzania danymi. Commvault kładzie duży nacisk na zarządzanie danymi i ich ochronę, mając świadomość, jak ważne są dane dla funkcjonowania każdej firmy.