Disaster Recovery Center, czyli biznes gotowy na wszystko?

W erze cyfrowej transformacji nieprzerwany dostęp do danych, a także zabezpieczenie przed ich ewentualną utratą, stają się jednym z najbardziej strategicznych wyzwań dla wielu przedsiębiorstw. Dotyczy to zarówno dużych jak i małych firm, jak i praktycznie każdej branży.

budowa remont adaptacja pomieszcsenia robotnicy dyskutują o planach budowy

Jeszcze kilka lat temu większość firm budując swoje systemy informatyczne inwestowała we własną infrastrukturę IT, co wiązało się z adaptacją pomieszczeń, zapewnieniem odpowiedniej klimatyzacji oraz niezawodnego zasilania, zakupem serwerów, macierzy dyskowych, budowie sieci SAN, LAN. Ponadto należało zapewnić na tyle wykwalifikowany personel, który będzie znać nie tylko wewnętrzne aplikacje, ale również wspierać całą tę infrastrukturę. Wielu właścicieli firm uświadamiało sobie wtedy, że utrzymanie tego wszystkiego jest sporym wyzwaniem, szczególnie biorąc pod uwagę fakt rotacji pracowników branży IT oraz niezbędnych kompetencji jakie powinni oni posiadać.

To był moment, kiedy rozpoczął się trend przenoszenia systemów do ośrodków centrum przetwarzania danych data center – takich jak np. 3S Data Center, który rozwiązuje problemy z infrastrukturą oraz ludźmi do jej obsługi. W takim modelu przedsiębiorca wraz z wewnętrznym działem IT może się skupić na swoich innych zadaniach oraz przede wszystkim na priorytetach biznesowych. Należy jednak pamiętać, że nie ma na świecie niezniszczalnych obiektów, którym nie grozi absolutnie żadne ryzyko. Awarie sprzętu czy po prostu zniszczenia będące efektem trudno przewidywalnych zdarzeń losowych, mogą pojawić się w najlepszych DC na świecie. Dlatego każda firma powinna zastanowić się nad zasadnością posiadania DRC (Disaster Recovery Center).

Dowiedz się więcej o 3S Cloud Disaster Recovery >>

Grupa 3S Data Center Katowice ul. Ligocka Szafy kolokacyjne

Obecnie najczęściej spotykanymi trendami w budowie wysoko dostępnych środowisk wykorzystywanych w rozwiązaniach disaster recovery są:

  • Klaster wysokiej dostępności (HA), zapewniający dostęp do danych w przypadku niewielkich awarii sprzętowych. Dodatkowo dane zabezpieczone są serwerem backup’u wraz z repozytorium wyniesionym gdzieś do osobnej, oddalonej geograficznie lokalizacji. Przedsiębiorca jest w takim przypadku chroniony przed awarią nawet całego serwera fizycznego, ale już w sytuacjach związanymi z uszkodzeniem maszyn wirtualnych (np. celowe usunięcie danych, zainfekowanie ransomware) czy awarii całego DC nie ma pewności szybkiego odzyskania dostępu do danych. W takich przypadkach pozostaje odtwarzanie z backupu co w zależności od wolumenu, może wiązać się z długim czasem odzyskiwania. Należy wziąć również pod uwagę fakt, że w przypadku zniszczenia ośrodka data center będzie trzeba poszukać miejsca, gdzie można się odtworzyć. Czas na wykonanie całego planu awaryjnego (DRP – Disaster Recovery Plan) może być liczony w dniach lub nawet tygodniach. Oczywiście to jest scenariusz wręcz apokaliptyczny, jednak możliwy.

 

  • Klaster wysokiej dostępności (High Availability) rozciągnięty na dwie lokalizacje geograficzne (Active-Active). Dzięki replikacji synchronicznej na poziomie macierzy dyskowych, często nazywanej MetroCluster’em, posiadamy te same dane w tym samym momencie w jednym i drugim ośrodku data center. Dodatkowo całość zabezpiecza backup w oddzielnej lokalizacji. W tym przypadku oznacza to ochronę przed awarią całej serwerowni. Ograniczeniem tutaj jest odległość pomiędzy lokalizacjami DC. W zależności od rozwiązania 5 lub 10ms RTT (Round Trip Time). Klaster Active-Active ma też swoje wady – nie chroni przed uszkodzeniami na poziomie systemu plików czy np. atakami ransomware (problem w jednym ośrodku w ułamku sekundy dotyczy również drugiego) – pozostaje nam wtedy odtwarzanie awaryjne z backupu (Disatser Recovery).
testowanie-nowego-srodowiska-it

Zreplikowane produkcyjne środowisko ma też jedną fundamentalną zaletę może służyć jako środowisko do wszelakiego rodzaju testów – tak jakbyśmy to robili na tzw. produkcji. Po przeprowadzeniu prac, wszystkie zmiany zostają cofnięte i możemy kontynuować naszą replikację asynchroniczną. 

środowisko IT

Utrzymanie środowiska DRC nie jest zadaniem łatwym. Szczególnie, że wszystkie systemy informatyczne ewoluują, powstają nowe, a inne są wygaszane. Aby w przypadku awarii nie tracić czasu, powinniśmy cyklicznie testować oraz aktualizować nasze plany DRP (Disaster Recovery Plan). Dobrą praktyką jest utrzymywanie planu w dwóch wersjachpełnej zawierającej maksimum informacji oraz skróconej do minimum zawierającej tylko niezbędne kroki podejmowane w przypadku awarii – bez opisów z czego wyniknęła, ponieważ osoby wykonujące plan DR powinny być zaznajomione z pełną wersją dokumentu.

negocjacje-strategiczne-biznes-plan-straty-i-budowa-planu-kryzysowego

Wdrożenie rozwiązania DRC powinno być poprzedzone analizą BIA i opracowaniem BCP.

Na podstawie analizy BIA (Business Impact Analysis) można zbudować plan ciągłości działania BCP (Business Continuity Plan), który zawierać będzie kroki jakie należy podjąć w celu uniknięcia niepotrzebnego ryzyka. Z tych dwóch dokumentów powinny wynikać dwa ważne parametry dla projektantów środowisk IT:

Te dwa parametry pozwalają skomunikować ludzi od biznesu z architektami IT, który dobiorą rozwiązanie spełniające wymagania dla konkretnych aplikacji.

it-prawo-paragrafy

Decyzja o konieczności posiadania środowiska zapasowego DRC często jest wynikiem nie tylko analizy BIA, ale również może to być wymóg regulacji prawnych takich jak rekomendacja D wydana przez KNF (Komisja Nadzoru Finansowego) dla sektora bankowego, czy też regulacje w stosunku do niektórych systemów służby ochrony zdrowia.

veeam cloud connect

W przypadku gdy posiadanie zapasowego centrum danych jest dużym wyzwaniem finansowym, warto rozważyć alternatywy dostępne na rynku, takie jak usługi Veeam Cloud Connect. Rozróżniamy tutaj dwa rodzaje usługi:

  • Veeam CloudConnect Backup – umożliwia dostęp do repozytorium na backupy w „chmurze” czyli w ośrodku takim jak 3S Data Center – jest to tylko dodatkowa przestrzeń dyskowa powodująca, że posiadamy kopię backupu poza naszą infrastrukturą, a jednocześnie dane nadal znajdują się fizycznie na terytorium Polski. Można z tego miejsca odtworzyć swoje dane, ale… trzeba mieć też, gdzie. Ten problem rozwiązuje drugi typ usługi Cloud Connect
  • Veeam CloudConnect Replica – jest to dodatkowo moc obliczeniowa w postaci CPU, RAM, Storage. W tym przypadku nie przechowujemy plików backupu (.vbk) ale kompletne wirtualne maszyny gotowe do uruchomienia.
zarzadzanie-kryzysem

Warto zauważyć, że o środowisku DRC można mówić nie tylko w kontekście czysto informatycznym. Katastrofą może być objęte miejsce pracy wielu ludzi i aby biznes przetrwał nie wystarczy zapewnienie samego dostępu do danych, ale należy również zadbać o miejsce, gdzie Ci ludzie będą mogli szybko i sprawnie się przenieść, aby kontynuować swoje zadania. W największych firmach praktyką stała się okresowa symulacja „katastrof”, gdzie sprawdzany był czas relokacji pracowników lub nawet takie scenariusze, w których połowa z tych pracowników nie pojawia się przez jakiś czas w firmie. Pokazuje to dużą świadomość i dojrzałość danego przedsiębiorstwa, które potrafi wyciągać właściwe wnioski i rozsądnie podejmuje decyzje związane z krytycznym obszarami własnej działalności.

Zastanawiasz się nad wdrożeniem DRC dla swojego biznesu? Chętnie podpowiemy od czego zacząć.

Skontaktuj się z doradcą z Grupy 3S

    BIA

    BIA (Business Impact Analysis) – systematyczny proces mający na celu identyfikację i ocenę możliwych skutków przerwania kluczowych procesów biznesowych w wyniku katastrofy, wypadku lub sytuacji nadzwyczajnej. BIA jest integralną częścią planu ciągłości działania organizacji. Obejmuje komponenty:

    • poszukiwawczy – którego celem jest wykrycie słabych punktów
    • planowania – którego celem jest opracowanie strategii minimalizacji ryzyka.

    Rezultatem jest raport analizy wpływu biznesowego opisujący potencjalne zagrożenia dla badanej organizacji.

    Podstawowym założeniem BIA jest to, że każda część organizacji zależy od ciągłego funkcjonowania wszystkich pozostałych jej części, ale niektóre z nich są ważniejsze od innych i wymagają większego przydziału środków po katastrofie.

    BCP

    BPC (Business Continuity Plan) – dokument opisujący sposób pracy firmy podczas nieplanowanych zakłóceń. BPC jest bardziej wszechstronny niż plan odzyskiwania po awarii i obejmuje ewentualności dotyczące procesów biznesowych, aktywów, zasobów ludzkich i partnerów biznesowych – każdego aspektu działalności, na który może mieć wpływ.

    RTO

    RTO (Recovery Time Objective) – inaczej cel czasu przywracania stanowi kluczowy wskaźnik, który pozwala obliczyć, jak szybko system lub aplikacja musi zostać przywrócona po przestojach, aby nie zakłócać znacząco funkcjonowania firmy.

    RPO

    RPO (Recovery Point Objective) – inaczej cel punktu przywracania –  to wiek plików, które muszą zostać przywrócone z magazynu kopii zapasowej, w celu przywrócenia normalnej pracy w przypadku awarii komputera, systemu lub sieci spowodowanej awarią sprzętu, programu lub komunikacji. RPO wyraża się wstecz w czasie, tj. w przeszłości, od momentu wystąpienia błędu, i może być wyrażony w sekundach, minutach, godzinach lub dniach. Jest to ważna kwestia w planie odzyskiwania po awarii (DRP).

    RPO określa, ile czasu może upłynąć, zanim ilość utraconych danych przekroczy poziom dozwolony w ramach Business Continuity Plan (BCP).

    Rekomendacja D wydana przez KNF

    Rekomendacja D wydana przez KNF – dokument z rekomendacjami dotyczącymi  zarządzania obszarami technologii informacyjnej i bezpieczeństwa środowiska teleinformatycznego w bankach. 

    Treść rekomendacji D wydanej przez KNF >>

    Ta strona wykorzystuje pliki cookies w celu ulepszenia działania seriwsu