kopie zapasowe, migawki, klonowanie i replikacja to cenne sposoby ochrony danych organizacji.
w tym artykule przyjrzymy się replikacji, w szczególności między macierzami pamięci masowej. Kluczem do tego będzie zdefiniowanie go i przedstawienie zalet i wad replikacji w odniesieniu do innych metod ochrony danych.
zbyt często jest w nim brak jasności co do tego, czym dokładnie jest lub czym jest technologia. To ostatnie jest ważne, ponieważ to, jak funkcjonują różne technologie, może określić, w jaki sposób pasują do siebie.
replikacja kontra migawki
replikacja jest zasadniczo sposobem wytwarzania klonu jednostki pamięci masowej. Innymi słowy, jest to na przykład replika napędu, objętości lub logicznego numeru jednostki (LUN). W większości przypadków dąży się do dokładnej kopii – może niemal natychmiast, może po prostu w końcu.
to sprawia, że klon lub replika różni się od migawki, ponieważ migawki w większości przypadków mogą stać się użyteczną repliką po pewnym procesie odbudowy. Dzieje się tak dlatego, że migawki zawierają oryginalną kopię dysku lub woluminu oraz aktualizacje do niego, a także być może usunięte bloki, które muszą zostać przywrócone, aby utworzyć dokładną kopię z poprzedniego punktu w czasie.
chodzi o to, że migawki można szybko przebudować i cofnąć, ale nie ma ich jako alternatywnej, użytecznej kopii nośnika źródłowego. Tymczasem klony i repliki często są.
najprostszy klon / replika jest wtedy, gdy na przykład programista potrzebuje bazy danych, aby uruchomić kilka zapytań testowych. Mogą sklonować dokładną kopię istniejącej produkcyjnej bazy danych i robić z nią, co chcą, w środowisku testowym. Ten klon będzie dokładną repliką bazy danych w momencie jej utworzenia, ale prawdopodobnie nigdy nie będzie odzwierciedlał żadnych dalszych zmian w źródłowej kopii.
ale na drugim końcu skali pod względem tworzenia dostępnego, działającego klonu jest replikacja synchroniczna. Dzięki temu dane zapisywane do dwóch lub więcej jednostek pamięci są jak najbliżej siebie jednocześnie, aby zapewnić kopię roboczą, której można nie wykonać w locie.
oczywiście ma to swoją cenę pod względem kosztów i złożoności technicznej i są ograniczenia, jak zobaczymy. Ale to jest często to, co mamy na myśli, gdy mówimy o replikacji.
replikacja a kopia zapasowa
czy replikacja może zastąpić kopie zapasowe? Prosta odpowiedź brzmi: nie. Kopie zapasowe i replikacja (a może i migawki) muszą się uzupełniać.
ponieważ replikacja może być prawie ciągła i tworzyć kopię w czasie zbliżonym do rzeczywistego, może również tworzyć replikę uszkodzonych lub zainfekowanych plików. W takim przypadku potrzebujesz wersji, do której możesz wrócić.
które mogą pochodzić z migawki, ale muszą być również wspierane przez kopie zapasowe – a replikacja jest często kosztowna, więc może się zdarzyć, że tylko niektóre zbiory danych są replikowane podczas tworzenia kopii zapasowych.
Synchroniczna i asynchroniczna replikacja tablic
w replikacji synchronicznej dane mogą być zapisywane do drugiej witryny, gdy tylko trafią do pamięci podręcznej w witrynie głównej. Po otrzymaniu druga witryna wysyła potwierdzenie do głównego magazynu witryny i hosta, z którego pochodzi zmiana. Jest to metoda replikacji, która zbliża się do zapisu wielu kopii danych tak blisko jednocześnie, jak to możliwe.
replikacja Synchroniczna jest często zachowaniem większości wysokiej klasy macierzy pamięci blokowej.
asynchroniczna replikacja dodaje etap do procesu, potwierdzając hosta w głównym miejscu, gdy dane są zapisywane. Następnie zapis jest wysyłany do drugiej witryny, która potwierdza, że Odpisz z powrotem do głównej tablicy witryny. Replikacja asynchroniczna występuje w szerszej gamie produktów pamięci masowej, takich jak pamięć masowa iSCSI, pamięć sieciowa (NAS) i tak dalej.
replikacja na dużych odległościach zaczyna cierpieć z powodu około milisekundy opóźnienia na 100 mil, a dostawcy często zalecają nie więcej niż kilkuset mil w obie strony.
z tego powodu synchroniczna replikacja może mieć większy wpływ na wydajność aplikacji. Wymaga potwierdzenia przed następnym wejściem/wyjściem (I / O) może mieć miejsce, podczas gdy asynchroniczna replikacja potwierdza lokalnie, więc następna zmiana może mieć miejsce, z opóźnieniem ruchu danych. Oczywiście oznacza to również, że dwa zestawy danych będą się różnić przez dłuższy czas.
strategia replikacji w świecie rzeczywistym może wykorzystywać kombinację replikacji synchronicznej-dla najbardziej krytycznych elementów aplikacji, takich jak ponowne rejestrowanie logów – podczas gdy mniej krytyczne dane, które można przywrócić, przechodzą przez asynchroniczny. Migawki mogą również stanowić część mieszanki, ale wszystko musiałoby być wspierane regularnymi kopiami zapasowymi.
replikacja hosta, hipernadzorcy i chmury
tutaj zajmujemy się przede wszystkim synchroniczną i asynchroniczną replikacją w macierzach pamięci masowej.
istnieją inne formy replikacji, takie jak:
- replikacja hosta-między serwerami, być może poszczególnych aplikacji, baz danych lub całego serwera.
- replikacja hipernadzorcy-replikacja zarządzana na poziomie hipernadzorcy i składająca się z jej elementów, takich jak na przykład pojedyncze maszyny wirtualne (VM) i pamięć wirtualna.
- replikacja chmury-może to być replikacja do chmury lub wielu chmur jako celu lub między chmurami.
- replikacja geograficzna – to miejsce, w którym dane są przechowywane w wielu odległych lokalizacjach, potencjalnie bardzo odległych od siebie. Może to być spowodowane odzyskiwaniem po awarii lub zwiększeniem dostępności. Replikacja na tak duże odległości prawdopodobnie nie będzie synchroniczna.