Storage 101: Replikation vs. Backup und synchron vs. asynchron

Backups, Snapshots, Klonen und Replikation sind wertvolle Methoden zum Schutz der Unternehmensdaten.

In diesem Artikel betrachten wir die Replikation, insbesondere zwischen Speicherarrays. Der Schlüssel dazu wird sein, es zu definieren und die Vor- und Nachteile der Replikation in Bezug auf andere Methoden des Datenschutzes darzustellen.

Allzu oft fehlt es in der IT an Klarheit darüber, was genau eine Technologie ist oder tut. Letzteres ist das Wichtige, denn es ist, wie verschiedene Technologien funktionieren, die bestimmen können, wie sie zusammenpassen.

Replikation versus Snapshots

Replikation ist grundsätzlich eine Methode zur Erzeugung eines Klons einer Speichereinheit. Mit anderen Worten, es handelt sich beispielsweise um eine Replik eines Laufwerks, Volumes oder einer Logical Unit Number (LUN). In den meisten Fällen wird eine exakte Kopie angestrebt – vielleicht fast sofort, vielleicht nur irgendwann.

Dadurch unterscheidet sich ein Klon oder ein Replikat von einem Snapshot, da Snapshots in den meisten Fällen nur nach einer Art Wiederherstellungsprozess zu einem verwendbaren Replikat werden können. Dies liegt daran, dass Snapshots eine Originalkopie des Laufwerks oder Volumes sowie Aktualisierungen sowie möglicherweise gelöschte Blöcke enthalten, die erneut integriert werden müssen, um eine genaue Kopie von einem früheren Zeitpunkt zu erstellen.

Die Idee ist, dass Snapshots ziemlich schnell neu erstellt und zurückgesetzt werden können, aber sie sind nicht als alternative, verwendbare Kopie des Quellmediums vorhanden. Inzwischen sind Klone und Repliken oft.

Der einfachste Klon / Replikat von allen ist, wenn zum Beispiel ein Entwickler eine Datenbank benötigt, um einige Testabfragen auszuführen. Sie können eine exakte Kopie einer vorhandenen Produktionsdatenbank klonen und damit in der Testumgebung tun, was sie wollen. Dieser Klon ist eine exakte Replik der Datenbank zum Zeitpunkt ihrer Erstellung, spiegelt jedoch wahrscheinlich nie weitere Änderungen an der Quellkopie wider.

Aber am anderen Ende der Skala in Bezug auf die Erstellung eines verfügbaren, funktionierenden Klons steht die synchrone Replikation. Dies sieht vor, dass Daten auf zwei oder mehr Speichereinheiten so nahe wie möglich gleichzeitig geschrieben werden, um eine Arbeitskopie bereitzustellen, die on-the-fly ausgefallen werden kann.

Offensichtlich hat dies seinen Preis in Bezug auf Kosten und technische Komplexität, und es gibt Einschränkungen, wie wir sehen werden. Aber das ist es oft, was wir meinen, wenn wir über Replikation sprechen.

Replikation versus Backup

Kann Replikation Backups ersetzen? Die einfache Antwort lautet nein. Backups und Replikation (und vielleicht auch Snapshots) müssen sich ergänzen.

Da die Replikation nahezu kontinuierlich erfolgen kann und eine Kopie nahezu in Echtzeit erstellt wird, kann auch eine Replik beschädigter oder infizierter Dateien erstellt werden. In diesem Fall benötigen Sie eine Version, zu der Sie ein Rollback durchführen können.

Das könnte aus einem Snapshot abgeleitet werden, aber dann müssen sie auch durch Backups untermauert werden – und die Replikation ist oft kostspielig, so dass es sein kann, dass nur bestimmte Datensätze repliziert werden, während alles gesichert wird.

Synchrone vs. asynchrone Array-Replikation

Bei der synchronen Replikation können Daten an den zweiten Standort geschrieben werden, sobald sie den Cache am primären Standort erreichen. Nach Erhalt sendet der zweite Standort eine Bestätigung an den primären Standortspeicher und den Host, von dem die Änderung stammt. Es ist die Replikationsmethode, die dem Schreiben mehrerer Kopien von Daten so nahe wie möglich kommt.

Die synchrone Replikation ist häufig den meisten High-End-Blockspeicherarrays vorbehalten.

Die asynchrone Replikation fügt dem Prozess eine Stufe hinzu, indem der Host am primären Standort beim Schreiben der Daten bestätigt wird. Dann wird der Schreibvorgang an den zweiten Standort gesendet, der das Zurückschreiben in das primäre Standortarray bestätigt. Asynchrone Replikation findet sich in einer breiteren Palette von Speicherprodukten wie iSCSI-Speicher, Network Attached Storage (NAS) usw.

Die Replikation über große Entfernungen beginnt unter einer Latenz von etwa 1 Millisekunde pro 100 Meilen zu leiden, und Anbieter empfehlen häufig nicht mehr als ein paar hundert Meilen hin und zurück.

Aus diesem Grund kann sich die synchrone Replikation stärker auf die Anwendungsleistung auswirken. Es erfordert eine Bestätigung, bevor die nächste Eingabe / Ausgabe (E / A) stattfinden kann, während die asynchrone Replikation lokal bestätigt, sodass die nächste Änderung stattfinden kann, wobei die Bewegung der Daten verzögert wird. Das bedeutet natürlich auch, dass sich die beiden Datensätze für längere Zeit unterscheiden.

Eine reale Replikationsstrategie verwendet möglicherweise eine Kombination aus synchroner Replikation – für die kritischsten Elemente einer Anwendung, z. B. Wiederherstellungsprotokolle –, während weniger kritische Daten, die wiederhergestellt werden könnten, asynchron sind. Snapshots könnten ebenfalls Teil des Mixes sein, aber alles müsste mit regelmäßigen Backups untermauert werden.

Host-, Hypervisor- und Cloud-Replikation

Hier haben wir uns vor allem mit der synchronen und asynchronen Replikation in Storage-Arrays beschäftigt.

Andere Formen der Replikation existieren, wie:

  • Host-Replikation – zwischen Servern, möglicherweise einzelner Anwendungen, Datenbanken oder des gesamten Servers.
  • Hypervisor-Replikation – Die Replikation wird auf Hypervisor-Ebene verwaltet und besteht aus ihren Elementen, z. B. einzelnen virtuellen Maschinen (VMs) und virtuellem Speicher.
  • Cloud-Replikation – Dies kann die Replikation in die Cloud oder mehrere Clouds als Ziel oder zwischen Clouds sein.
  • Geo-Replikation – Hier werden Daten an mehreren entfernten Orten gespeichert, die möglicherweise sehr weit voneinander entfernt sind. Dies kann aus Gründen der Notfallwiederherstellung oder zur Verbesserung der Verfügbarkeit erfolgen. Die Replikation über so große Entfernungen ist wahrscheinlich nicht synchron.

You might also like

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.