back-ups, snapshots, klonen en replicatie zijn allemaal waardevolle manieren om de gegevens van de organisatie te beschermen.
In dit artikel zullen we kijken naar replicatie, in het bijzonder tussen opslagarrays. De sleutel hiervoor is het definiëren en presenteren van de voor-en nadelen van replicatie met verwijzing naar andere methoden voor gegevensbescherming.
maar al te vaak is er een gebrek aan duidelijkheid over wat een technologie precies is of doet. Dat laatste is het belangrijkste, want het is hoe verschillende technologieën functioneren die kunnen bepalen hoe ze in elkaar passen.
replicatie versus snapshots
replicatie is fundamenteel een methode om een kloon van een opslageenheid te produceren. Met andere woorden, het is een replica van een station, volume of logische eenheid nummer (Lun), bijvoorbeeld. In de meeste gevallen wordt gestreefd naar een exacte kopie – misschien bijna onmiddellijk, misschien alleen maar uiteindelijk.
dat maakt een kloon of replica anders dan een snapshot, omdat snapshots in de meeste gevallen alleen een bruikbare replica kunnen worden na een soort van herbouwproces. Dat komt omdat snapshots bestaan uit een originele kopie van de schijf of volume plus updates ervan, evenals misschien verwijderde blokken die moeten worden opgenomen om een nauwkeurige kopie van een vorig punt in de tijd te maken.
het idee is dat snapshots vrij snel opnieuw kunnen worden gebouwd en teruggedraaid, maar ze zijn er niet als een alternatieve, bruikbare kopie van de bronmedia. Ondertussen zijn klonen en replica ‘ s dat vaak.
de eenvoudigste kloon / replica van allemaal is wanneer, bijvoorbeeld, een ontwikkelaar een database nodig heeft om een aantal test queries op uit te voeren. Ze kunnen een exacte kopie van een bestaande productiedatabase klonen en ermee doen wat ze willen in de testomgeving. Die kloon zal een exacte replica zijn van de database op het moment dat deze werd aangemaakt, maar het zal waarschijnlijk nooit verdere wijzigingen aan de bronkopie weergeven.
maar aan het andere uiteinde van de schaal in termen van het creëren van een beschikbare, werkende kloon is synchrone replicatie. Dit ziet gegevens geschreven naar twee of meer eenheden van opslag zo dicht mogelijk tegelijk om een werkkopie die kan worden mislukt over aan on-the-fly te bieden.
dit heeft uiteraard een prijs in termen van kosten en technische complexiteit en er zijn beperkingen, zoals we zullen zien. Maar dit is vaak wat we bedoelen als we het hebben over replicatie.
replicatie versus back-up
kan replicatie back-ups vervangen? Het simpele antwoord is nee. Back-ups en replicatie (en misschien ook snapshots) moeten elkaar aanvullen.
omdat replicatie bijna continu kan zijn en een bijna realtime kopie maakt, kan het ook een replica maken van beschadigde of geïnfecteerde bestanden. In dat geval heb je een versie nodig om naar terug te rollen.
die kunnen worden afgeleid van een snapshot, maar dan moeten ze ook worden ondersteund door back – ups-en replicatie is vaak duur, dus het kan zijn dat alleen bepaalde datasets worden gerepliceerd terwijl er van alles een back-up wordt gemaakt.
synchrone versus asynchrone array-replicatie
bij synchrone replicatie kunnen gegevens naar de tweede site worden geschreven zodra deze in de cache van de primaire site terechtkomt. Na ontvangst stuurt de tweede site een bevestiging naar de primaire site-opslag en de host waar de wijziging vandaan komt. Het is de methode van replicatie die zo dicht mogelijk komt bij het schrijven van meerdere kopieën van gegevens zo dicht mogelijk bij gelijktijdig mogelijk.
synchrone replicatie is vaak het domein van de meest geavanceerde block storage arrays.
asynchrone replicatie voegt een fase toe aan het proces, door de host op de primaire site te bevestigen wanneer de gegevens worden geschreven. Vervolgens wordt het schrijven naar de tweede site, die erkent dat terug te schrijven naar de primaire site array. Asynchrone replicatie wordt gevonden in een breder scala aan opslagproducten, zoals iSCSI-opslag, network-attached storage (NAS), enzovoort.
replicatie over grote afstanden begint te lijden van ongeveer 1 milliseconde latentie per 100 mijl, en leveranciers adviseren vaak niet meer dan een paar honderd mijl heen-en terugreis.
om die reden kan synchrone replicatie een grotere impact hebben op de prestaties van toepassingen. Het vereist erkenning voordat de volgende input / output (I/O) kan plaatsvinden, terwijl asynchrone replicatie lokaal erkent zodat de volgende verandering kan plaatsvinden, met vertraging van de verplaatsing van gegevens. Dat betekent natuurlijk ook dat de twee datasets langer van elkaar zullen verschillen.
een replicatiestrategie in de echte wereld kan een combinatie van synchrone replicatie gebruiken – voor de meest kritieke elementen van een toepassing, zoals Logs opnieuw uitvoeren-terwijl minder kritieke gegevens die hersteld kunnen worden asynchroon verlopen. Snapshots kunnen ook deel uitmaken van de mix, maar het zou allemaal moeten worden ondersteund met regelmatige back-ups.
host, hypervisor en cloud replicatie
hier hebben we voornamelijk gesproken over synchrone en asynchrone replicatie in opslagarrays.
er bestaan andere vormen van replicatie, zoals:
- hostreplicatie-tussen servers, misschien van individuele toepassingen, databases of de gehele server.
- hypervisorreplicatie-replicatie die wordt beheerd op hypervisorniveau en bestaat uit de elementen ervan, zoals individuele virtuele machines (VM ‘ s) en virtuele opslag, bijvoorbeeld.
- Cloudreplicatie – dit kan replicatie zijn naar de cloud of meerdere clouds als doel, of tussen clouds.
- Geo-replicatie – dit is waar gegevens worden opgeslagen op meerdere locaties op afstand, mogelijk zeer ver van elkaar. Dit kan zijn om redenen van noodherstel of om de beschikbaarheid te verbeteren. Replicatie over zulke lange afstanden is waarschijnlijk niet synchroon.