sikkerhedskopier, snapshots, kloning og replikation er alle værdifulde måder at beskytte organisationens data på.
i denne artikel vil vi se på replikation, især mellem lagringsarrayer. Nøglen til dette vil være at definere det og præsentere fordele og ulemper ved replikering med henvisning til andre metoder til databeskyttelse.
alt for ofte mangler der klarhed over, hvad en teknologi er eller gør. Sidstnævnte er den vigtige bit, fordi det er, hvordan forskellige teknologier fungerer, der kan bestemme, hvordan de passer sammen.
replikation versus snapshots
replikation er grundlæggende en metode til fremstilling af en klon af en lagringsenhed. Med andre ord er det en kopi af et drev, volumen eller logisk enhedsnummer (LUN), for eksempel. I de fleste tilfælde, hvad der stræbes efter er en nøjagtig kopi – måske næsten med det samme, måske bare til sidst.
det gør en klon eller replika forskellig fra et øjebliksbillede, fordi snapshots i de fleste tilfælde kun kan blive en brugbar replika efter en slags genopbygningsproces. Det skyldes, at snapshots omfatter en original kopi af drevet eller lydstyrken plus opdateringer til det, samt måske slettede blokke, der skal genindarbejdes for at oprette en nøjagtig kopi fra et tidligere tidspunkt.
ideen er, at snapshots kan genopbygges og rulles tilbage ret hurtigt, men de er ikke der som en alternativ, brugbar kopi af kildemediet. I mellemtiden er kloner og replikaer ofte.
den enkleste klon/replika af alle er, når for eksempel en udvikler har brug for en database for at køre nogle testforespørgsler på. De kan klone en nøjagtig kopi af en eksisterende produktionsdatabase og gøre, hvad de vil med den i testmiljøet. Denne klon vil være en nøjagtig kopi af databasen på det tidspunkt, den blev oprettet, men den vil sandsynligvis aldrig afspejle yderligere ændringer i kildekopien.
men i den anden ende af skalaen med hensyn til at skabe en tilgængelig, fungerende klon er synkron replikation. Dette ser data skrevet til to eller flere lagerenheder så tæt på samtidigt som muligt for at give en arbejdskopi, der kan mislykkes til on-the-fly.
dette kommer naturligvis til en pris med hensyn til omkostninger og teknisk kompleksitet, og der er begrænsninger, som vi skal se. Men det er ofte det, vi mener, når vi taler om replikation.
replikation versus backup
kan replikation erstatte sikkerhedskopier? Det enkle svar er nej. Sikkerhedskopier og replikering (og måske også snapshots) skal supplere hinanden.
da replikering kan være næsten kontinuerlig og skaber en nær realtidskopi, kan den også lave en kopi af beskadigede eller inficerede filer. I så fald har du brug for en version at rulle tilbage til.
det kunne stamme fra et øjebliksbillede, men så skal de også understøttes af sikkerhedskopier – og replikering er ofte dyrt, så det kan være, at kun visse datasæt replikeres, mens alt er sikkerhedskopieret.
synkron versus asynkron array replikation
i synkron replikation kan data skrives til det andet sted, så snart det rammer cache på det primære sted. Ved modtagelse, det andet sted sender en bekræftelse til det primære stedopbevaring og værten, hvor ændringen stammer fra. Det er replikationsmetoden, der kommer så tæt på at skrive flere kopier af data så tæt på samtidigt som muligt.
synkron replikation er ofte bevarelsen af de mest avancerede bloklagringsarrays.
asynkron replikation tilføjer et trin til processen ved at anerkende værten på det primære sted, når dataene skrives. Derefter sendes skrivningen til det andet sted, som anerkender, at Skriv tilbage til det primære stedarray. Asynkron replikation findes i et bredere udvalg af lagringsprodukter, såsom iSCSI-lagring, netværksbundet lager (NAS) og så videre.
replikation over store afstande begynder at lide af omkring 1 millisekund af latenstid pr 100 miles, og leverandører anbefaler ofte ikke mere end et par hundrede miles rundtur.
af den grund kan synkron replikation have større indflydelse på applikationsydelsen. Det kræver anerkendelse, før den næste input/output (I/O) kan finde sted, mens asynkron replikation anerkender lokalt, så den næste ændring kan finde sted med forsinket bevægelse af data. Det betyder selvfølgelig også, at de to datasæt vil variere i længere tid.
en replikationsstrategi i den virkelige verden bruger muligvis en kombination af synkron replikation – for de mest kritiske elementer i et program, såsom gentag logfiler – mens mindre kritiske data, der kan gendannes, går via asynkron. Snapshots kunne også være en del af blandingen, men det skulle alle understøttes med regelmæssige sikkerhedskopier.
Host, hypervisor og cloud replikation
her har vi primært beskæftiget os med synkron og asynkron replikation i lagringsarrayer.
andre former for replikation findes, såsom:
- Værtsreplikation – mellem servere, måske af individuelle applikationer, databaser eller hele serveren.
- Hypervisor replikation-replikation forvaltes på hypervisor niveau og består af dens elementer, såsom individuelle virtuelle maskiner (VM ‘ er), og virtuel lagring, for eksempel.
- Cloud replikation – dette kan være replikation til skyen eller flere skyer som et mål eller mellem skyer.
- Geo-replikation-det er her data gemmes på flere fjerntliggende steder, potentielt meget fjernt fra hinanden. Dette kan være af hensyn til katastrofegendannelse eller for at forbedre tilgængeligheden. Replikation over sådanne lange afstande er sandsynligvis ikke synkron.