Les sauvegardes, les instantanés, le clonage et la réplication sont tous des moyens précieux de protéger les données de l’organisation.
Dans cet article, nous examinerons la réplication, en particulier entre les baies de stockage. La clé pour cela sera de le définir et de présenter les avantages et les inconvénients de la réplication en référence à d’autres méthodes de protection des données.
Trop souvent, il y a un manque de clarté sur ce qu’est ou fait exactement une technologie. Ce dernier point est le plus important, car c’est le fonctionnement des différentes technologies qui peut déterminer comment elles s’emboîtent.
Réplication par rapport aux instantanés
La réplication est fondamentalement une méthode de production d’un clone d’une unité de stockage. En d’autres termes, il s’agit d’une réplique d’un lecteur, d’un volume ou d’un numéro d’unité logique (LUN), par exemple. Dans la plupart des cas, ce qui est recherché est une copie exacte – peut-être presque immédiatement, peut-être juste éventuellement.
Cela rend un clone ou une réplique différent d’un instantané, car les instantanés ne peuvent dans la plupart des cas devenir une réplique utilisable qu’après une sorte de processus de reconstruction. En effet, les instantanés comprennent une copie originale du lecteur ou du volume ainsi que des mises à jour, ainsi que peut-être des blocs supprimés qui doivent être réincorporés pour créer une copie précise à partir d’un moment précédent.
L’idée est que les instantanés peuvent être reconstruits et annulés assez rapidement, mais ils ne sont pas là comme une copie alternative et utilisable du support source. Pendant ce temps, les clones et les répliques le sont souvent.
Le clone / réplique le plus simple de tous est lorsque, par exemple, un développeur a besoin d’une base de données pour exécuter des requêtes de test. Ils peuvent cloner une copie exacte d’une base de données de production existante et en faire ce qu’ils veulent dans l’environnement de test. Ce clone sera une réplique exacte de la base de données au moment de sa création, mais il ne reflétera probablement jamais d’autres modifications de la copie source.
Mais à l’autre extrémité de l’échelle en termes de création d’un clone de travail disponible est la réplication synchrone. Cela permet d’écrire des données sur deux unités de stockage ou plus aussi proches que possible simultanément pour fournir une copie de travail qui peut être transmise à la volée.
Évidemment, cela a un prix en termes de coût et de complexité technique et il y a des limites, comme nous le verrons. Mais c’est souvent ce que nous entendons lorsque nous parlons de réplication.
Réplication par rapport à la sauvegarde
La réplication peut-elle remplacer les sauvegardes ? La réponse simple est non. Les sauvegardes et la réplication (et peut-être aussi les instantanés) doivent se compléter.
Comme la réplication peut être presque continue et créer une copie en temps quasi réel, elle peut également créer une réplique de fichiers corrompus ou infectés. Dans ce cas, vous avez besoin d’une version vers laquelle revenir.
Cela pourrait être dérivé d’un instantané, mais ils doivent également être étayés par des sauvegardes – et la réplication est souvent coûteuse, il se peut donc que seuls certains ensembles de données soient répliqués pendant que tout est sauvegardé.
Réplication de tableau synchrone par rapport à asynchrone
Dans la réplication synchrone, les données peuvent être écrites sur le deuxième site dès qu’elles atteignent le cache du site principal. À la réception, le deuxième site envoie un accusé de réception au stockage de site principal et à l’hôte d’où provient le changement. C’est la méthode de réplication qui se rapproche le plus possible de l’écriture simultanée de plusieurs copies de données.
La réplication synchrone est souvent l’apanage des baies de stockage par blocs les plus haut de gamme.
La réplication asynchrone ajoute une étape au processus, en reconnaissant l’hôte sur le site principal lorsque les données sont écrites. Ensuite, l’écriture est envoyée au deuxième site, qui reconnaît cette écriture dans le tableau de sites principal. La réplication asynchrone se trouve dans une gamme plus large de produits de stockage, tels que le stockage iSCSI, le stockage connecté au réseau (NAS), etc.
La réplication sur de grandes distances commence à souffrir d’une latence d’environ 1 milliseconde par 100 miles, et les fournisseurs ne recommandent souvent pas plus de quelques centaines de miles aller-retour.
Pour cette raison, la réplication synchrone peut avoir un impact plus important sur les performances de l’application. Il exige un accusé de réception avant que la prochaine entrée / sortie (E / S) puisse avoir lieu, tandis que la réplication asynchrone reconnaît localement afin que le prochain changement puisse avoir lieu, le mouvement des données étant retardé. Bien sûr, cela signifie également que les deux ensembles de données différeront plus longtemps.
Une stratégie de réplication dans le monde réel peut utiliser une combinaison de réplication synchrone – pour les éléments les plus critiques d’une application tels que les journaux de restauration – tandis que les données moins critiques pouvant être restaurées passent par asynchrone. Les instantanés pourraient également faire partie du mélange, mais tout cela devrait être étayé par des sauvegardes régulières.
Réplication de l’hôte, de l’hyperviseur et du cloud
Ici, nous avons principalement traité de la réplication synchrone et asynchrone dans les baies de stockage.
D’autres formes de réplication existent, telles que:
- Réplication d’hôte – entre serveurs, peut-être d’applications individuelles, de bases de données ou de l’ensemble du serveur.
- Réplication d’hyperviseur – Réplication gérée au niveau de l’hyperviseur et composée de ses éléments, tels que des machines virtuelles individuelles (VM) et du stockage virtuel, par exemple.
- Réplication dans le nuage – Il peut s’agir d’une réplication vers le nuage ou plusieurs nuages en tant que cible, ou entre des nuages.
- Géo-réplication – C’est là que les données sont stockées dans plusieurs emplacements distants, potentiellement très éloignés les uns des autres. Cela peut être pour des raisons de reprise après sinistre ou pour améliorer la disponibilité. La réplication sur de si longues distances n’est probablement pas synchrone.