Almacenamiento 101: Replicación frente a copia de seguridad, y síncrono frente a asíncrono

Las copias de seguridad, las instantáneas, la clonación y la replicación son formas valiosas de proteger los datos de la organización.

En este artículo, veremos la replicación, en particular entre matrices de almacenamiento. La clave para ello será definirla y presentar los pros y los contras de la reproducción con referencia a otros métodos de protección de datos.

Con demasiada frecuencia en ELLA hay una falta de claridad sobre qué es o hace exactamente una tecnología. Esta última es la parte importante, porque es cómo funcionan las diferentes tecnologías lo que puede determinar cómo encajan.

Replicación versus instantáneas

La replicación es fundamentalmente un método para producir un clon de una unidad de almacenamiento. En otras palabras, es una réplica de una unidad, volumen o número de unidad lógica (LUN), por ejemplo. En la mayoría de los casos, lo que se busca es una copia exacta, tal vez casi de inmediato, tal vez solo con el tiempo.

Que hace que un clon o réplica sea diferente de una instantánea, porque las instantáneas en la mayoría de los casos solo pueden convertirse en una réplica utilizable después de algún tipo de proceso de reconstrucción. Esto se debe a que las instantáneas comprenden una copia original de la unidad o el volumen más las actualizaciones de la misma, así como quizás bloques eliminados que deben reincorporarse para crear una copia precisa de un punto anterior en el tiempo.

La idea es que las instantáneas se puedan reconstruir y revertir con bastante rapidez, pero no están ahí como una copia alternativa y utilizable del medio de origen. Mientras tanto, los clones y réplicas a menudo lo son.

El clon/réplica más simple de todos es cuando, por ejemplo, un desarrollador necesita una base de datos para ejecutar algunas consultas de prueba. Pueden clonar una copia exacta de una base de datos de producción existente y hacer lo que quieran con ella en el entorno de prueba. Ese clon será una réplica exacta de la base de datos en el momento en que se creó, pero es probable que nunca refleje ningún cambio adicional en la copia de origen.

Pero en el otro extremo de la escala, en términos de creación de un clon de trabajo disponible, está la replicación sincrónica. Esto permite que los datos se escriban en dos o más unidades de almacenamiento lo más cerca posible de forma simultánea para proporcionar una copia de trabajo que puede fallar sobre la marcha.

Obviamente esto tiene un precio en términos de costo y la complejidad técnica y hay limitaciones, como veremos. Pero esto es a menudo a lo que nos referimos cuando hablamos de replicación.

Replicación frente a copia de seguridad

¿La replicación puede reemplazar las copias de seguridad? La respuesta simple es no. Las copias de seguridad y la replicación (y tal vez las instantáneas también) tienen que complementarse entre sí.

Debido a que la replicación puede ser casi continua y crea una copia casi en tiempo real, también puede hacer una réplica de archivos dañados o infectados. En ese caso, necesita una versión a la que retroceder.

Que se podrían derivar de una instantánea, pero luego también necesitan estar respaldados por copias de seguridad, y la replicación a menudo es costosa, por lo que solo se replican ciertos conjuntos de datos mientras se realiza una copia de seguridad de todo.

Replicación de matriz síncrona versus asíncrona

En la replicación síncrona, los datos se pueden escribir en el segundo sitio tan pronto como lleguen a la caché en el sitio principal. Una vez recibido, el segundo sitio envía un acuse de recibo al almacenamiento del sitio principal y al host donde se originó el cambio. Es el método de replicación que se acerca lo más posible a la escritura de múltiples copias de datos lo más cerca posible de la forma simultánea posible.

La replicación síncrona es a menudo la reserva de las matrices de almacenamiento de bloques de gama más alta.

La replicación asíncrona agrega una etapa al proceso, al reconocer el host en el sitio principal cuando se escriben los datos. Luego, la escritura se envía al segundo sitio, que reconoce que la escritura vuelve a la matriz del sitio principal. La replicación asíncrona se encuentra en una gama más amplia de productos de almacenamiento, como el almacenamiento iSCSI, el almacenamiento conectado a la red (NAS), etc.

La replicación a grandes distancias comienza a sufrir de aproximadamente 1 milisegundo de latencia por cada 100 millas, y los proveedores a menudo recomiendan no más de unos pocos cientos de millas de ida y vuelta.

Por esta razón, la replicación síncrona puede tener un mayor impacto en el rendimiento de las aplicaciones. Exige reconocimiento antes de que la siguiente entrada/salida (E/S) pueda tener lugar, mientras que la replicación asíncrona reconoce localmente para que el siguiente cambio pueda tener lugar, con el movimiento de datos retrasado. Por supuesto, eso también significa que los dos conjuntos de datos diferirán durante más tiempo.

Una estrategia de replicación en el mundo real puede usar una combinación de replicación síncrona, para los elementos más críticos de una aplicación, como los registros de rehacer, mientras que los datos menos críticos que se pueden restaurar pasan a través de asíncronos. Las instantáneas también podrían formar parte de la mezcla, pero todo tendría que estar respaldado con copias de seguridad regulares.

Replicación de host, hipervisor y nube

Aquí nos hemos ocupado principalmente de la replicación síncrona y asíncrona en matrices de almacenamiento.

Existen otras formas de replicación, como:

  • Replicación de host: entre servidores, tal vez de aplicaciones individuales, bases de datos o todo el servidor.
  • Replicación de hipervisor: replicación administrada a nivel de hipervisor y compuesta por sus elementos, como máquinas virtuales individuales (VM) y almacenamiento virtual, por ejemplo.
  • Replicación en la nube: puede ser replicación en la nube o en varias nubes como destino, o entre nubes.
  • Replicación geográfica: aquí es donde se almacenan los datos en múltiples ubicaciones remotas, potencialmente muy distantes entre sí. Esto puede ser por razones de recuperación ante desastres o para mejorar la disponibilidad. No es probable que la replicación a distancias tan largas sea sincrónica.

You might also like

Deja una respuesta

Tu dirección de correo electrónico no será publicada.