Backups, snapshots, clonagem e replicação são todas formas valiosas de proteger os dados da organização.
neste artigo, vamos olhar para a replicação, em particular entre Matrizes de armazenamento. A chave para isso será defini-lo e apresentar os prós e contras da replicação com referência a outros métodos de proteção de dados.
muitas vezes nele há uma falta de clareza sobre o que exatamente uma tecnologia é, ou faz. Esta última é a parte importante, porque é como as diferentes tecnologias funcionam que podem determinar como elas se encaixam.
Replicação versus instantâneos
Replicação é, fundamentalmente, um método de produção de um clone de uma unidade de armazenamento. Em outras palavras, é uma réplica de uma unidade, volume ou número de unidade lógica (LUN), por exemplo. Na maioria dos casos, o que está sendo feito é uma cópia exata – talvez quase imediatamente, talvez apenas eventualmente.
que torna um clone ou réplica diferente de um instantâneo, porque instantâneos na maioria dos casos só podem se tornar uma réplica utilizável após algum tipo de processo de reconstrução. Isso porque snapshots compreendem uma cópia original da unidade ou volume mais atualizações para ele, bem como talvez apagados blocos que têm de ser reincorporados para criar uma cópia precisa de um ponto anterior no tempo.
a idéia é que instantâneos podem ser re-construídos e rolados para trás muito rapidamente, mas eles não estão lá como uma cópia alternativa, utilizável da mídia de origem. Entretanto, clones e réplicas são muitas vezes.
o clone/réplica mais simples de todos é quando, por exemplo, um desenvolvedor precisa de um banco de dados para executar algumas consultas de teste. Eles podem clonar uma cópia exata de um banco de dados de produção existente e fazer o que eles querem com ele no ambiente de teste. Esse clone será uma réplica exata do banco de dados no momento em que foi criado, mas provavelmente nunca irá refletir quaisquer outras mudanças na cópia de origem.
mas no outro extremo da escala em termos de criação de um clone disponível, o trabalho é replicação síncrona. Isto vê os dados escritos em duas ou mais unidades de armazenamento o mais próximo possível de simultaneamente para fornecer uma cópia de trabalho que pode ser falhada no voo.
obviamente isto vem a um preço em termos de custo e complexidade técnica e há limitações, como veremos. Mas isso é muitas vezes o que queremos dizer quando falamos sobre replicação.
replicação versus backup
a replicação pode substituir backups? A resposta simples é não. Backups e replicação (e talvez snapshots também) têm que complementar um ao outro.
porque a replicação pode ser quase contínua e cria uma cópia quase em tempo real, ela também pode fazer uma réplica de arquivos corrompidos ou infectados. Nesse caso, precisas de uma versão para voltar.
que pode ser derivado de um instantâneo, mas então eles também precisam ser sustentados por backups – e replicação é muitas vezes caro, por isso pode ser que apenas certos conjuntos de dados são replicados enquanto tudo é suportado.
replicação síncrona contra matriz assíncrona
em replicação síncrona, os dados podem ser escritos no segundo site assim que ele atinge cache no site primário. Após a recepção, o segundo site envia um aviso de recepção para o armazenamento principal do site e para o host onde a mudança teve origem. É o método de replicação que chega o mais perto de escrever múltiplas cópias de dados o mais próximo possível de simultaneamente.
a replicação síncrona é muitas vezes a reserva das mais altas matrizes de armazenamento de blocos.
replicação assíncrona adiciona uma etapa ao processo, reconhecendo o hospedeiro no local primário quando os dados são escritos. Em seguida, a escrita é enviada para o segundo site, que reconhece que escrever de volta para a matriz principal do site. Replicação assíncrona é encontrada em uma ampla gama de produtos de armazenamento, tais como armazenamento iSCSI, armazenamento ligado à rede (NAS), e assim por diante.
a replicação a grandes distâncias começa a sofrer de cerca de 1 milissegundo de latência por 100 milhas, e os fornecedores geralmente recomendam não mais do que algumas centenas de milhas de ida e volta.
por essa razão, a replicação síncrona pode ter mais impacto no desempenho da aplicação. Exige reconhecimento antes que a próxima entrada/saída (I/O) possa ocorrer, enquanto que a replicação assíncrona reconhece localmente para que a próxima mudança possa ocorrer, com o movimento dos dados atrasado. Naturalmente, isso também significa que os dois conjuntos de dados serão diferentes por um tempo mais longo.
uma estratégia de replicação do mundo real pode usar uma combinação de replicação síncrona – para os elementos mais críticos de uma aplicação, como registros refeitos-enquanto Dados menos críticos que poderiam ser restaurados passam por assíncronos. Snapshots poderia fazer parte da mistura também, mas tudo teria que ser apoiado com backups regulares.
Host, hypervisor e Cloud replication
aqui lidamos principalmente com replicação síncrona e assíncrona em matrizes de armazenamento.Existem outras formas de replicação, tais como::
- Host replication – between servers, maybe of individual applications, databases or the entire server.
- replicação Hipervisora-replicação gerenciada a nível hipervisor e composta de seus elementos, tais como máquinas virtuais individuais (VMs), e armazenamento virtual, por exemplo.
- replicação em nuvem-isto pode ser replicação para a nuvem ou múltiplas nuvens como um alvo, ou entre nuvens.
- GEO-replicação – é aqui que os dados são armazenados em múltiplos locais remotos, potencialmente muito distantes uns dos outros. Isto pode ser por razões de recuperação de desastres ou para aumentar a disponibilidade. Replicação em tais longas distâncias não é provável que seja síncrona.