Almacenamiento 101: instantáneas vs copia de seguridad

Recientemente analizamos el respaldo para NAS, pero el respaldo no es la única forma de protección de datos para NAS. También hay formas de protección centradas en el almacenamiento, como las instantáneas y replicación, que ofrecen una recuperación más rápida que la copia de seguridad tradicional.

En este artículo, analizaremos las instantáneas y en qué medida pueden ser un reemplazo o una adición a la copia de seguridad. También veremos brevemente la replicación y veremos cómo encaja eso con las instantáneas y la copia de seguridad.

Instantáneas 101

Básicamente, una instantánea es un registro, compuesto por metadatos, que indica el estado de los bloques y archivos en una unidad de almacenamiento. A menudo, las instantáneas vienen como una característica del almacenamiento NAS o SAN y se crean y mantienen en ese almacenamiento.

Permiten al usuario revertir a versiones existentes previamente de un volumen, unidad, sistema de archivos, base de datos, etc. Entonces, por ejemplo, puede retroceder al estado de una unidad de almacenamiento en cualquier instantánea anterior.

Las instantáneas son como una copia de un punto en el tiempo o una tabla de contenido que muestra qué bloques y / o archivos existieron y dónde. En el caso de retroceder, el volumen o la unidad de almacenamiento en cuestión se cambiaría a un estado que reflejara la instantánea, mediante la eliminación y el movimiento de bloques, etc.

Cuando se han eliminado bloques, estos deben conservarse y se agregan a la instantánea en caso de que sean necesarios. En tal caso, la versión revertida podría ser una mezcla de metadatos de instantáneas anteriores, datos retenidos por esas instantáneas y cualquier cosa que cuente como una copia principal (es decir, antes de las instantáneas).

Por lo tanto, las instantáneas no son copias de seguridad porque no son copias. No ocupan mucho espacio individualmente, pero su volumen total puede crecer, especialmente si hay muchos bloques / archivos eliminados, por lo que los proveedores generalmente limitan la cantidad de instantáneas que se pueden retener.

Instantáneas: beneficios y dificultades

Un beneficio clave de las instantáneas es que permiten una reversión más rápida a un punto en el tiempo anterior que las copias de seguridad.

Otra ventaja es que las instantáneas permiten una protección mucho más frecuente que la copia de seguridad. Es posible establecer instantáneas para, por ejemplo, una vez por hora, sin afectar los sistemas de producción, mientras que es probable que las copias de seguridad se ejecuten una vez al día y fuera de las horas de producción principales debido a su impacto en los recursos.

La desventaja de estar rápidamente disponible se reduce a las instantáneas que generalmente se guardan localmente en el dispositivo de almacenamiento. Eso significa que son vulnerables a las interrupciones que afectan a ese sistema y utilizan la capacidad de almacenamiento (potencialmente primaria).

Por lo tanto, las instantáneas se usan mejor junto con una estrategia de respaldo. Las instantáneas son buenas para una protección más frecuente medida en minutos u horas, mientras que las copias de seguridad se utilizan para la protección diaria. Los períodos de retención de instantáneas generalmente reflejarán eso, con la eliminación de instantáneas que se producen después de, por ejemplo, 48 horas, lo que permite que se hayan realizado una o dos copias de seguridad en ese período.

Tipos de instantáneas

Hay dos tipos fundamentales de mecanismos de instantáneas: copiar en escritura y redireccionar en escritura.

Copiar en escrito

En copy-on-write, cuando un I / O solicitud busca cambiar un bloque de almacenamiento, ese bloque se copia primero y se retiene en la instantánea a la que pertenece. Eso mantiene todo consistente para ese instantánea, que comprende punteros a bloques sin cambios y copias de los que posteriormente se modificaron.

Las instantáneas de copia en escritura ahorran espacio porque los datos no modificados se referencian desde la copia original (siempre que no haya cambiado mucho). La desventaja es que el rendimiento puede verse afectado porque cada solicitud de escritura va acompañada de la necesidad de copiar un bloque para que la instantánea lo retenga.

Redireccionamiento en escritura

Con redirect-on-write, cuando se crean nuevos bloques, solo se requiere una escritura y eso es para la instantánea. Eso significa que cualquier referencia al estado actual de los datos es al original y a la instantánea. Cuando se eliminan las instantáneas, todas esas diferencias deben reconciliarse con el padre.

Debido a que los datos nuevos solo existen en varias instantáneas potencialmente múltiples, el acceso a ellos puede volverse complejo y el rendimiento puede verse afectado, pero se requiere menos volumen de almacenamiento.

Hay algunos otros tipos de instantáneas comunes:

Protección continua de datos

La protección continua de datos (CDP) es la creación de instantáneas como se indicó anteriormente, pero cada vez que se realiza un cambio en la unidad de almacenamiento en cuestión, o al menos en un nivel que sea relevante para los usuarios humanos, como la creación, actualización o eliminación de archivos. . Eso significa que CDP permite retroceder a cualquier punto en el tiempo, pero también significa un éxito en el rendimiento durante más tiempo. Donde normalmente las instantáneas se ejecutarían a intervalos de una vez por hora, por ejemplo, con cierta sobrecarga de rendimiento en esos momentos, CDP crea E / S adicionales cada vez que ocurre algo.

Duplicación, clones y replicación.

Relacionadas con las instantáneas, pero completamente diferentes en términos de mecanismo, están las diversas formas de clonación. En su forma más simple, un clon es exactamente como suena: una copia idéntica de una unidad de almacenamiento. No es un original e instantáneas de áreas actualizadas, sino todo.

Esto podría tomar la forma de una clonación única de una unidad o la clonación regular de un volumen, unidad, etc., mediante la utilidad de instantánea. O podría ser sincrónico o asincrónico duplicación, en la que los datos se escriben en dos ubicaciones físicas (casi) simultáneamente. Aquí estamos hablando de la replicación, que está en el extremo superior de las cosas en términos de consideraciones técnicas y de costos.

La replicación es una forma altamente efectiva de protección de datos y se utiliza en las verticales más sensibles a las transacciones por su capacidad de proporcionar una copia de conmutación por error disponible al instante.

Pero la replicación no puede reemplazar las copias de seguridad. Tienen que trabajar juntos. Por ejemplo, debido a que la replicación es casi en tiempo real en la forma en que realiza su copia, si los archivos dañados o infectados se replican, entonces necesita una versión a la que retroceder. Por supuesto, eso podría ser una instantánea, como se discutió anteriormente, pero también necesitan ser respaldados por copias de seguridad debido a su vida útil limitada. Además, debido a que la replicación puede ser costosa, puede ser que solo ciertos conjuntos de datos se replican, mientras que todo está respaldado.