jueves , 19 septiembre 2024

¿Qué es, los tipos y niveles de un arreglo de discos Raid?

¿Qué es un arreglo de discos Raid?

RAID es el acrónimo para Redundant Array of Independent Disks, formación de Discos Independientes Redundantes. Como su nombre lo implica es una forma para que discos múltiples actúen como si se tratasen de una sola unidad.

Conceptos destacados de RAID:

  • Parity: regenera el contenido perdido a partir de la información guardada por paridad. Es usado en Raid 5 y 6
  • Stripe: comparte datos de forma aleatoria en varios discos. Esto no tendrá datos completos en un solo disco. Si usamos 3 discos, la mitad de nuestros datos estarán en cada disco.
  • Mirroring: se utiliza en RAID 1 y RAID 10. Mirroring consiste en realizar una copia de los mismos datos. En RAID 1, también guardará el mismo contenido en el otro disco.
  • Hot spare: es solo una unidad de repuesto en nuestro servidor que puede reemplazar automáticamente las unidades defectuosas. Si alguna de las unidades falla en nuestra matriz, esta unidad de repuesto en caliente se utilizará y se reconstruirá automáticamente.
  • Chunks: Son solo un tamaño de datos que puede ser mínimo de 4 KB y más.

Existen 2 tipos de arreglos Raid:

Raid Software:

El software RAID tiene un rendimiento bajo debido al consumo de recursos de los hosts. El software debe cargarse para leer datos de los volúmenes RAID de software. Antes de cargar el software RAID, el sistema operativo debe arrancar para cargar el software RAID.

Raid Hardware:

El hardware RAID tiene un alto rendimiento. Son controladores RAID dedicados que se construyen físicamente utilizando tarjetas PCI Express. No utilizará el recurso de host. Tienen NVRAM caché para leer y escribir. Almacena la caché mientras se reconstruye, incluso si hay un corte de energía, almacenará la caché usando baterías de respaldo.

Es importante aclarar que las formaciones RAID se pueden construir de varias formas, resultando en características diferentes dependiendo de la configuración final.

Niveles de RAID

Las investigaciones en Berkeley originalmente definieron cinco niveles  y los nombraron del «1» al «5.» Luego, otros investigadores y miembros de la industria del almacenamiento definieron niveles adicionales. No todos los niveles eran igualmente útiles; algunos eran solo para propósitos de investigación.

Al final se considera que los tres niveles de RAID mas utilizados son:

  1. RAID0 = Striping
  2. RAID1 = Mirroring
  3. RAID5 = Single Disk Distributed Parity
  4. RAID6 = Double Disk Distributed Parity
  5. RAID10 = Combine of Mirror & Stripe. (Nested RAID)

RAID 0

Esta configuración tiende a confundir un poco, pues este es el único tipo de nivel que no implementa absolutamente ninguna redundancia. Sin embargo, aún cuando el nivel 0 no tiene ventajas con respecto a su confiabilidad, si tiene otros beneficios.

Una formación RAID 0 consiste de dos o más unidades de disco. La capacidad del almacenamiento en cada disco se divide en particiones, los cuales representan algún múltiplo del tamaño de bloque nativo del disco.

Los datos escritos a la formación se escriben, pedazo a pedazo, en cada unidad de la formación. Los particiones se pueden ver como tiras o rayas que se van juntando a lo largo de cada unidad en la formación; de allá el otro nombre con el que se conoce a RAID 0: striping.

Las ventajas que presenta este arreglo de discos es:

  • Se puede construir de manera que es más grande que un único disco, haciendo más fácil el almacenamiento de grandes archivos.
  • Mejor rendimiento de lecturas/escrituras Las cargas por E/S en una formación RAID 0 se pueden distribuir uniformemente entre todas las unidades en la formación (asumiendo que todas las E/S no están concentradas en un único pedazo)

RAID 1

En esta configuración se utiliza dos unidades de disco idénticas. Todos los datos son escritos a ambas unidades, haciendolos imágenes espejo. Por eso es que el nivel 1 a menudo se conoce como mirroring.
Cuando los datos son escritos a una formación 1, deben efectuarse dos escrituras físicas simultáneas: una al primer disco y otra al segundo. La lectura de datos, por otro lado, solamente se hace una vez y se puede llevar a cabo en cualquiera de los discos.

Las ventajas que presenta este arreglo de discos es:

  • Redundancia mejorada aún si uno de los discos falla, los datos todavía estarán accesibles
  • Mejor rendimiento de lecturas Con ambos discos operacionales, las lecturas pueden ser distribuídas uniformemente entre ellos, reduciendo las cargas de E/S por disco

RAID 5

Trata de combinar los beneficios de 0 y 1, a la vez que trata de minimizar sus desventajas.
Igual que 0, un RAID 5 consiste de múltiples unidades de disco, cada una dividida en particiones. Esto permite a una formación 5 ser más grande que una unidad individual.

Como en RAID 1, una formación 5 utiliza algo de espacio en disco para alguna forma de redundancia, mejorando así la confiabilidad.

Una formación 5 debe consistir de al menos tres discos idánticos en tamaño (aunque se pueden utilizar más discos). Cada unidad está dividida en particiones y los datos se escriben a los particiones siguiendo un orden. Sin embargo, no cada partición está dedicado al almacenamiento de datos como en RAID 0. En cambio, en una formación con n unidades en ella, la enésimo partición está dedicado a la paridad.

Los particiones que contienen paridad hacen posible recuperar los datos si falla una de las unidades en la formación. La paridad en la partición x se calcula matemáticamente combinando los datos desde cada partición x almacenado en todas las otras unidades en la formación. Si los datos en una partición son actualizados, la correspondiente particion de paridad debe ser recalculado y actualizado también.

Un punto clave a tener en mente es que los particiones de paridad no están concentrados en una sola unidad de la formación. En cambio, están distribuidos uniformemente a lo largo de todas las unidades aún cuando es posible dedicar una unidad específica para que contenga únicamente paridad (de hecho, esta configuración se conoce como RAID nivel 4), la actualización constante de la paridad a medida que se escriben datos a la formación significa que la unidad de paridad se podría convertir en un cuello de botella.

Sin embargo, es importante recordar el impacto de la paridad en la capacidad general de almacenamiento de la formación, aún cuando la información de paridad se distribuye uniformemente a lo largo de todos los discos, la cantidad de almacenamiento disponible se reduce por el tamaño de un disco.

Las ventajas que presenta este arreglo de discos es:

  • Redundancia mejorada Si falla una unidad de la formación, se puede utilizar la información de paridad para reconstruir las partes de datos faltantes, todo esto mientras se mantiene la formación disponible para su uso.
  • Mejor rendimiento de lecturas, debido a la forma similar a RAID 0 en que los datos son divididos entre los discos de la formación, la actividad de E/S de distribuye uniformemente entre todos los discos

RAID 6

Se utiliza principalmente en una gran cantidad de matrices. Necesitamos un mínimo de 4 unidades, incluso si fallan 2 unidades, podemos reconstruir los datos mientras reemplazamos nuevas unidades.

Mucho mas lento que RAID 5, porque escribe datos en los 4 controladores al mismo tiempo. Tendrá una velocidad promedio mientras usemos un controlador RAID de hardware. Si tenemos 6 unidades de disco duro de 1TB, se usarán 4 unidades para datos y 2 unidades para Parity.

  • Bajo rendimiento.
  • El rendimiento de lectura será bueno.
  • El rendimiento de escritura será deficiente si no utilizamos un controlador RAID de hardware.
  • Reconstruir a partir de 2 unidades de paridad.
  • Tolerancia total a fallas.
  • El espacio de 2 discos estará bajo Paridad.
  • Se puede utilizar en matrices grandes.
  • Se puede usar con fines de respaldo, transmisión de video, usado a gran escala.

RAID 10 (o) Mirror & Stripe

RAID 10 se puede llamar como 1 + 0 o 0 + 1. Este tipo de RAID podrá trabajar como Mirror & Striping. El mirror será el primero y el stripe será el segundo en RAID 10. El stripe será el primero y el mirror será el segundo en RAID 01. RAID 10 es mejor en comparación con 01.

Supongamos que tenemos 4 unidades. Mientras escribo algunos datos en mi volumen lógico, se guardarán en las 4 unidades utilizando métodos de mirror y stripe.

Si estoy escribiendo un «TECMINT» de datos en RAID 10, guardará los datos de la siguiente manera. La primera «T» escribirá en ambos discos y la segunda «E» escribirá en ambos discos, este paso se utilizará para toda la escritura de datos. También hará una copia de todos los datos en otro disco.

Al mismo tiempo, utilizará el método RAID 0 y escribirá datos como sigue, “T” escribirá en el primer disco y “E” escribirá en el segundo disco. Nuevamente, «C» escribirá en el primer disco y «M» en el segundo disco.

  • Buen rendimiento de lectura y escritura.
  • Aquí la mitad del espacio se perderá en capacidad total.
  • Tolerancia a fallos.
  • Reconstrucción rápida a partir de la copia de datos.
  • Se puede utilizar en el almacenamiento de bases de datos para obtener un alto rendimiento y disponibilidad.

Los niveles de RAID más comunes:

  • RAID 1+0
  • RAID 5+0
  • RAID 5+1

Ejemplo:

raid
raid

Si deseas aprender a instalar y configurar particiones o volúmenes lógicos en Linux, consulta nuestro Curso de Gestión de Almacenamiento en Linux

Acerca de Isaac Lemus

15 años de experiencia como consultor en implementación de soluciones en open source (software libre). En la actualidad estoy a cargo de la gestión de proyectos para la capacitación y servicios de implementación open source de la empresa Conocimiento Libre.

Compruebe también

Warp, la terminal inteligente que te ayuda a trabajar mejor con Linux

Linux es un sistema operativo de código abierto que ofrece una gran flexibilidad, seguridad y …