La técnica permite fabricar discos de memoria convencional con un 99,999% de fiabilidad durante una vida útil de 4 años
El coste de almacenar datos en disco duro se ha reducido drásticamente durante los últimos años. En 2008 este tipo de memoria costaba alrededor de 0,11 dólares (0,09 euros) por gigabyte. Hoy día cuesta unos 0,04 dólares (0,03 euros) y los precios siguen bajando. Esto está teniendo un impacto importante en el modo en que los centros de almacenamiento gestionan sus costes ya que el precio de sustituir discos cuando fallan cada vez está más influenciado por el coste del servicio de mantenimiento.
Jehan-François Pâris desde la Universidad de Houston en Texas (EEUU) y su equipo dicen haber desarrollado una forma de eliminar el coste del servicio de mantenimiento creando un tipo de almacenamiento de datos tan fiable que no requiere ninguna intervención humana a lo largo de toda su vida útil.
El truco para crear un almacenamiento de datos con mantenimiento cero es incluir suficientes discos de repuesto para hacerse con los datos de cualquier disco que falle. "Proponemos reducir el coste de mantenimiento de las matrices de discos mediante la construcción de matrices autorreparables que tengan suficientes discos de reserva para funcionar sin intervención humana durante toda su vida", señalan. El equipo ha simulado el comportamiento de un sistema de este tipo y asegura que supera a los sistemas redundantes de datos actuales.
La tecnología de almacenamiento de datos más utilizada se llama RAID (del inglés "redundant array of independent disks", o "matriz redundante de discos independientes"). Su encarnación más avanzada, llamada nivel 6, consiste en un conjunto de discos de datos que se comprueban constantemente frente a un pequeño conjunto de discos de paridad. Esto asegura que los datos son redundantes y pueden ser recreados si fallan los discos.
Por ejemplo, una arquitectura RAID estándar utiliza 4 discos de paridad para proteger el contenido de 6 discos de datos contra de todos los fallos de hasta 2 discos. Cualquier sistema nuevo tendría que proporcionar un mejor rendimiento.
Pâris y su equipo han simulado la fiabilidad de un sistema de memoria en el que se incluyen tanto los discos de paridad como de repuesto. La dificultad es lograr un 99,999% de fiabilidad pero con un aumento razonable de la cantidad de espacio necesario para albergar los discos de repuesto (está claro que ningún centro de datos podría albergar un número infinito de discos de repuesto).
El equipo tuvo que hacer una serie de suposiciones sobre la fiabilidad de los discos durante la simulación. Hacen estas suposiciones basándose en el rendimiento de 25.000 discos y las tasas de fallo estudiadas por la empresa de almacenamiento de datos Backblaze.
Esto sugiere que los discos tienen una tasa de fallo relativamente alta durante los primeros 18 meses, una tasa mucho más baja durante los próximos 18 y una tasa alta después de ese periodo. También suponen que una reparación de disco tarda 24 horas, dando una tasa de transferencia de disco de alrededor de 200 MB/s.
Curiosamente, las simulaciones muestran que lo más grande no es necesariamente lo mejor. Indican que la mejor configuración se produce cuando hay 45 discos de datos, 10 discos de paridad y 33 o 34 discos de repuesto. Esto ofrece el mejor compromiso entre espacio extra y la fiabilidad de 99,99%.
De hecho, cuando el número de discos de datos es mucho mayor, el sistema nunca puede alcanzar el 99,999% de fiabilidad debido al tiempo que tarda en recuperar los datos cuando falla un disco. Los sistemas más grandes tienen una mayor probabilidad de que se produzca otro fallo de disco. Y si esto ocurre durante el período de recuperación, el sistema nunca puede ponerse al día, incluso si tiene un número infinito de discos de repuesto.
El equipo ha comparado este rendimiento con la arquitectura estándar RAID de nivel 6 y ha demostrado que es significativamente mejor.
Es una nueva e interesante forma de considerar la fiabilidad del almacenamiento y podría hacer que almacenar datos no sólo fuera más fiable, sino más barato. Y puesto que se espera que el precio del almacenamiento magnético baje aún más, es muy probable que aumente la importancia de eliminar las intervenciones humanas del proceso.
Ref: arxiv.org/abs/1501.00513: Self-Repairing Disk Arrays