IBM está construyendo el sistema de almacenamiento de datos más grande que se conoce: 120.000.000 de gigabytes o 120 petabytes para abreviar y para que la cifra quepa en Twitter. Tiene al menos 8 ó 10 veces más capacidad que los actualmente disponibles –de unos 15 petabytes– y está formado por 200.000 discos duros convencionales.
En 120 petabytes se pueden almacenar 24.000 millones de MP3, o 60 veces la copia de la Web almacenada en el WayBack Machine de Internet Archive que consta de 150.000 millones de páginas.
«Disponer de 120 petabytes puede sonar a locura hoy en día, pero dentro de unos años todos los sistemas de computación en la nube podrían ser así», comenta Hillsberg, jefe del proyecto. El conjunto de discos duros se refrigera con agua y puede seguir funcionando prácticamente a pleno rendimiento aunque alguno de los discos se rompa.
Los ingenieros de IBM calculan que –en teoría– el conjunto de discos podría estar funcionando durante un millón de años y no perdería ningún dato. El sistema de archivos utilizado, denominado GPFS, puede indexar 10.000 millones de archivos en poco más de 40 minutos [PDF].