.

Otros

TR10: HashCache

1

El nuevo método de Vivek Pai para almacenar el contenido de la Web podría hacer más asequible el acceso a Internet en todo el mundo.

  • por David Talbot | traducido por Rubén Oscar Diéguez (Opinno)
  • 09 Marzo, 2009

En los países en vías de desarrollo, la escasez de acceso a internet es un aspecto de la brecha digital más conspicuo y persistente que la escasez de ordenadores. "En la mayoría de lugares, la creación de redes es más cara - no sólo en términos relativos, sino incluso en términos absolutos - que en Estados Unidos", afirma Vivek Pai, informático de la Universidad de Princeton (Estados Unidos). A menudo, incluso las universidades de los países con menos recursos sólo pueden costearse las conexiones de ancho de banda bajo y los usuarios individuales reciben el equivalente a una fracción de una conexión por red telefónica. Para mejorar la utilidad de estas conexiones, Pai y su grupo crearon HashCache, un método para el almacenamiento en caché muy eficiente - es decir, almacenar el contenido de la Web al cual se accedió con frecuencia en un disco duro en lugar de utilizar el preciado ancho de banda para recuperar la misma información en forma repetitiva.

A pesar de la naturaleza variable de la red, una cantidad sorprendente de su contenido no cambia con frecuencia. Pero las tecnologías de almacenamiento en caché actuales exigen no sólo grandes discos duros para almacenar datos, sino también gran cantidad de memoria de acceso aleatorio (RAM) para almacenar un índice que contiene la "dirección" de cada pieza de contenido en el disco. La RAM es cara en relación con la capacidad del disco duro y sólo está funcionando cuando lo está la electricidad (lo que, al igual que el ancho de banda, a menudo es oneroso y escaso en los países en vías de desarrollo).

HashCache suprime el índice, rebaja drásticamente la RAM y las necesidades de energía eléctrica en aproximadamente un factor de 10. Comienza transformando el URL de cada “objeto” de web almacenado - una imagen, gráfico, o bloque de texto en una página web - en un número más corto, usando las matemáticas llamada función resumen (hash). Si bien la mayoría de los otros sistemas de almacenamiento en caché lo hacen, también almacenan cada número de hash en una tabla acaparadora de RAM que lo correlaciona con  la dirección en la memoria del disco duro. La tecnología de Pai puede puentear este paso, ya que utiliza una función hash novedosa: el número que produce la función define el punto en el disco, donde se puede encontrar el objeto correspondiente de la web. "Al utilizar el hash para calcular directamente la ubicación, podemos deshacernos del índice por completo" señala Pai.

Para asegurarse, se sigue necesitando algo de RAM, pero sólo lo suficiente para ejecutar la función hash y para recuperar realmente un objeto web, según Pai. Aunque todavía se encuentra en una fase de desarrollo muy temprana, HashCache se está sometiendo a prueba en el Kokrobitey Institute en Ghana y la Universidad Obafemi Awolowo en Nigeria.

La tecnología acaba con una larga sequía en los avances fundamentales de caché, según Jim Gettys, coautor de la especificación HTTP que sirve como base de la comunicación de internet. Si bien es cada vez más factible que una escuela en un país de pocos recursos económicos pueda comprar cientos de gigabytes de memoria de disco duro, opina Gettys, esas mismas escuelas – de utilizar el mejor software actualmente disponible - pueden permitirse normalmente sólo suficiente memoria RAM para el apoyo de decenas de gigabytes de contenido de caché.  Mediante HashCache, un aula equipada con prácticamente cualquier tipo de ordenadores, incluso PCs abandonados, podría almacenar y acceder económicamente a un terabyte de datos web. Eso es suficiente como para almacenar todos los contenidos de la Wikipedia, por ejemplo, o todos los trabajos prácticos de acceso público disponibles de facultades como la Universidad de Rice y MT.

Incluso con los cables nuevos de fibra óptica que conectan a África oriental con Internet, miles de estudiantes de algunas universidades africanas comparten conexiones que tienen aproximadamente la misma velocidad que una línea DSL casera, según indica Ethan Zuckerman, un socio del Berkman Center for Internet and Society en la Universidad de Harvard (Estados Unidos). "Estas universidades tienen un de ancho de banda muy limitado", comenta. "Todos sus estudiantes quieren tener ordenadores, pero casi nunca tienen suficiente ancho de banda. Esta innovación hace que administrar un servidor de caché muy grande sea muchísimo más económico".

Pai planea patentar HashCache de modo que sea gratuito para las organizaciones sin fines de lucro pero deja la puerta abierta a la futura comercialización. Y eso significa que puede democratizar el acceso a internet en los países ricos, también.

Cache Cow

Un disco duro de un terabyte podría dar a estudiantes de países con pocos recursos un acceso mucho más rápido  al contenido de la Web. Pero esto podría ser bastante caro. HashCache ofrece una manera de reducir los costes.

Otros

  1. China prohíbe la exportación de minerales críticos y lanza un aviso a EE UU

    El país asiático está dispuesto a devolver el golpe con más fuerza e infligir perjuicios económicos a su rival

  2. La IA ahora puede crear una réplica de tu personalidad

    Una entrevista de dos horas es suficiente para captar con precisión tus valores y preferencias, según una nueva investigación de Stanford y Google DeepMind

    IA alterinativa
  3. La difícil tarea de señalar quién debe pagar por el cambio climático

    Los mayores contaminadores del mundo, en cifras.