Un “conjunto de nodos rápidos y de potencia débil” podría reemplazar a las infraestructuras de los servidores gigantes.
Mediante la utilización de un grupo procesadores iguales a los que normalmente se usan en los netbooks y otros dispositivos móviles, un equipo de investigadores ha creado una potente arquitectura para servidores que gasta menos electricidad que una bombilla.
Este tipo de arquitectura, denominada como “conjunto de nodos rápidos y de potencia débil”, o FAWN ("fast array of wimpy nodes", en inglés), se perfila como una opción para reducir la cantidad de electricidad que algunos gigantes de internet como Google, Microsoft, Amazon, eBay o Facebook utilizan para mantener sus infraestructuras informáticas. Si las predicciones de sus inventores se confirman, una arquitectura como esta podría tener un impacto significativo tanto en el nivel básico como en el impacto medioambiental de la computación en la nube.
La electricidad supone un 50 por ciento del coste de las operaciones de los centros de datos, y en los Estados Unidos el coste por kilovatio está subiendo. Incluso algunos recién llegados como Facebook gastan 1 millón de dólares al mes en electricidad, y la Agencia de Protección Ambiental (EPA, en inglés) prevé que para 20111 los centros de datos en Estados Unidos podrían llegar a utilizar hasta 100 mil millones de kilovatios cada hora, con un coste total anual de 7.400 millones de dólars, y una cantidad de emisiones de CO² de 59 millones de toneladas métricas.
El FAWN, cuyos detalles se describen en un estudio aún no publicado por David Andersen y su equipo en la Universidad de Carnegie Mellon, trata solucionar este problema gracias a una combinación de procesadores relativamente lentos (los que se usan en los netbooks y otros dispositivos similares) y memoria flash (como la que se usa para grabar datos en las cámaras digitales y los dispositivos USB). Al contrario de lo que se podría pensar, como resultado obtenemos una arquitectura cuyo rendimiento por vatio de electricidad es 100 veces mejor que el de los servidores tradicionales, que usan unos procesadores más rápidos (pero que consumen más electricidad) y un tipo de almacenamiento en disco.
Los excepcionales niveles de rendimiento del FAWN están limitados a una serie de tareas—el acceso aleatorio a pequeños trozos de información—pero son estas tareas de entrada y salida de datos tan intensivas las que realmente pueden dañar la infraestructura de compañías de internet como Facebook.
“Cuando visitas Facebook.com, la página de inicio tiene cientos de datos individuales, que se traducen en cientos de búsquedas internas,” señala Andersen. Las peticiones para actualizar todos esos centenares de elementos, entre los que se incluyen las actualizaciones de nuestros amigos, el número de mensajes de la bandeja de entrada, y muchos más, se envían a un tipo de software especializado llamado memcached, que guarda cierto tipo de información relevante en la RAM. Memcached evita que las bases de datos que Facebook tiene almacenadas en discos duros se vean sobrecargadas por todos esos millares de peticiones de información simultáneas. Amazon, que sufre un problema similar al de Facebook con su carrito de la compra y las recomendaciones a medida del usuario, utiliza un tipo de software propio llamado Dynamo, que realiza prácticamente las mismas funciones.
Lo que hace que FAWN pueda reemplazar a programas como memcached o Dynamo es lo que los científicos informáticos denominan el muro de la memoria, que es la enorme disparidad que se da entre el ritmo con el que los datos almacenados en el disco pasan a la CPU y el ritmo con el que dicha CPU, que es mucho más rápida que el disco, es capaz de procesar esos datos. (Andersen señala que las CPUs modernas usan un gran número de transistores para intentar averiguar qué tipo de datos les van a llegar, tomando datos por adelantado o guardándolos en la memoria caché para asegurarse de que el chip siempre tiene un flujo estable de datos para procesar.)
Hay dos formas de poder saltar este muro de la memoria: la primera consiste en incrementar el rendimiento de la memoria del sistema, y el segundo en simplemente bajar el nivel de proceso de la CPU. FAWN hace ambas cosas: la memoria flash tiene un acceso aleatorio a la información mucho más rápido que los discos, y además los procesadores de FAWN son más lentos y requieren menos energía, con lo que utilizan mejor los transistores para averiguar qué datos les van a llegar.
La arquitectura FAWN se compone de varios nodos individuales, cada uno con un procesador AMD Geoge de 500 megahercios (el mismo chip que se usó en el ordenador portátil de $100 del proyecto One Laptop Per Chile) con 256 megabytes de RAM y una tarjeta flash compacta de 4 Gigabytes. El grupo de tipo FAWN más grande que se ha construido hasta la fecha, con 21 nodos, gasta un máximo de 85 vatios en condiciones de uso normales.
Cada nodo FAWN lleva a cabo 364 operaciones por segundo y vatio, lo que resulta cien veces mejor de lo que se puede conseguir con un sistema tradicional basado en discos y que lleve a cabo tareas intensivas de entrada y salida de datos, como por ejemplo recolectar y mostrar todos los pequeños trozos de información de una página de Facebook o FriendFeed, o un resultado de búsqueda de Google.
Este tipo de rendimiento se puede aplicar a muchas aplicaciones, no sólo a los centros de datos, afirma Steven Swanson, profesor asistente en el departamento de ciencias informáticas e ingeniería de la Universidad de California, en San Diego. Swanson posee su propio servidor de alto rendimiento y basado en memoria flash, conocido como Gordon, y que en la actualidad sólo existe como simulación. Este servidor es parecido a FAWN en cuanto a su arquitectura, pero fue diseñado para funcionar como aplicación científica a la vez que centro de datos.
El objetivo de Swanson es dar el máximo uso a las cualidades únicas de la memoria flash y poder solucionar aquellos problemas que actualmente sólo pueden solucionarse mediante el uso de los mayores, mejores y más caros súperordenadores del planeta—sistemas con hasta un petabyte de RAM. “Estamos trabajando con el Centro de Supercomputación de San Diego en una serie de grandes patrones de genómica y bioinformática,” señala Swanson. “Queremos que las operaciones se procesen muy rápidamente, y si los datos gráficos no caben en la RAM, esto provoca mucha lentitud, lo que significa que la simulación acaba siendo menos fiel.”
FAWN es “la dirección en la que hay que moverse,” comenta Niraj Tolia, investigador de Exascale Computing Lab en HP Labs. “Lejos quedaron aquellos días en que podíamos medir el rendimiento bruto usando la métrica,” añade.
En la actualidad, FAWN no puede usarse para operaciones de CPU tan intensivas como el procesamiento de video, pero Andersen señala que las próximas versiones utilizarán los procesadores Atom, que son más potentes (y que Swanson está considerando usar en su propio sistema, el Gordon). Puesto que han sido diseñados para ser usados en netbooks, estos procesadores de mayor potencia sólo consumen la misma cantidad de energía que los chips de AMD—aproximadamente 4 vatios cada uno. Con un equipo para trabajo en red y el consiguiente suministro eléctrico “fácilmente se podría ejecutar un pequeño website en uno de estos servidores, que consumiría unos 10 vatios,” señala Andersen—una décima parte de los que los servidores web normales utilizan.
Andersen espera que los grandes usuarios de los centros de datos investiguen las posibilidades de la próxima generación de FAWN. “Me encantaría que Facebook, Google o Microsoft empezaran a construir sus servidores de este modo,” afirma.