Una nueva herramienta sirve para explorar grandes grupos de datos—y podría ayudar a organizar la web.
“¿Cómo podemos tomar un elevado número de cosas y hacer que tengan sentido?” se pregunta Gary Flake, fundador y director de Microsoft Live Labs, una división del gigante del software encargada de diseñar herramientas web experimentales. El problema es cada vez más común, puesto que la web pone a nuestra disposición unas cantidades enormes de información.
La respuesta de Flake a este problema es Pivot, una herramienta hecha pública a principios de este mes en conjunción con una demostración que Flake llevó a cabo durante la conferencia TED en Long Beach, California.
Pivot presenta los datos en forma de colección de imágenes acompañadas de datos textuales. Clasificar los datos procedentes de Wikipedia, por ejemplo, significa la creación de miniaturas de imágenes que acompañen esa información. El usuario puede hacer un zoom y adentrarse en ese grupo de imágenes para ver datos individuales más de cerca, o alejarse para ver los objetos agrupados según varios criterios. Aunque existen otras herramientas para organizar datos en varias configuraciones, Flake espera que la interfaz gráfica de Pivot, simple e intuitiva, ayude a que la naturaleza interna de los datos salte más a la vista a nivel visual.
La potencia de Pivot, señala Flake, radica en su consistente interfaz de usuarios, diseñada para facilitar a los usuarios descubrir los patrones dentro de un gran número de datos. “Puedes interactuar con los datos de una forma distinta al navegador y distinta a las búsquedas,” afirma.
La tecnología que forma el núcleo de Pivot es el software Seadragon de Microsoft, diseñado para manipular grandes cantidades de información visual. Permite que el hardware se mueva más rápidamente a través de vastas colecciones de gráficos, haciendo zooms perfectos sin tener que esperar a que la información se cargue, y haciendo un zoom inverso para ver cientos o miles de imágenes de una vez. Una herramienta tan rica a nivel visual como Pivot no habría sido posible hace cinco años, señala Flake, puesto que los ordenadores de la mayoría de los usuarios no habrían sido capaces de procesar los gráficos.
El equipo en Live Labs ha creado varias colecciones de muestra que los usuarios pueden visualizar, aunque la intención es que los usuarios creen sus propias colecciones. Para ello, necesitan convertir sus imágenes al formato Deep Zoom utilizado por Seadragon, y anotarlas usando un formato basado en el estándar web Extensible Markup Language (XML). El equipo ha lanzado un add-in para Microsoft Excel, llamado Pivot Collection Tool, que permite a los usuarios llevar a cabo esa tarea sin tener conocimientos de XML.
Las colecciones pueden ser muy simples, con un número relativamente pequeño de imágenes con datos estáticos adjuntos, o pueden ser muy grandes, conectadas a un feed de datos cambiantes. Desde que se lanzó Pivot, un usuario lo ha utilizado para ver y clasificar sus amigos de Facebook, examinando la forma en que se relacionan entre sí.
Pivot también se puede utilizar para navegar por la web y ver y organizar páginas web. Flake señala que cree que la interfaz de Pivot podría integrarse con características como las de búsqueda. Pivot podría, según señala, proporcionar a los usuarios una mejor forma de clasificación de los resultados de búsqueda—en vez de ver los 10 primeros resultados en una página, podrían moverse entre miles de resultados visualmente. “Estamos intentando ver la web como algo físico,” afirma Flake.
Pivot fue una de las estrellas del TED. Roger McNamee, director administrativo y cofundador de la firma de capital de riesgo Elevation Partners, describió la tecnología como “la estrella más brillante” dentro de una colección de demostraciones impresionantes.
“La inteligente interfaz de usuario de Pivot permite nuevas formas de búsquedas relacionadas o fortuitas que creo que transformarán el modo en que me relaciono con la web,” afirma. “Después de varios años de aburrimiento, la ‘guerra de las búsquedas’ puede que vuelva a ser interesante.”
Martin Wattenberg, que se encargó de desarrollar el programa de visualización de datos de IBM Many Eyes con su colega Fernanda Viegas, afirma que el equipo de Pivot está solucionando uno de los grandes problemas sin resolver a la hora de tratar con datos modernos, y lo ha logrado gracias a la construcción de una interfaz que unifica distintos tipos de medios, incluyendo textos e imágenes.
Wattenberg afirma que el objetivo es proporcionar técnicas matemáticas más sofisticadas para clasificar los datos. “¿Cuál es la desviación estándar de una colección de imágenes?” afirma. “Esa cuestión ni siquiera tiene sentido.”
Lo principal para todas las herramientas de visualización, señala Wattenberg, es que se integren bien con el resto de la web. Sería muy útil tener estándares abiertos para permitir que varios tipos de software interoperen, afirma, y para permitir a los usuarios incluir las visualizaciones en sus propias páginas web. “Tenemos que hacer que la visualización sea onmipresente y se ejecute sin problemas,” afirma. “Como todo lo demás dentro de la informática, queremos poder tener acceso a ello en cualquier momento, en cualquier lugar.”