Un motor de búsqueda en tiempo real basa sus resultados en los hábitos de navegación de los usuarios.
A finales de esta semana un nuevo motor de búsqueda “en tiempo real” y “social” llamado Wowd lanzará la versión beta de su servicio al público. La compañía afirma que sus resultados de búsqueda sólo incluyen páginas que hayan sido realmente visitadas por sus usuarios, y que sus algoritmos de ranking ofrecen información basada en su frescura y popularidad.
Según el director general, Mark Drummond, Wowd intenta equilibrar los resultados actualizados, aunque caóticos, producidos por sitios como Twitter y los resultados de motores de búsqueda tradicionales como Google, que tardan más en cambiar. Espera que Wowd sea particularmente valioso para aquellos que quieran conocer qué contenidos son populares en la actualidad, así como aquellos que consideren la búsqueda como una característica adicional.
“Si lo que te interesa es la búsqueda por referencia, Google es genial para ello, y no nos imaginamos que nadie pueda arrebatarles esa posición,” afirma Drummond. “Si en vez de ello lo que te interesa es saber de qué cosas está hablando todo el planeta, es ahí donde creemos que Wowd es una opción ganadora.”
Cualquier usuario podrá visitar la web de Wowd y llevar a cabo búsquedas básicas, sin embargo la compañía espera que un gran número de usuarios permitan la instalación del software de Wowd en sus ordenadores para que se pueda hacer un análisis anónimo de sus patrones de navegación. Es así como la compañía espera poder construir su índice de búsqueda. Al contrario que los motores de búsqueda tradicionales, que utilizan rastreos robotizados para crear bases de datos de las páginas en internet y almacenar información en enormes centros de datos, los usuarios de Wowd serán los rastreadores y los almacenes al mismo tiempo.
Drummond afirma que los usuarios estarán motivados a instalar el código puesto que con ello se desbloquean características adicionales, incluyendo un motor de recomendación y características de búsqueda avanzadas tales como la opción de buscar a través del propio historial web.
Los usuarios que accedan a instalar el software enviarán a Wowd una lista de los sitios que visiten. Drummond afirma que la compañía considera cada visita a una página web como evidencia de que la página contiene algún tipo de contenido interesante. La idea es similar a la utilizada por sitios de recomendación como Digg o StumbleUpon, sólo que Wowd ofrece a los usuarios una forma más pasiva de participar. “Votar en estos sitios requiere un compromiso emocional una orden de magnitud mayor que sólo limitarse a mirar algo,” afirma Drummond.
El sistema de Wowd también almacenará bits de su índice de búsqueda en cada uno de los ordenadores de los usuarios. La compañía utilizará un algoritmo llamado Kademlia, que se utiliza más frecuentemente en los sistemas de intercambio de archivos P2P, para hacer que su índice esté disponible incluso cuando algunos usuarios apaguen sus ordenadores. Esto se lleva a cabo mediante el almacenaje de cada bit de información en varias máquinas y el uso de análisis estadístico para determinar cómo compartirlos para que sigan estando disponibles.
Drummond enfatiza que el sistema está diseñado para salvaguardar la privacidad. Por ejemplo, cuando un usuario visita una página—nominándola para el índice de Wowd durante el proceso—esa página es visitada e indexada por el ordenador de un usuario distinto. Este proceso protege contra la recolección accidental de información que esté protegida por palabras clave o cookies. El sitio tampoco indexa ninguna página que esté protegida por protocolos de internet encriptados.
Wowd no se limita a simplemente informar de lo que están haciendo los usuarios en tiempo real, como por ejemplo hacen algunos motores de búsqueda de Twitter. En vez de eso utiliza sus propios algoritmos para equilibrar la frescura de una página frente a su aparente popularidad. Cuando se hace una búsqueda en Wowd, el usuario puede elegir ver los resultados categorizados por popularidad o por frescura. En cualquiera de los casos, la página de actualizará automáticamente y ajustará sus resultados a lo largo del tiempo si el usuario la abandona.
Wowd incluye varios métodos para que los usuarios descubran nuevos contenidos, incluyendo una “lista de lo más popular” en la página de inicio que simplemente muestra los sitios que más visitan los usuarios. Más tarde, afirma Drummond, el sitio añadirá más formas de que la gente descubra lo que es popular en áreas de interés particulares.
Otras compañías de búsqueda, como por ejemplo la compañía de alemana Faroo, también han intentado utilizar una arquitectura distribuida para obtener resultados de búsqueda más en tiempo real. El director de Faroo, Wolf Garbe, afirma que el método reduce significativamente los costes de creación de una startup de búsqueda. También cree que cualquier motor de búsqueda en tiempo real tendrá que depender de sus usuarios de algún modo, puesto que incluso una compañía con tantos recursos como Google es incapaz de hacer un nuevo rastreo de la web cada cinco minutos.
Petar Maymounkov, investigador en MIT que ayudó a diseñar el algoritmo Kademlia, afirma que Kademlia está adaptado a la arquitectura de Wowd. Sin embargo, denota que Kademlia no está bien protegido contra usuarios maliciosos que quieran jugar con el sistema. Aún resulta una incógnita saber si cualquier arquitectura distribuida puede ser segura cuando no existe un control central sobre quiénes participan, afirma.
Maymounkov añade que será interesante ver cómo de bien funciona Kademlia como fundación para un motor de búsqueda. Durante los 10 años en los que el algoritmo ha sido utilizado, según explica, se ha dedicado principalmente al intercambio de archivos. Y puesto que el intercambio de archivos se utiliza más frecuentemente para obtener películas gratis y música, afirma que los usuarios de ese tipo de software tienden a donar mucha capacidad de proceso y tolerar altibajos en la disponibilidad para obtener esa información. Las expectativas de los usuarios en cuanto a un motor de búsqueda general puede que sean distintas, afirma.
Wowd “es una buena idea, pero aún les queda trabajo por hacer,” afirma Daniel Tunkelang, cofundador de la compañía de búsqueda Endeca, con sede en Cambridge, Massachusetts. La versión previa del sitio, en su opinión, no proporciona suficientes resultados de búsqueda de alta calidad para hacer que destaque del resto de intentos por hacer búsquedas en tiempo real. A medida que más usuarios se registren después del lanzamiento del sitio, eso puede que proporcione datos de mejor calidad y mejore los resultados, afirma Tunkelang, y añade que se reserva su opinión hasta ese momento.