IBM construye un motor de búsqueda dirigido a la, según estimaciones, quinta parte de la población mundial que no sabe leer.
Unas 10.000 personas utilizan en todo el mundo una versión de la red como ninguna otra: operada por voz a través del teléfono. Conocida como "web hablada", es el resultado de un proyecto de investigación de IBM que intenta recrear las características y funciones de la red basada en texto para personas en regiones en desarrollo con bajos niveles de alfabetización y técnicos.
Cuatro años después del lanzamiento del primer prototipo, la web hablada es parte de la vida cotidiana de los usuarios de cuatro estados de la India y partes de Tailandia y Brasil. Estas personas la utilizan para saber cosas tales como los precios de los cereales locales o las oportunidades de empleo. En la web hablada, los números de teléfono reemplazan a las direcciones web. Una persona puede llamar a un sitio de voz y escuchar o grabar contenidos.
En la actualidad, el proyecto está pasando por una etapa de desarrollo que refleja una etapa por la que ya se pasó en la historia de la web tradicional: el debut de las búsquedas como forma de navegar por una creciente cantidad de contenidos.
"A medida que el número de sitios de voz crece, y albergan más contenido, la gente necesita una manera de encontrar lo que quieren rápidamente", afirma Nitendra Rajput, investigador de IBM Research India. Rajput fue un antiguo colaborador de la web hablada con el fundador del proyecto Arun Kumar.
Un sitio de voz tiene cierta estructura: por ejemplo, cuando una persona llama para subir un sitio, interactúa con un sistema telefónico automático que acepta comandos de voz y pide al usuario crear un título para su sitio y añadir diferentes secciones de información. Sin embargo, escuchar mensajes de voz de larga duración es ineficiente y costoso, afirma Rajput.
"Queremos que usted sea capaz de pronunciar un nombre de pesticida, por ejemplo, para encontrar rápidamente contenidos relacionados con él", afirma. Sin embargo el diseño de un motor de búsqueda que funcione de ese modo está lejos de ser una tarea simple. La tecnología de reconocimiento de voz puede ser utilizada para tomar el término de búsqueda de una persona y ver si coincide con un índice previamente procesado de sitios de voz grabados. No obstante, la presentación de los resultados es todo un reto. "No podemos hacer que lea una lista de 20 resultados. Sería demasiado largo, y la gente no los recordaría todos ", asegura Rajput. "En vez de eso, debemos decirle al usuario que hay muchos, y preguntarle cómo reducir la lista".
Al usuario se le pregunta con qué categorías desea filtrar los resultados—por ejemplo, por el nombre de la persona que posee el sitio, el lugar en que fue creado, o si el término de búsqueda fue encontrado en una sección de un tipo particular, por ejemplo un anuncio de noticias, o preguntando o respondiendo a una pregunta. Este paso se repite hasta que haya cinco resultados o menos, momento en el que se da lectura a todos para que el usuario pueda elegir por cuáles quiere "navegar".
Unos ensayos con 40 agricultores en el estado indio de Gujarat validaron este diseño, que se extenderá en todo el territorio de la web hablada. Son necesarias, sin embargo, más características que ayuden a la navegación de los contenidos. A medida que la web hablada crece, se vuelve importante encontrar más formas de ayudar a la navegación de los contenidos, señala Rajput, de igual modo que otros mecanismos similares se han desarrollado dentro de la web basada en texto.
Otra de las mejoras en las que se está trabajando proporciona una forma de filtrar los sitios de voz. Los usuarios ya pueden utilizar una función de avance rápido para escuchar un sitio a velocidad aumentada—la función va a 10 veces la velocidad normal, haciendo que las palabras se reproduzcan demasiado rápido para entenderlas, pero se ralentiza en ciertas palabras o frases importantes. El efecto es similar al de una persona leyendo un texto en voz alta y a gran velocidad, afirma Rajput, y permite que una persona encuentre muy rápidamente lo que busca.
Los investigadores creen que el sistema podría saber qué palabras o frases son importantes al observar qué frases particulares llevaron a los usuarios a pasar desde el avance rápido a la velocidad normal de lectura. "Actualmente estamos recogiendo estadísticas de los usuarios que poseemos con el fin de saber qué palabras son importantes", explica Rajput.
"Hay mucha gente en el mundo que no tiene ni idea de cómo utilizar la web o incluso comprender el texto", afirma Naushad UzZaman, investigador de la Universidad de Rochester, en Nueva York. "Aunque no se puede eliminar la brecha digital, el hecho de posibilitar la obtención de los beneficios de la web con la voz es un ejemplo de cómo podemos estrecharla".
No obstante, UzZaman afirma que la tecnología ideal debería ser capaz de crear un camino que conecte a aquellas personas total o parcialmente analfabetas con al menos algunas de las características de la web más amplia. Posee un prototipo de sistema que digiere el texto de Internet en frases mucho más simples que transmiten el mismo significado esencial. Se colocan imágenes al lado del texto para ayudar a aquellas personas que se esfuerzan por leer a entender lo esencial. Se puede decir que un prototipo funciona bien cuando se prueba con las páginas de Wikipedia, señala UzZaman.
Rajput afirma que, por ahora, la web hablada de IBM es totalmente independiente de la Red (World Wide Web), y que la mayoría de los usuarios se interesan principalmente por las cuestiones locales. Sin embargo, es posible que las dos se pudieran unir. "Si existe información relevante en la web real, se puede pasar a la web hablada usando una API y la tecnología de texto a voz", explica Rajput. "Sin embargo tiene que convertirse al idioma correcto, y el soporte para algo así no es bueno al margen del inglés de EE.UU."