Con Google en el punto de mira, la mayor red social quiere una base de datos que describa el mayor número de cosas posible.
Más de mil millones de personas visitan Facebook cada mes, la mayoría para ver fotos y mensajes subidos por sus amigos. Facebook espera poder animar a algunos de ellos a que trabajen un poco ya que están allí. Al pedirle a la gente que proporcione datos -desde la localización de un negocio hasta el título de un libro- y que comprueben el trabajo de los demás, Facebook está construyendo un rico banco de conocimiento que podría hacer que su software fuera más inteligente y potenciara la utilidad de su motor de búsqueda.
"Intentamos hacer un mapa del mundo real en Facebook para que puedas hacer preguntas muy potentes y muy expresivas", afirma Mitu Singh, gerente de producto para el equipo de entidades de Facebook, un grupo encargado de construir un recurso denominado gráfica de entidades.
La gráfica de entidades es un compañero menos conocido de la famosa gráfica social de Facebook de alrededor de mil millones de personas y 150.000 millones de conexiones de amigos. Lo describe todo, desde los restaurantes de Nueva York al concepto de filosofía y las conexiones entre esos conceptos. Singh y sus compañeros se refieren en broma a su trabajo en la gráfica de entidades como el "proyecto trabajo asegurado", puesto que completar un mapa con todas las entidades del mundo es una perspectiva muy lejana.
Ese almacén de conocimiento se considera vital para las ambiciones del servicio de Búsqueda Gráfica de Facebook, desvelado el mes pasado y disponible aún solo para una fracción de los usuarios de la empresa (ver "Prueba no superada para Graph Search, el sistema de búsqueda de Facebook"). Al contrario que un buscador convencional, Búsqueda Gráfica está diseñada para comprender el significado de las frases introducidas por quien hace la búsqueda y después proporcionar resultados específicos como gente, sitios, libros o películas más que simples enlaces a páginas web.
Facebook ya ha recogido información de manera automática tirando de los datos de Wikipedia y otros bancos de datos. Pero, según ha ido quedando claro que el recurso sería crucial para sus intereses en asuntos como la búsqueda, se ha puesto un nuevo énfasis en encontrar formas de aprovechar los cientos de millones de miembros del sitio como una especie de equipo de indexado humano, una versión en carne y hueso de las arañas Web de Google. "Construir clasificadores y demás solo te lleva hasta cierto punto", afirma Singh. "En algún momento necesitas la ayuda de la gente".
El equipo de Singh ha cargado millones de entradas en la gráfica de entidades simplemente observando lo que hace la gente en Facebook. La información sobre instituciones como universidades y empresas se aprende de datos introducidos en sus respectivas páginas de perfil; la de negocios, películas, personajes de ficción y otros conceptos se aprende de las páginas de fans creadas por usuarios de Facebook. Animar a la gente a que etiquete el contenido duplicado ha enseñado a la gráfica de entidades de Facebook las distintas formas en las que la gente se refiere a una misma cosa. Por ejemplo, que NPR y National Public Radio son lo mismo. Y analizar muchos historiales de empleo en el sitio permite al motor de búsqueda de Facebook saber que una búsqueda de "ingeniero de software" también debería desenterrar a las personas que son "codificadores".
Ahora mismo Facebook está repletos de pequeños avisos para animar a la gente a contribuir más directamente, y estos quizá sean más directos cuando la nueva función de búsqueda gane en importancia. Las páginas de sitios como museos o tiendas ofrecen la posibilidad de "sugerir un cambio" que permiten a cualquiera cambiar o añadir información como el horario de apertura, la localización y el número de teléfono. El equipo de Singh planea lanzar peticiones parecidas para ayudar con otras páginas, como las de las películas o libros, explica Singh.
La herramienta más sofisticada de Facebook para acceder al conocimiento colectivo de sus usuarios es una interfaz denominada “editor de lugares”. Guía a los usuarios para arreglar los errores en o añadir datos a los sitios de la gráfica de entidades de Facebook; en uno de sus modos permite al usuario clicar rápidamente botones de "sí" o "no" detectando entradas duplicadas. Puede parecer aburrido, pero Facebook ha descubierto que es sorprendentemente popular. "Como en el caso de Wikipedia, lo que estamos viendo es a gente apasionada por su pueblo natal o el pueblo en el que viven", afirma Singh. "Les gusta asegurarse de que está arreglado y corregido".
Facebook usa indicadores sociales para animar a que haya más contribuciones. El editor de lugares muestra un contador con el número de personas a las que ha ayudado lo editado por un usuario, definido como datos actualizados con los que ha interactuado otra persona en Facebook. Quien limpiara las direcciones de un puñado de farmacias Walgreens en San Francisco, eliminando las duplicadas, ha podido saber que más de mil personas se han beneficiado de su trabajo, un impresionante refuerzo psicológico. A veces aparecen mensajes para informar a la gente de cuáles de sus amigos han ordenado datos recientemente. Una táctica parecida consiguió que Facebook disparara el número de personas registradas como donantes de órganos en Estados unidos en 2012.
Facebook no es el único que cree que un recurso como la gráfica de entidades será importante para el futuro de la búsqueda. El año pasado Google reveló un proyecto denominado Gráfica del Conocimiento, su propio sistema para almacenar información sobre organizaciones y las relaciones entre ellas, que actualmente se usa para dar respuestas concretas a algunas preguntas.
Las gráficas tanto de Google como de Facebook podrían acabar por mejorar algo más que la búsqueda. La de Facebook se usa, por ejemplo, para intentar adivinar qué temas preferirá ver una persona de las actualizaciones de sus amigos. Las dos empresas también podrían usar sus gráficas para hacer publicidad dirigida.
Ambos proyectos sirven como ejemplo de la Web semántica, un paso evolutivo de la historia de la información en línea que ha sido predicho y elaborado durante una década por, entre otros, el W3C, el órgano que desarrolla la tecnología y los estándares Web. Una de sus principales ideas era crear páginas Web -y almacenes de datos- que permitieran a las máquinas comprender el significado del texto, las imágenes y otros datos que los humanos buscan en las páginas más convencionales.
"La Web se diseñó para proporcionar la espina dorsal de las gráficas de entidades y de conocimiento que Facebook y Google construyen ahora mismo", afirma Manu Sporny, que preside el grupo de trabajo del W3C dedicado a RDFa, una tecnología usada -también por Google y Facebook- para añadir datos semánticos a las páginas Web.