Computación
"El asistente virtual de Facebook hace tareas que ninguna inteligencia artificial puede"
Un equipo de entrenadores humanos en la sombra ayuda a M a responder a preguntas más complejas que las que Siri y Cortana pueden contestar
Hacia finales del mes pasado, 100 afortunados usuarios de la app de mensajería móvil de Facebook recibieron un nuevo y singular contacto con el que hablar: M, un asistente virtual alimentado por una mezcla de algoritmos y operarios humanos.
Ese diseño cíborg hace posible que M sea capaz de gestionar peticiones más complejas que los asistentes de app móvil que Apple, Microsoft y Google ofrecen como parte de su software de smartphones. Siri, Cortana y la app de búsquedas de Google pueden interpretar comandos sencillos y consultas factuales, como: "¿Cuál es la previsión del tiempo para Londres (Reino Unido)?" Pero no pueden lidiar con preguntas más complejas como: "¿A dónde puedo ir para comer una buena hamburguesa en Chicago (EEUU)?" No pueden entablar una conversación bidireccional ni reservar un hotel.
M es capaz de estas cosas porque el software delega a operarios humanos, conocidos como entrenadores, las tareas que no es capaz de realizar. A veces el entrenador tiene que hacer todo el trabajo, pero M también es capaz de digerir las consultas que reconoce como fuera de su alcance y producir resúmenes fáciles de procesar que hacen más eficiente la labor del entrenador.
Ahora mismo este modelo no es lo suficientemente eficiente para que M sea algo más que un experimento, porque requiere demasiados trabajadores humanos. Pero Alex Lebrun, que lidera el equipo que desarrolla el asistente de Facebook, dice que podría convertirse en un producto real porque el trabajo de los entrenadores humanos está enseñando poco a poco al software a asumir una proporción más grande del trabajo. Lebrun y su equipo se unieron a Facebook cuando la red social adquirió la start-up que cofundó, Wit.ai (ver El reconocimiento de voz logra freír beicon en el microondas). Recientemente, se reunió con MIT Technology Review. Lo que sigue a continuación es una transcripción editada de esa conversación.
Foto: Facebook está probando un asistente virtual, llamado M, que puede gestionar consultas más complejas que las 'apps' existentes como Siri.
Los asistentes virtuales automatizados como Siri llevan un tiempo en el mercado. ¿Por qué hacer un asistente donde parte del trabajo es asumido por humanos?
Los asistentes virtuales del mercado, como Siri y Cortana, son como una búsqueda – puedes formular una pregunta y recibir una respuesta, pero tienen muchas limitaciones. Los usuarios siempre han estado frustrados. De media, la gente que utiliza Siri cada día o semana sólo la utilizan para tres o cuatro preguntas, porque ya se han quemado. Los usuarios dejan de utilizarlo, o utilizan lo que saben que funciona.
Queríamos centrarnos en tareas que ninguna otra inteligencia artificial del mundo es capaz de realizar. Para hacer esto, tienes que entender lo que quiere la gente pero también hacer un plan para cumplirlo. Nadie tiene los datos para entrenar el aprendizaje de máquinas para hacer eso. Decidimos disponer de inteligencia artificial y humanos que trabajen en conjunto. La inteligencia artificial ayuda a los humanos, que a su vez entrenan la inteligencia artificial.
¿Puede darme un ejemplo de para qué lo utiliza la gente?
Algunas personas dicen: "Mándame un aviso cada mañana a las siete si va a llover". Eso está fuera del alcance de Siri.
Yo utilizo M mucho para planificar los fines de semana. Elijo una ciudad, y le pido a M que me reserve un hotel y me haga sugerencias de actividades para mis hijos de tres años y un año de edad. M utiliza páginas de búsqueda o de Facebook para generar una lista que enseña a un entrenador. Si la inteligencia artificial se equivocó en algo, el entrenador eliminará algunas opciones. M vuelve y me dice: "Aquí tienes tu hotel, y recomiendo que hagas esto por la mañana, y vayas a este museo por la tarde". Puedes hacer esto con Google, pero requiere muchas búsquedas. En lugar de enviarte una lista con 50 sugerencias, M reduce y prioriza la lista, para presentar las primeras tres o cinco cosas. Ese es el tipo de cosas que haría un buen asistente humano. Una vez que empiezas a utilizar a M, crea adicción.
¿Se podría convertir en un producto real que puedan utilizar todos?
Estoy seguro de que podremos escalarlo para hacer un producto disponible para el público general. Tenemos varias docenas de entrenadores. Es un ratio alto [para el número de usuarios] pero estamos aprendiendo muchas cosas nuevas. Hay muchos requisitos que surgen una y otra vez, y los podemos aprender. Todavía necesitaremos a los entrenadores a largo plazo.
El grupo de investigaciones de inteligencia artificial de Facebook (FAIR, por sus siglas en inglés) intenta crear software capaz de realizar diálogos como el de M sin intervención humana (ver El hombre que enseña a las máquinas a entender el lenguaje). ¿Trabaja con ellos?
Tenemos una relación estrecha con FAIR. Trabajamos con ellos en algunos módulos de M. Es una muy buena oportunidad para que demuestren lo que hacen. Todos los módulos se construyen de acuerdo al aprendizaje de máquinas. Por nuestra experiencia sabemos que si empiezas con reglas codificadas, te das contra un muro; queremos evitar esto.
¿Pueden los datos de M ayudar en los esfuerzos de FAIR por desarrollar un software capaz de dialogar por sí mismo?
Tienen mucha hambre de los datos que sean. Para responder preguntas no existen muchos datos, y son sencillas preguntas factuales que puedes contestar con Wikipedia. Debido a sus limitaciones, los asistentes como Siri no proporcionan muy buenos datos. Aquí tenemos un diálogo completo con un objetivo y su ejecución. La única forma de construir este conjunto de datos es disponer de usuarios reales que hagan preguntas reales.