La comunicación humana se basa en una serie de sutilezas sociales y emocionales que deben ser no solo comprendidas por las máquinas sino también reproducidas en su voz y su tono
Foto: El actor Joaquin Phoenix se enamora de un ordenador en la película "Her".
Tal vez viera la presentación de Watson de IBM en directo en el concurso televisivo Jeopardy! en 2009. O quizás haya visto la última campaña de publicidad televisiva de la empresa, que incluye unos diálogos algo graciosos entre Watson y Serena Williams, Richard Thaler, y Bob Dylan.
Aunque no sea así, probablemente habrá interactuado en algún momento con un ordenador parlante. Pero crear un ordenador parlante convincente es una tarea realmente complicada. En un interesante artículo de The New York Times del pasado lunes, el redactor John Markoff narra los esfuerzos que se invirtieron en la creación de la voz de Watson de IBM para analizar el panorama actual de creación de voces digitales más naturales y aceptables.
Este es uno de los retos fascinantes de las interacciones humano-máquina: las pistas sociales y emocionales tienen una importancia vital en cuanto a la comunicación oral. No sólo resulta discordante si la voz de un asistente como Siri de Apple o Alexa de Amazon suena poco natural. También puede resultar irritante cuando tales sistemas no reconocen el tono del usuario para después modular su propia voz en consonancia. Después de formular la misma pregunta con una frustración creciente, por ejemplo, parece hasta insultante que una voz artificial siempre produzca la misma respuesta impasible.
Poco después del lanzamiento de Siri, escribí sobre la importancia de intentar captar el humor para crear algo capaz de entretener a los usuarios sin irritarlos. De hecho, la necesidad de incorporar la inteligencia artificial a un marco social existente puede explicar por qué sentimos la necesidad de asignar características como otorgarles un sexo incluso a unos robots ficticios. Quizás esto hasta explique por qué Apple adquirió recientemente Emotient, una empresa que se centra en interpretar y responder a las emociones humanas.
También resulta interesante considerar el potencial de las interfaces informáticas atractivas y emotivas, como las que imaginaba la película Her de Spike Jonze. Como dijo uno de los directores del Laboratorio Multimodal de Watson de IBM Research Michael Picheny en el artículo del New York Times: "Una buena interfaz humano-máquina es una obra de arte, y debería ser considerada como tal".
(Fuente: New York Times)