El programa Watson, de IBM, hará una demostración de los últimos trucos dentro del campo del procesamiento del lenguaje natural.
Durante décadas los humanos nos hemos esforzado por crear máquinas que fueran capaces de extraer el significado del lenguaje humano, teniendo en cuenta el desorden, los contenidos sutiles, el humor y la ironía. Los métodos tradicionales requerían una gran cantidad de trabajo manual previo para poder crear un tipo de material que los algoritmos informáticos pudieran comprender. El objetivo final es hacer que este paso acabe siendo innecesario.
IBM espera poder dar un paso adelante hacia ese objetivo gracias a Watson, un sistema informático que jugará a ‘Jeopardy!’, el popular concurso de televisión de preguntas y respuestas, compitiendo contra concursantes humanos. Se espera de que las primeras demostraciones de este sistema se den durante este año, y que en algún momento del año que viene se produzca en encuentro televisivo—presentado por Alex Trebek, conductor habitual del programa. Las preguntas serán leídas en voz alta por Trebek pero serán introducidas en la máquina en formato texto durante el programa.
La compañía aún no ha publicado ningún estudio de investigación que describa la forma en que el programa va a ser capaz de afrontar el estilo de preguntas de ‘Jeopardy!’. Sin embargo, David Ferruci, el científico informático de IBM a la cabeza de este proyecto, nos explica que el sistema disecciona las preguntas en trozos, busca “conocimientos relacionados” en sus propias bases de datos, y finalmente hace conexiones para poder ensamblar un resultado. Watson no está diseñado para buscar en la web, y el objetivo final de IBM es crear un sistema que se pueda vender a las empresas para ayudar a que las grandes cantidades de información sean más accesibles.
Ferrucci describe la forma en que esta tecnología trataría la siguiente pregunta de ‘Jeopardy!’: “Es la ópera mencionada en las letras de un número uno de Smokey Robinson and the Miracles en 1970.”
El motor Watson utiliza unas técnicas naturales de proceso de lenguaje para diseccionar la pregunta en componentes estructurales. En este caso, las piezas incluyen 1) una ópera; 2) la ópera se menciona en una canción; 3) la canción fue un éxito en 1970; y 4) la canción era de Smokey Robinson and the Miracles.
A la hora de revisar sus bases de datos a la búsqueda de información que pudiera estar relacionada con estos segmentos, el sistema podría acabar encontrando cientos de pasajes. Entre ellos podrían estar incluidos los tres siguientes:
“Pagliacci,” la ópera sobre un payaso que intenta “esconder” sus sentimientos;
“Tears of a Clown”, el éxito de la Motown de Smokey Robinson de los años 60;
“Tears of a Clown”, la canción de The Miracles número uno en el Reino Unido en 1970.
Al analizar estos pasajes, Watson es capaz de identificar “Pagliacci” como “una ópera,” aunque este dato por si solo no es de mucha ayuda puesto que hay muchos otros pasajes que también identifican nombres de óperas. El segundo resultado identifica una canción exitosa, “The Tears of a Clown,” de “Smokey Robinson,” y el sistema supone que podría ser lo mismo que “Smokey Robinson and the Miracles.” Sin embargo, hay muchos otros títulos de canciones que se generarían de forma similar. La probabilidad de que el resultado fuese preciso sería juzgada como baja, puesto que la canción está asociada con “los 60” y no con “1970”. El tercer pasaje, sin embargo, refuerza la idea de que “The Tears of a Clown” fue un éxito en 1970, siempre y cuando el sistema determine que “The Miracles” se refiere a lo mismo que “Smokey Robinson and the Miracles.”
A partir del primero de estos pasajes, el motor Watson sabría que Pagliacci es una ópera sobre un payaso que esconde sus sentimientos. Para hacer la conexión con Smokey Robinson, el sistema tiene que reconocer que “tears” (lágrimas) tiene una fuerte conexión con “feelings” (sentimientos), y puesto que sabe que Pagliacci trata sobre un payaso que intenta esconder sus sentimientos, llega a la conclusión—y acierta—de que Pagliacci es la respuesta. Por supuesto, es posible que pese a esto el sistema elija la respuesta incorrecta "dependiendo del número de evidencias que puedan llegar a apoyar estas respuestas incorrectas,” afirma Ferrucci.
Según Ferrucci, para los sistemas de lenguaje natural menos sofisticados es fácil llegar a la conclusión de que “The Tears of a Clown” es la respuesta si ignoran que lo que se pedía era el nombre de una ópera a la que hace referencia esa canción. Una conclusión como esta podría venir provocada por pasajes que contuviesen muchas palabras clave que coincidieran con la pregunta.
Marti Hearst, científica informática de la Universidad de California, en Berkeley, afirma que “los investigadores especializados en los procesos naturales del lenguaje han realizado un progreso enorme en este campo durante la última década.” Añade que “enfrentar al sistema de preguntas y respuestas Watson de IBM frente a humanos con altos conocimientos en ‘Jeopardy!’ es una forma divertida de publicitar y mostrar este progreso,” aunque advierte que existe una gran escasez de publicaciones relativas a este proyecto de investigación que puedan ser examinadas.
Mientras tanto, la Agencia para Proyectos de Investigación Avanzada de Defensa (DARPA, en inglés) anunciará en breve los participantes elegidos para tomar parte en una investigación de cinco años destinada al avance del estado de los procesos del lenguaje natural. “Creo que este área va a cobrar mucha importancia durante los próximos años,” afirma Dan Weld, científico informático en la Universidad de Washington, y que dirije un grupo que ha solicitado ser parte del proyecto de la DARPA.
Tanto si el Watson de IBM vence a los humanos en ‘Jeopardy!’ el año que viene como si no, el proyecto de DARPA seguramente hará que se logren grandes avances en este campo, afirma Weld. Tal y como la DARPA hizo constar en su solicitud de propuestas de investigación, los sistemas actuales y más inteligentes de procesamiento del lenguaje tienen un enfoque muy estrecho, mientras que el resto de sistemas con enfoques más amplios tienden a ser menos precisos. “El hecho de que la DARPA esté involucrada hará que la gente de más nivel en universidades y laboratorios se esfuercen por crear sistemas integrados capaces de leer una amplia gama de documentos,” señala Weld. “La mayoría de los sistemas actuales sólo son capaces de unir pequeñas piezas del puzzle.”