.

Inteligencia Artificial

Un algoritmo lee Harry Potter para explicarte sus hechizos

1

La empresa Maluuba entrena algoritmos de aprendizaje profundo para contestar preguntas sobre pequeñas cantidades de texto. Algún día, su tecnología podría leer las instrucciones en su lugar

  • por Will Knight | traducido por Teresa Woods
  • 30 Marzo, 2016

Enseñar a un ordenador a jugar al Go a un nivel sobrehumano está muy bien, pero no resulta especialmente útil ni para usted ni para mí. Pero, ¿y si un ordenador pudiese leer varias docenas de páginas de texto, como el manual de un nuevo microondas, para después contestar preguntas acerca de cómo funciona? Yo me apuntaría.

Leer y comprender textos resulta increíblemente difícil para los ordenadores, pero una empresa canadiense llamada Maluuba ha logrado progresos con un algoritmo que puede leer textos y contestar preguntas sobre ellos con una precisión impresionante. Y lo más importante: a diferencia de otros enfoques, trabaja con cantidades muy pequeñas de texto. Podría ayudar a que los ordenadores "comprendan" los documentos.

La semana pasada, unos investigadores de Maluuba publicaron un trabajo que describe sus últimos progresos. Describen un algoritmo capaz de leer varios cientos de cuentos infantiles que incluían preguntas y respuestas sobre cada texto. Después de entrenarse, el algoritmo podía contestar correctamente unas preguntas de selección múltiple sobre un texto desconocido con una precisión superior al 70%. Los investigadores probaron el algoritmo con el libro de Harry Potter y la piedra filosofal, y encontraron que podía contestar preguntas sobre él con una precisión parecida.

Más allá de los avances académicos, Maluuba espera llegar a crear algún día un sistema que se ocupe de las lecturas mundanas por usted. "Nos interesan los casos de uso como los manuales de instrucciones, los historiales médicos o los documentos de atención al cliente", explica Mohamed Musbah, el vicepresidente de la empresa radicada en Waterloo (Canadá). "En esas áreas, realmente no existe un exceso de datos".

El equipo de Maluuba empleó un popular enfoque de aprendizaje de redes neuronales conocido como aprendizaje profundo para entrenar su sistema. Pero los investigadores diseñaron su red para considerar los textos desde distintos niveles de abstracción - desde palabras hasta frases -. También prepararon la red para que se le diera bien aprender incluso antes de ser entrenada, cuando normalmente las redes de aprendizaje profundo se configuran al azar antes de entrenarse. Esto permitió a la red aprender muy rápido con resultados un 15% mejor de lo que se había conseguido antes de emplear aprendizaje profundo. También rindió un 2% mejor que la mejor solución programada a mano.

"Si nos basamos en las cifras, representa un gran salto", afirma Yoshua Bengio, profesor de la Universidad de Montreal (Canadá) y asesor científico de Maluuba. Pero Bengio, que es uno de los gurús de aprendizaje profundo que colaboran con empresas para comercializar inteligencia artificial (IA), advierte que les llevará algún tiempo a los expertos analizar la importancia del enfoque.

La idea de enseñar a máquinas a leer y comunicarse de forma eficaz mediante el lenguaje natural desde luego resulta muy atractiva. Podría abrir nuevas y potentes maneras de interactuar con los ordenadores y minar informaciones. Pero comprender los textos es uno de los mayores retos de la inteligencia artificial; los ordenadores normalmente se ven estorbados dado que el lenguaje requiere una profunda comprensión de cómo funciona el mundo real.

A pesar de las dificultades, algunas de las empresas tecnológicas más importantes intentan desarrollar una IA que pueda comprender los textos.  Facebook está recopilando datos sobre conversaciones a través de un servicio de asistente personal llamado M en un esfuerzo por entrenar sus algoritmos para conversar de forma natural (ver El hombre que enseña a las máquinas a entender el lenguaje). Google DeepMind, una filial de Alphabet centrada en la IA, realiza un trabajo similar: entrena sistemas de aprendizaje profundo para que lean resúmenes de artículos de noticias (ver La inteligencia artificial de Google aprende a leer con el 'Daily Mail').

Sin embargo, hasta ahora no se ha conseguido ningún avance rompedor, y tampoco está claro cuán difícil será equipar a las máquinas con sofisticadas habilidades de comprensión lectora. Los investigadores están logrando progresos sobre todo al afinar y mejorar unas técnicas de aprendizaje de máquinas clave y al alimentar los ordenadores con grandes cantidades de textos anotados. 

El tipo de enfoque de aprendizaje de máquinas empleado por los investigadores de Maluuba normalmente requiere enormes ringleras de texto para aprender. De hecho, la cantidad de texto requerido para que funcione el aprendizaje profundo ha sido señalada como una de sus limitaciones más importantes (ver Un niño de dos años inspira una IA más humana). Un reto fundamental con el lenguaje natural es que las palabras empleadas para representar diferentes conceptos son arbitrarias, por lo que resulta más difícil establecer conexiones entre ellas que entre imágenes.

Maluuba, que fue fundada por varios graduados de la Universidad de Waterloo (Canadá) en 2010, desarrolló anteriormente un asistente personal inteligente para smartphones, y ha centrado sus investigaciones en el procesamiento del lenguaje natural o la comprensión de máquinas.

"Creo que desde luego representa un paso adelante", afirma Richard Socher, el cofundador de una empresa de IA llamada MetaMind, que también trabaja en el procesamiento del lenguaje. "Es un sistema muy bien diseñado que combina características tradicionales del procesamiento del lenguaje natural bien entendidas y establecidas con ideas de redes neuronales". 

Chris Dyer, un investigador de la Universidad de Carnegie Mellon (EEUU) especializado en el procesamiento del lenguaje natural, está de acuerdo en que los resultados de Maluuba son impresionantes, pero cree que las máquinas necesitarán adquirir una comprensión real del mundo para poder conversar correctamente - en lugar de la capacidad de sacar unas conclusiones estadísticas de los textos- . Esto probablemente significará ir más allá de aprender únicamente de textos anotados. "Los ordenadores están demasiado limitados en cuanto a su percepción y comprensión del mundo", asegura Dyer.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Esta IA ayuda a que los profesores enseñen mejor matemáticas a los niños

    La herramienta, llamada Tutor CoPilot, demuestra cómo la IA podría mejorar, en lugar de sustituir, el trabajo de los educadores

  2. Meta ofrece gratis un gran conjunto de datos para acelerar el descubrimiento de nuevos materiales mediante IA

    Open Materials 2024 (OMat24) es uno de los mayores conjuntos de datos de entrenamiento de IA para la ciencia de materiales y está disponible de forma abierta y gratuita

  3. ChatGPT discrimina por raza y género según el nombre de usuario en el 0,1% de las interacciones

    MIT Technology Review accede en exclusiva a la investigación sobre estereotipos negativos en los grandes modelos lingüísticos de la empresa