.

Otros

Dispositivos inteligentes con ‘sentido común’ para atender mejor a los usuarios

1

Los teléfonos y los ordenadores pueden ser más sencillos y efectivos empleando técnicas de inteligencia artificial y el conocimiento de conceptos básicos generados por humanos.

  • por Isabel Díaz | traducido por
  • 22 Febrero, 2012

En un momento en el que el uso de ordenadores y teléfonos inteligentes crece exponencialmente –se prevé que en 2016 habrá más de 1.000 millones de smartphones en el mundo- es necesario que estos dispositivos se integren con facilidad en la vida de los usuarios. El problema reside en cómo generar la información que estos necesitan para comunicarse mejor y de manera más natural con los humanos. La solución, según un proyecto del laboratorio Media Lab del Instituto Tecnológico de Massachusetts (MIT, en Estados Unidos) pasa por aplicar técnicas de inteligencia artificial.

Henry Lieberman, director de este proyecto, lleva años trabajando en la comunicación entre humanos y máquinas, tratando de mejorar todo tipo de interfaces de usuario. La semana pasada, él y Dustin Smith, uno de sus ayudantes graduados del Media Lab, protagonizaron una sesión sobre el aprendizaje de las máquinas a través del lenguaje, organizada por el Centro de Innovación BBVA en Madrid (España).

En opinión de Lieberman, “es necesario que los sistemas informáticos y las bases de datos se conviertan en aliados interpretando y comprendiendo mejor cuáles son las intenciones reales de las personas y los objetivos que se marcan en su vida cotidiana”. Esto no pueden hacerlo solos, por lo que “los humanos debemos facilitarles el conocimiento que necesitan a través del uso del sentido común”, explica Lieberman.

El sentido común es el conjunto de todas aquellas ideas y actividades cotidianas que forman parte de nuestro conocimiento del mundo y su funcionamiento habitual. Un conglomerado de razonamientos como, por ejemplo, que nos abrigamos cuando sentimos frío, o que si llueve usamos un paraguas. Estos razonamientos, tan “lógicos” para las personas, no son fáciles de entender para las máquinas. “El problema estriba en cómo hacer que estas representen la vida. Conceptos como ‘casarse’ o ‘irse de vacaciones’ no son sencillos. Por eso en 1999 se inicia el proyecto Open Mind Common Sense  (OMCS) en el MIT, una base de datos con el objetivo de recopilar, a través de la red, lo que ellos llaman ‘conocimiento de sentido común’. 

Desde entonces hasta ahora, más de 15.000 voluntarios de todo el mundo han contribuido a entretejer una red que cuenta ya con más de un millón de datos. Para ello, OMCS utiliza la herramienta ConceptNet, una red semántica que almacena todo aquello que el ordenador debe saber sobre el mundo. Este ‘conocimiento voluntario’ se genera gracias a las relaciones que establecen los colaboradores online, partiendo de frases cortas, lo que a su vez genera nodos que representan conceptos. Por ejemplo: ‘aprendemos para saber más cosas’, o ‘el periódico está hecho de papel’. 

En la imagen, una forma de representación de conceptos básicos en forma de palabras, creada por ConceptNet. 

Además OMCS cuenta con Analogy Space, una representación matricial de ConceptNet, que logra reducir grandes cantidades de datos para localizar patrones a gran escala sobre los conocimientos almacenados. Partiendo de cualquier categoría o idea, estos patrones ayudan a distinguir entre los conceptos que son deseables (ganar mucho dinero), de los no deseables (perder un trabajo). Así, mediante las relaciones entre conceptos y las frases creadas por los voluntarios, se conforma una manera básica de organizar el conocimiento para mejorar el funcionamiento de las interfaces en lenguaje natural. 

El objetivo de estas interfaces es que la conversación entre el humano y la máquina se produzca en el propio lenguaje natural del usuario, sin que éste necesite aprender ningún ‘idioma’ informático.

Este es un terreno en el que aún hay barreras que superar. Un ejemplo muy claro de estos obstáculos se da en el sector financiero. “Para el usuario medio no es fácil tomar decisiones económicas”, explica Lieberman. A la mayoría de los clientes que se dirigen a un banco les mueven propósitos sencillos como la compra de una casa o un plan de financiación para unas vacaciones. “Pero cuando llegan al banco se encuentran con un complicado léxico con el que no están familiarizados”, afirma Lieberman. “Por eso –continúa- es necesario hacer uso de la tecnología para mejorar la comunicación con el usuario, integrando esa terminología en sus objetivos y recuperando así su confianza en el sistema empresarial”. Porque en el fondo, según Lieberman, lo que las personas realmente esperan conseguir de sus servicios financieros es una ayuda.

El usuario necesita comprender, en situaciones puntuales, por qué su tarjeta de crédito es rechazada o por qué no ha podido finalizar la compra de su billete de avión por Internet. La tecnología debe estar ahí para, empleando el contexto y el sentido común, entender cuáles son los objetivos del usuario y qué necesita para poder ayudarlo. 

Esa ayuda, puede tomar forma en la figura de un consejero de confianza que conoce nuestra situación económica y, por tanto, nuestras posibilidades y limitaciones. Pero, según Lieberman, en el entramado financiero actual, generalmente, “el cliente medio se encuentra con sistemas computarizados que sólo saben cuánto dinero tiene en el banco, pero no saben cuáles son las consecuencias económicas de casarse o comprarse un coche”. 

Precisamente, apunta Lieberman, “en estos momentos en los que los dispositivos inteligentes están tan extendidos en el mundo empresarial es imprescindible que usemos la tecnología para ofrecer un mejor servicio de atención al cliente”. 

Para Lieberman, una de estas mejoras en la comunicación entre sistemas y humanos es Siri, el asistente personal de iOS que aplica el procesamiento del lenguaje natural. “Puedes preguntarle si vas a necesitar un paraguas el próximo viernes en Nueva York y Siri consultará las previsiones climáticas para ese día”, detalla Lieberman. “Personalmente –prosigue- creo que esta es una manera mucho mejor de interactuar con un ordenador, especialmente con un smartphone,  porque puedes hablarle”. 

Lieberman también reconoce en Siri ciertas limitaciones, por ejemplo, que solo se puede interactuar con la aplicación a través de la voz o que está restringida a los dominios de Apple. “Lo importante es que es la primera de este tipo de interfaces, pero seguramente no será la última”, afirma el experto. De hecho, él cree que las interfaces mediante voz se impondrán en los próximos años, ya que las aplicaciones móviles actuales, en general “son cada vez más complicadas”. En su opinión, las empresas deberían poner fin a las interfaces gráficas, basadas en menú e iconos, y reorientarlas mejor hacia los objetivos de los usuarios. “Empleando la inteligencia artificial y el conocimiento del sentido común, podremos hacer ordenadores y teléfonos mucho más sencillos de usar y más efectivos”, asegura Lieberman. Un compromiso en el que trabajan activamente desde el MIT para que estas mejoras se produzcan en un futuro lo más cercano posible.

Otros

  1. Robotaxis

    Las 10 Tecnologías Emergentes 2025: los coches sin conductor solicitados mediante 'apps' se extienden a más ciudades

  2. Combustible más limpio para aviones

    Las 10 Tecnologías Emergentes 2025: los combustibles alternativos fabricados a partir de desechos industriales o dióxido de carbono podrían ayudar a reducir las emisiones climáticas de la aviación

  3. Robots que aprenden rápido

    Las 10 Tecnologías Emergentes 2025: los avances de la IA han hecho que sea más rápido que nunca entrenar a los robots para realizar nuevas tareas