Skip to main content

Los nuevos dispositivos informáticos están inspirando nuevas formas de introducir texto.

Per Ola Kristensson está haciendo que introducir texto en dispositivos móviles sea fácil, rápido e intuitivo. Ayudó a inventar el popular método gestual de entrada de texto conocido como ShapeWriter, pero eso es solo el comienzo. Kristensson, profesor de interacción persona-ordenador en la Universidad de St. Andrews en Escocia, cree que los gestos podrían combinarse con el reconocimiento de voz e incluso con el reconocimiento de la mirada en un sistema de entrada de texto que facilite la corrección de errores y la introducción de información impronunciable como contraseñas. “Me interesa optimizar el flujo de información desde tu cerebro al ordenador”, dice.

ShapeWriter permite introducir texto deslizando un dedo sobre las letras de una palabra. El software guarda el garabato o la forma que se genera al tocar esas letras como un sustituto de la propia palabra. Las formas de las palabras más comunes son fáciles de recordar; cada vez que quieras introducir una de esas palabras, puedes reproducir rápidamente su forma en lugar de volver a pulsar las letras. Los usuarios experimentados pueden escribir por gestos a más de 30 palabras por minuto, una velocidad vertiginosa en un dispositivo móvil típico. La aplicación ShapeWriter fue descargada más de un millón de veces en la App Store de Apple antes de ser comprada por Nuance Communications en 2010. Ahora la tecnología está integrada en Android, donde se conoce como “escritura por gestos”.

Kristensson, que tiene una sonrisa rápida y una risa fácil, siempre ha buscado fusionar campos de estudio dispares. Al crecer en Suecia, desafió un sistema educativo diseñado para canalizar a los estudiantes hacia especializaciones estrechas. Se sentía atraído por la informática, pero no podía soportar pasar cuatro años estudiando solo eso. Así que optó por la ciencia cognitiva, lo que le permitió estudiar no solo informática, sino también lingüística, filosofía y psicología. Esa combinación le lanzó por el camino de crear interfaces de usuario que están cambiando fundamentalmente la forma en que interactuamos con los ordenadores.

Su trabajo en herramientas para personas con discapacidad ilustra su enfoque de resolución de problemas. Muchas personas que no pueden hablar y tienen una destreza manual muy limitada se comunican escribiendo lentamente palabras que el ordenador pronuncia. Su velocidad media de comunicación es de una o dos palabras por minuto. En un proceso tan laborioso, predecir la intención del hablante puede acelerar mucho la tarea. Para ello se necesita lo que se conoce como un modelo estadístico del lenguaje. “Me sorprendió descubrir que, en 30 años de desarrollo de este tipo de tecnología, nadie había creado un buen modelo estadístico para las cosas que estas personas necesitan decir”, explica Kristensson.

El principal problema es la escasez de datos de los que derivar relaciones estadísticas. No se puede intervenir las comunicaciones de los ordenadores que utilizan muchas personas con discapacidad. Así que Kristensson ideó una alternativa: pedir a personas sin discapacidad que imaginaran qué dirían si tuvieran que comunicarse por este método. Utilizó Amazon Mechanical Turk para recopilar comunicaciones imaginadas —“¿Quién me llevará al médico mañana?” o “Necesito hacer una lista de la compra”—. Luego examinó Twitter, blogs y Usenet en busca de frases estadísticamente similares a las generadas por Mechanical Turk. Tras varias iteraciones, reunió las decenas de millones de frases necesarias para construir un modelo útil.

Actualmente, Kristensson trabaja en una tecnología que permite teclear a gran velocidad: un modelo estadístico del lenguaje gigantesco que interpreta con precisión la entrada de texto a pesar de un gran número de errores. También está investigando nuevas formas de introducir texto sin pantalla táctil ni teclado. Este tipo de tecnología será necesaria para sacar el máximo partido a los dispositivos informáticos portátiles como Google Glass, pero tendrá que funcionar casi a la perfección para ser útil, dado lo frustrante que puede ser un mal sistema de reconocimiento de voz. “Dentro de unos años, tendremos sensores increíbles que nos ayudarán a generar información contextual para crear interfaces verdaderamente inteligentes y adaptativas”, afirma.