Duolingo aprovecha las lecciones de idiomas en línea para traducir textos a nuevas lenguas.
Luis von Ahn está frustrado con Internet. Más específicamente, con la cantidad de contenido solo disponible en inglés, es decir, la mayor parte. "Internet en español tiene menos calidad", afirma, hablando en inglés con un ligero acento español.
Así que Von Ahn, profesor asociado de ciencias informáticas en la UCM (Universidad Carnegie Mellon, Estados Unidos), que creció en Guatemala, está haciendo algo al respecto.
El año pasado, él y el cofundador Severin Hacker, antiguo estudiante suyo en la CMU, lanzaron Duolingo, una empresa que combina el aprendizaje de idiomas con la traducción colectiva. A medida que los usuarios adquieren el conocimiento de una nueva lengua, ayudan a traducir documentos en Internet para otras personas. En última instancia, esperan que Duolingo pueda traducir contenidos de Internet a todos los idiomas principales.
Después de pasar meses en fase de prueba beta privada, el sitio ha abierto sus puertas a todos los interesados a finales de este mes, ofreciendo clases gratuitas en línea de inglés para hablantes de español y clases de español, alemán y francés para hablantes de inglés. Espera añadir otros idiomas a finales de año, como el mandarín y el portugués.
El territorio no es totalmente nuevo para Von Ahn. En el año 2000, ayudó a desarrollar Captcha, una prueba usada por sitios web para distinguir a los humanos de los robots de spam, y que pide introducir cadenas borrosas o distorsionadas de letras y números. Después de eso, Von Ahn creó reCaptcha, un sistema que aprovecha las pruebas de Captcha para digitalizar texto de libros impresos antiguos.
Von Ahn comenzó a planear la traducción de la web hace varios años, y pensó que tendría más sentido que los seres humanos completasen la tarea, ya que las tecnologías existentes de traducción automática, como Google Translate, están lejos de ser perfectas. Sin embargo, necesitaba una manera de motivar a la gente a participar. Pensó que podría ser interesante enseñar a los usuarios un nuevo lenguaje pidiéndoles traducir frases desde su idioma al inglés.
La configuración parece estar funcionando. Duolingo salió de su versión beta privada esta semana con más de 125.000 usuarios activos que han traducido hasta el momento 75 millones de frases de Wikipedia y otras fuentes en línea. Pronto, el sitio permitirá a la gente subir sus propios documentos para su traducción, afirma von Ahn. "Ya estamos traduciendo millones de oraciones al día, lo que supone una escala bastante buena", señala.
Duolingo puede ayudar a los principiantes a adquirir habilidades intermedias, indica Von Ahn, un nivel que algunos han logrado pasando alrededor de 100 horas en el sitio. Sin embargo, los usuarios aprenden más en las primeras cinco horas, asegura, y eso suele ser suficiente para poder desenvolverse en un país donde se hable la lengua.
Si el sitio logra enganchar a un millón de usuarios activos, Von Ahn cree que Duolingo podría hacerse con buena parte de las traducciones de textos en línea. El objetivo podría ser difícil de lograr, sin embargo, ya que aproximadamente la mitad de las personas que comienzan a utilizar el sitio acaban desistiendo. Von Ahn lo compara con apuntarse a un gimnasio: todo el mundo quiere hacerlo, pero muchos se dan por vencidos cuando se dan cuenta de lo difícil que es.
Cuando te apuntas para flexionar tus músculos de aprendizaje de idiomas, Duolingo determina tu grado de conocimiento de la lengua que deseas, y más tarde presenta oraciones para que las traduzcas, según tu nivel de habilidad. Hay una serie de actividades para hacer que los usuarios sigan aprendiendo, tales como escuchar una frase y repetirla de nuevo en voz alta (lo probé en la oficina, y acabé gritándole al ordenador en francés). Cuando Duolingo te muestra una nueva palabra, puedes hacer clic en ella para ver la definición. Después, el sitio te pide que la coloques en el contexto adecuado dentro de una oración.
Para probar la calidad del método de traducción de textos en línea de Duolingo, Von Ahn envió una traducción al español de parte de un artículo en el New York Times acerca de Anders Behring Breivik, que admitió haber matado a 77 personas en un altercado en Noruega el verano pasado. La versión de Duolingo solo falló a la hora de colocar un acento en una 'e', mientras que la versión de Google Translate fue mucho más difícil de comprender.
Chris Callison-Burch, profesor asociado de investigación de ciencias informáticas en la Universidad Johns Hopkins (EE.UU.), cuyo trabajo incluye la traducción automática estadística y las traducciones colectivas, define el enfoque de Duolingo como algo "muy interesante". Más allá de ayudar a la gente y ofrecer traducciones de contenidos en línea, los datos que produce Duolingo podrían ser utilizados para ayudar a mejorar las traducciones automáticas, señala.
Von Ahn indica que ese es uno de los planes de Duolingo, y cree que en algún momento las traducciones automáticas tendrán seguramente la misma potencia que las de los traductores humanos. Sin embargo, tal y como señala, aún no hemos llegado hasta ese punto y se ha estado trabajando en el problema desde hace décadas. "¿Quién sabe cuánto tiempo tardará?", se pregunta.