Computación

La inteligencia artificial imita y sustituye personas, pero solo en vídeo

La mejora de las técnicas de aprendizaje automático permite generar vídeo y audio de forma cada vez más realista de modo que podría llegarse incluso a reemplazar a una persona real

por Will Knight | traducido por Teresa Woods
04 Mayo, 2017

Los titulares podrían no ser lo único falso en el futuro.

Potentes técnicas de aprendizaje automático (ver El secreto más oscuro de la inteligencia artificial: ¿por qué hace lo que hace?) facilitan cada vez más la manipulación y creación de vídeos y audios realistas, además de la capacidad de hacerse pasar por cualquier persona con una precisión increíble.

Una app de smartphone llamada FaceApp, lanzada recientemente por una empresa radicada en Rusia, puede modificar automáticamente la cara de alguien para añadir una sonrisa, sumar o restar años y cambiarle de sexo. La aplicación también puede producir "embellecedores" que eliminan las arrugas y, de forma más controvertida, aclaran el tono de piel.

Una empresa llamada Lyrebird, lanzada como una spin-out de la Universidad de Montreal (Canadá), mostró la semana pasada una tecnología que afirma que puede utilizarse para imitar la voz de otra persona. La empresa publicó videoclips de demostración de Barack Obama, Donald Trump y Hillary Clinton avalando la tecnología.

Son tan solo dos ejemplos de cómo los algoritmos de inteligencia artificial (IA) más avanzados pueden utilizarse para producir contenidos en lugar de simplemente analizar datos.

Herramientas de hardware y software para gráficos cada vez más potentes, además de nuevas tecnologías de captura de vídeo, están impulsando esta tendencia también. El año pasado, unos investigadores de la Universidad de Stanford (EEUU) presentaron un programa de intercambio de caras llamada Face2Face. Este sistema puede manipular el vídeo de forma que las expresiones faciales de una persona concuerden con las de alguien que está siendo monitorizado por una cámara con sensor de profundidad. A menudo, el resultado es inquietantemente realista.

La capacidad de manipular voces y caras de forma tan realista podría suscitar varias preocupaciones, algo que reconocen los propios creadores de Lyrebird. "Las grabaciones de voz se consideran en la actualidad como pruebas sólidas en nuestra sociedad, y en especial en la jurisdicción de muchos países", plantea una declaración ética publicada en la página web de la empresa. "Nuestra tecnología cuestiona la validez de este tipo de pruebas al permitir manipular con facilidad los registros de audio. Esto podría tener consecuencias potencialmente peligrosas".

Tanto FaceApp como Lyrebird emplean redes neuronales convolucionales profundas para permitirlo. Esto significa que la empresa utiliza una técnica que ha surgido en los últimos años como una forma de lograr que los algoritmos vayan más allá de limitarse a aprender a categorizar cosas y generen sus propios datos plausibles.

Al igual que muchas tareas abordadas en la actualidad por la IA, hacerlo implica el uso de redes neuronales muy grandes o profundas. Este tipo de redes se alimentan normalmente con datos de entrenamiento manipulados de forma que las redes respondan de la forma deseada a nuevas informaciones. Por ejemplo, pueden entrenarse para reconocer caras u objetos con una precisión asombrosa.

Sin embargo, esto implica que entonces también se puede conseguir que esas mismas redes generan sus propios datos a partir de los datos que han sido capaces de internalizar durante su entrenamiento.

Es posible entrenar una red así para que genere imágenes desde cero que casi pasan por reales. En el futuro, también podría volverse mucho más fácil manipular el vídeo con las mismas técnicas. "En algún momento es probable que sea posible crear vídeos completos con redes neuronales", señala el cofundador de Lyrebird Alexandre de Brébisson. "Supone un reto mayor porque existe mucha variabilidad en el espacio multidimensional que implican los vídeos y los modelos para ello aún no son perfectos".

Dadas las tecnologías que están emergiendo ahora, nuestra capacidad para detectar vídeo y audio falso podría volverse cada vez más importante. El alumno de doctorado de la Universidad Friedrich Alexander (Alemania) y uno de los investigadores detrás de Face2Face, la app de intercambio de caras en tiempo real, Justus Thies, explica que ha lanzado un proyecto dirigido a detectar la manipulación de vídeo. "Los resultados intermedios parecen prometedores", asegura.

Computación

La inteligencia artificial imita y sustituye personas, pero solo en vídeo

Google anuncia un hito hacia la computación cuántica sin errores

El vídeo es el rey: bienvenido a la era del contenido audiovisual

Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones