Crear una escena digital realista requiere habilidad, creatividad y muchas horas. Este nuevo avance puede hacer lo mismo automáticamente con solo ver un boceto. La técnica podría revolucionar el desarrollo de videojuegos y la RV pero también podría contaminar nuestra visión de la realidad
Crear un entorno virtual que parezca realista requiere tiempo y habilidad. Los detalles deben hacerse a mano con unidades de procesamiento gráfico (GPU) capaces de representar formas en 3D, con la iluminación y texturas apropiadas. El último videojuego de gran éxito, Red Dead Redemption 2, por ejemplo, contó con un equipo de alrededor de 1.000 desarrolladores que trabajó durante más de ocho años para crearlo, en ocasiones dedicando 100 horas a la semana. Pero este tipo de carga de trabajo podría dejar de ser necesaria dentro de poco. Un nuevo y poderoso algoritmo de inteligencia artificial (IA) puede imaginarse detalles fotorrealistas de una escena sobre la marcha.
Desarrollado por el fabricante de chips Nvidia, este software no solo hará la vida más fácil para los desarrolladores de software. También podrá usarse para generar automáticamente entornos virtuales para la realidad virtual y para enseñar cómo es el mundo a coches autónomos y robots. El vicepresidente de Aprendizaje Profundo Aplicado de la compañía Nvidia, Bryan Catanzaro, detalla: "Podemos crear nuevos bocetos nunca vistos y reproducirlos. En realidad, estamos enseñando al sistema a dibujar a partir de vídeos reales".
Los investigadores de Nvidia utilizaron un enfoque estándar de aprendizaje automático para identificar diferentes objetos en una escena de vídeo como coches, árboles y edificios. Después, el equipo usó lo que se conoce como red generativa antagónica, o GAN, para entrenar a un ordenador para que creara imágenes realistas en 3D.
Luego, el sistema se puede alimentar con el contorno de una escena que muestra dónde están los diferentes objetos, y el sistema lo rellena con detalles asombrosos y ligeramente brillantes. El resultado es impresionante, incluso aunque algunos de los objetos puedan aparecer torcidos o doblados.
Catanzaro detalla: "Los gráficos de ordenadores clásicos se procesan creando la forma en la que la luz interactúa con los objetos. Nos preguntamos qué podríamos hacer con la inteligencia artificial para cambiar el proceso de rénder". Sostiene que este planteamiento podría reducir la barrera para el diseño de juegos. Además de representar escenas completas, podría utilizarse para agregar a una persona real dentro de un videojuego. Para ello solo habría que alimentar al sistema durante unos pocos minutos con vídeos de esa persona en la vida real. Sugiere que el método también podría emplearse para ayudar a generar configuraciones realistas para la realidad virtual, o para proporcionar datos artificiales de entrenamiento para vehículos autónomos y robots. "No se pueden obtener datos reales de entrenamiento para cada situación que pueda surgir", comenta. El trabajo se presentó recientemente en NeurIPS, una importante conferencia de IA en Montreal (Canadá).
"Se trata de un trabajo interesante e impresionante", opina el profesor de la Universidad de British Columbia (Canadá) Michiel van de Panne, especialista en aprendizaje automático y gráficos informáticos. Señala que el trabajo anterior con las GAN se limitaba a generar elementos más simples, como imágenes individuales o movimientos de personajes.
"Este trabajo señala el camino hacia una forma muy diferente de crear imágenes animadas. Uno con un conjunto diferente de capacidades", que son menos computacionales y pueden ser interactivos, destaca Van de Panne.
El algoritmo de Nvidia es solo lo último en una vertiginosa sucesión de avances relacionados con las GAN. Inventadas por un investigador de Google hace solo unos años, las GAN se están posicionando como una herramienta extraordinaria para generar imágenes y audios realistas y, a menudo, extrañamente insólitos. Esta tendencia promete revolucionar los gráficos informáticos y los efectos especiales, y ayudará a los artistas y músicos a imaginar o desarrollar nuevas ideas. Pero también podría debilitar la confianza del público en las pruebas de audio y vídeo.
Catanzaro admite que su avance podría ser sujeto de malos usos: "Es una tecnología que se podría usar para muchas cosas".