.

Vista área de Londres (Reino Unido).

Computación

La IA ya sabe recrear lugares a partir de imágenes a vista de pájaro

1

Un algoritmo de aprendizaje automático ha sido entrenado para crear imágenes vistas desde el suelo teniendo como referencia una fotografía por satélite. Esta red generativa antagónica puede ayudar a los geógrafos a clasificar la tierra de forma más rápida y sencilla

  • por Emerging Technology From The Arxiv | traducido por Mariana Díaz
  • 10 Julio, 2018

Entre sus muchas genialidades, el gran Leonardo da Vinci fue capaz de hacer dibujos y pinturas que, a vista de pájaro, mostraban ciertas áreas de Italia con un nivel de detalle que no fue posible repetir hasta la posterior invención de la fotografía y las máquinas voladoras. De hecho, muchos críticos se han preguntado cómo fue capaz de imaginar estos detalles. 

Ahora, un grupo de investigadores está trabajando en el problema inverso: dada una imagen por satélite de la superficie terrestre, ¿puede saberse cómo se ve esa zona desde el suelo? ¿Cómo de precisa puede ser una imagen artificial?

Ya tenemos la respuesta gracias al equipo de la investigadora de la Universidad de California en Merced (EE. UU.) Xueqing Deng. Los investigadores han entrenado un algoritmo de aprendizaje automático para crear imágenes a nivel del suelo a partir de la observación de imágenes satelitales.

La técnica se basa en una forma de inteligencia artificial (IA) conocida como red generativa antagónica, que consiste en dos redes neuronales llamadas generador y discriminador.

Foto: Ejemplo real de cómo el algoritmo entrenado recrea la zona fotografiada por satélite con inputs (imagen satelital introducida), outputs (imagen generada por la IA) e imagen real.

El generador crea imágenes que el discriminador evalúa comparando con algunos criterios aprendidos, como por ejemplo cuánto se parecen las imágenes a las jirafas. Al usar la salida del discriminador, el generador aprende gradualmente a producir imágenes parecidas a las jirafas.

En este caso, Deng y su equipo entrenaron al discriminador utilizando imágenes reales del suelo, así como imágenes satelitales de esa ubicación. Por lo tanto, la red aprende a asociar una imagen a nivel del suelo con su vista aérea.

Evidentemente, la calidad del conjunto de datos es importante. El equipo usa como verdad fundamental el mapa de cobertura de suelo LCM2015, con el que se puede abarcar un terreno con una resolución de un kilómetro para todo el Reino Unido. Sin embargo, los investigadores limitan los datos a una cuadrícula de 71x71 kilómetros que incluye Londres (Reino Unido) y el paisaje rural que la rodea. Para cada ubicación en esta cuadrícula, descargaron una vista a nivel del suelo de Geograph, una base de datos online.

Después, el equipo entrenó al discriminador con 16.000 pares de imágenes aéreas y a nivel del suelo.

El siguiente paso fue comenzar a generar imágenes a pie de calle. El generador fue alimentado con un conjunto de 4.000 imágenes satelitales de ubicaciones específicas y tuvo que crear vistas a nivel del suelo para cada una de ellas, utilizando los comentarios del discriminador. El equipo probó el sistema con 4.000 imágenes aéreas y las comparó con las imágenes reales del terreno.

Los resultados arrojados son sin duda interesantes. La red produce imágenes que son plausibles dada la imagen de satelital si la calidad es relativamente baja. Las imágenes generadas capturan cualidades básicas del suelo, como si hay o no una carretera, si la tierra es rural o urbana, etcétera. "Las imágenes generadas a nivel del suelo parecían naturales, aunque, como se esperaba, carecían de los detalles de las imágenes reales", señalan Deng y su equipo.

Es un buen truco, pero ¿cómo de útil es? Una tarea importante para los geógrafos es clasificar la tierra según su uso; por ejemplo, si es rural o urbana.

Las imágenes a nivel del suelo son esenciales para esto. Sin embargo, las bases de datos existentes tienden a ser escasas, particularmente en lugares rurales, por lo que los geógrafos deben hacer interpolación entre las imágenes, un proceso algo mejor que adivinar.

Ahora, las redes generativas antagónicas de Deng y su equipo proporcionan una forma completamente nueva de determinar el uso de la tierra. Cuando los geógrafos quieran conocer la vista a nivel del suelo en cualquier ubicación, simplemente pueden crearla utilizando la red neuronal basándose en una imagen de satélite.

El equipo de investigadores incluso comparan los dos métodos: interpolación versus generación de imágenes. La nueva técnica determina correctamente el uso de la tierra el 73 % de las veces, mientras que el método de interpolación es correcto en solo el 65 % de los casos.

Es un trabajo interesante que podría facilitar la vida de los geógrafos. Pero Deng y su equipo tienen mayores ambiciones: esperan mejorar el proceso de generación para que, en el futuro, produzca imágenes que sean aún más detalladas a nivel del suelo. Probablemente, hasta el mismísmo Leonardo da Vinci estaría impresionado.

Ref: https://arxiv.org/abs/1806.05129: What Is It Like Down There? Generating Dense Ground-Level Views and Image Features From Overhead Imagery Using Conditional Generative Adversarial Networks.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Google anuncia un hito hacia la computación cuántica sin errores

    Una técnica llamada “código de superficie” permite a los bits cuánticos de la empresa almacenar y manipular datos fielmente durante más tiempo, lo que podría allanar el camino a ordenadores cuánticos útiles

  2. El vídeo es el rey: bienvenido a la era del contenido audiovisual

    Cada vez aprendemos y nos comunicamos más a través de la imagen en movimiento. Esto cambiará nuestra cultura de manera inimaginable

    Dos personas creando contenido en formato vídeo
  3. Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones

    La empresa quiere construir una computadora que contenga hasta un millón de cúbits en un campus de Chicago