.

Inteligencia Artificial

TR10: IA que crea imágenes

1

Los modelos de IA que generan imágenes a partir de frases sencillas se están convirtiendo en potentes herramientas creativas y comerciales  

  • por Will Douglas Heaven | traducido por
  • 11 Enero, 2023

 

• ¿Quién? 

OpenAI, Stability AI, Midjourney, Google.

• ¿Cuándo?

Ahora.

En 2021, OpenAI abrió un mundo de combinaciones extrañas y maravillosas cuando lanzó DALL-E, un modelo de lenguaje que convertía texto en imagen. Puedes escribir una breve descripción de casi cualquier cosa y el programa genera una imagen de lo que has pedido en cuestión de segundos. DALL-E 2, presentado en abril de 2022, supuso un enorme salto hacia adelante. Google también lanzó su propia IA de creación de imágenes, llamada Imagen.  

Aun así, la novedad más importante fue Stable Diffusion, un modelo de conversión de texto en imagen de código abierto y gratuito, lanzado por la empresa británica Stability AI en agosto. Stable Diffusion no solo podía producir algunas de las imágenes más asombrosas hasta la fecha, sino que estaba diseñado para funcionar en un (buen) ordenador doméstico. 

Al poner al alcance de todos estos modelos que transforman texto en imagen, Stability AI echó leña a lo que ya era un infierno de creatividad e innovación. En pocos meses, millones de personas han creado decenas de millones de imágenes, algo que también trae problemas. Los artistas están atrapados en medio de una de las mayores transformaciones de la última década. Igual que los modelos lingüísticos, los generadores de imágenes pueden ampliar las asociaciones sesgadas y tóxicas enterradas en los datos de entrenamiento extraídos de internet. 

Esta tecnología se está incorparando a programas comerciales como Photoshop. Los artistas de efectos visuales y los estudios de videojuegos están explorando cómo acelerar los procesos de desarrollo. Esta tecnología de texto a imagen ya ha avanzado hasta convertir texto en vídeo. Los videoclips generados por Inteligencia Artificial que Google, Meta y otras empresas han enseñado en los últimos meses duran solo unos segundos, pero eso va a cambiar. Algún día, podrá crearse una película solo con introducir el guion en un ordenador. 

En 2022 no hubo nada en el campo de la IA que atrajera más la atención del público, por buenas y malas razones. Ahora esperamos ver qué tipo de impacto tendrán estas herramientas y todo el ámbito de la IA en las industrias creativas.

Nadie sabe dónde nos llevará el auge de la IA generativa. Lee más aquí.  

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Los nuevos asistentes de OpenAI y Google auguran la próxima batalla de la IA 

    Prometen estar muy por delante de herramientas como Siri o Alexa. 

    collage de capturas de pantalla de las demos GPT4o y Project Astra
  2. Astra, la apuesta de Google para ampliar la capacidad de la IA verá la luz a finales de año

    Los usuarios podrán interactuar con el asistente de inteligencia artificial mediante audio y vídeo cuando se lance a finales de este año. 

    Captura de pantalla de la demo de Astra en la que el usuario dibuja una flecha roja en la pantalla del teléfono donde la cámara del teléfono muestra la parte superior de un altavoz en un escritorio de la habitación, y Astra responde diciendo que el altavoz de agudos “produce sonidos de alta frecuencia”
  3. AlphaFold 3 de Google DeepMind puede predecir cómo interactúan el ADN, el ARN y otras moléculas

    AlphaFold 3 puede predecir cómo interactúan el ADN, el ARN y otras moléculas, lo que consolida aún más su papel de liderazgo en el descubrimiento de fármacos y la investigación. ¿A quién beneficiará? 

    Modelo AlphaFold 3 de Google Deepmind