OPEN AI

Inteligencia Artificial

OpenAI está listo para vender DALL-E a su primer millón de clientes

La empresa ha tenido que corregir rápidamente los peores defectos del modelo de creación de imágenes para poder venderlo

por Will Douglas Heaven | traducido por Ana Milutinovic
26 Julio, 2022

OpenAI venderá su programa de creación de imágenes DALL-E 2 a un millón de personas en su lista de espera, según ha podido saber MIT Technology Review.

Alrededor de 100.000 personas han probado DALL-E 2 desde su lanzamiento solo por invitación en abril. Ahora, la empresa con sede en San Francisco (EE UU) ha abierto las puertas a 10 veces más personas, y ha convertido su inteligencia artificial (IA) en un servicio de pago.

"Hemos visto mucho más interés del que habíamos anticipado, bastante mayor del que había para GPT-3", afirma Peter Welinder, vicepresidente de productos y asociaciones de OpenAI.

Los clientes de pago ya podrán usar las imágenes que crean con DALL-E en sus proyectos comerciales, como ilustraciones en libros infantiles, arte conceptual para películas y juegos, y folletos de marketing. Pero el lanzamiento del producto también será la mayor prueba hasta el momento para el enfoque preferido de la empresa para implementar su poderosa IA, que es lanzarla a los clientes por etapas y abordar los problemas a medida que surjan.

Una suscripción beta de DALL-E no es muy cara: por 15 dólares (14,7 euros) se compran 115 créditos, y un crédito permite enviar un mensaje de texto a la IA, que devuelve cuatro imágenes a la vez. En otras palabras, son 15 dólares por 460 imágenes. Además de esto, los usuarios obtienen 50 créditos gratis en su primer mes y 15 créditos gratis un mes después. Aun así, dado que los usuarios suelen generar docenas de imágenes a la vez y conservar solo las mejores, los más avanzados pronto podrían agotar esa cuota.

En el período previo a este lanzamiento, OpenAI ha estado trabajando con los primeros usuarios para solucionar los problemas de la herramienta. El primer grupo ha producido un flujo constante de imágenes sorprendentes y surrealistas: mezclas de animales simpáticos, imágenes que imitan el estilo de los fotógrafos reales con inquietante precisión, tableros de humor para restaurantes y diseños de zapatillas. Eso ha permitido a OpenAI explorar las ventajas y debilidades de su herramienta. "Nos han estado dando un montón de comentarios realmente buenos", señala Joanne Jang, jefa de producto de OpenAI.

OpenAI ya ha tomado medidas para controlar qué tipo de imágenes pueden producir sus usuarios. Por ejemplo, no pueden generar imágenes que muestren personas conocidas. En preparación para este lanzamiento comercial, OpenAI ha abordado otro problema grave señalado por los primeros usuarios. La versión de DALL-E lanzada en abril a menudo producía imágenes que reflejaban un claro sesgo racial y de género, como imágenes de directores ejecutivos y bomberos que eran todos hombres blancos, y maestras y enfermeras que eran todas mujeres blancas.

El 18 de julio, OpenAI anunció una solución. Desde entonces, cuando los usuarios le piden a DALL-E 2 que genere una imagen que incluya un grupo de personas, la IA se basa en un conjunto de datos de muestras que, según OpenAI, son más representativas de la diversidad global. De acuerdo con sus propios estudios, OpenAI asegura que los usuarios ahora informan 12 veces más de que el resultado de DALL-E 2 inclye personas de diversos orígenes.

Se trata de una solución necesaria, pero superficial. OpenAI aborda muchos de los problemas que señalan sus usuarios filtrando lo que la gente puede pedir o censurando lo que produce el modelo subyacente. Pero no soluciona los problemas en el modelo en sí o en los datos con los que se entrena. Este enfoque ha permitido a OpenAI solucionarlo de forma rápida. Pero para algunos, equivale a ponerse una tirita.

"El problema de los sesgos sociales en los algoritmos es enorme", opina Judy Wajcman, profesora de la London School of Economics (Reino Unido), quien también estudia el género en la ciencia de datos y en la inteligencia artificial en el Instituto Turing. "Se invierte mucha energía en arreglos técnicos. Yo estoy a favor de estos esfuerzos, pero no son soluciones a largo plazo para el problema", explica.

OpenAI afirma que el trabajo llevado a cabo para abordar los sesgos raciales y de género con DALL-E 2 les ha dado la confianza suficiente para seguir adelante con el lanzamiento completo. Sin embargo, no será la versión definitiva. El sesgo en la IA es un problema pernicioso e inabordable, y la empresa tendrá que continuar con su trabajo de soluciones a medida que surjan nuevos ejemplos. OpenAI asegura que pausará el lanzamiento cada vez que el producto necesite ajustes.

Se trata de malabarismo, considera Welinder. Los ajustes a veces pueden frenar lo que los usuarios crean de formas inesperadas. Por ejemplo, cuando OpenAI lanzó por primera vez su solución para el sesgo de género, algunos usuarios se quejaron de que tenían demasiadas mujeres como Super Mario. Ese tipo de caso es difícil de predecir, admite Welinder: "Ver lo que la gente intentaba crear a partir de ahí nos permite afinar y calibrar".

Pero monitorear cientos de millones de imágenes producidas por un millón o más de usuarios será una tarea enorme. Welinder no especifica cuántos moderadores humanos requerirá, pero será el personal interno, asegura. La empresa tiene un enfoque híbrido en cuanto la moderación, combinando el juicio humano con la inspección automatizada. Welinder indica que la composición del equipo se puede adaptar según las necesidades agregando más moderadores o ajustando el equilibrio entre la intervención humana y la de la máquina.

En mayo, Google presentó su propia IA de creación de imágenes, denominada Imagen. A diferencia de OpenAI, Google ha dicho muy poco sobre sus planes para la tecnología. "Todavía no tenemos nada nuevo para compartir sobre Imagen", afirma el portavoz de Google, Brian Gabriel.

Cuando se fundó OpenAI en 2015, se presentó como un laboratorio de investigación pura, con la idea sobre la inteligencia artificial general y el compromiso de garantizar que la tecnología beneficiaría a la humanidad, si es que alguna vez se llegaba a realizar. Pero en los últimos años, se ha convertido en una empresa de productos, ofreciendo su poderosa IA a los clientes de pago.

Todo sigue siendo parte de la misma visión, concluye Welinder: "Implementar nuestra tecnología como un producto y a escala es una parte fundamental de nuestra misión. Es importante reafirmar la utilidad y la seguridad en torno a la tecnología desde el principio, al tiempo que se reducen los riesgos".

Inteligencia Artificial

OpenAI está listo para vender DALL-E a su primer millón de clientes

Al habla con la IA: el reto de lograr voces más diversas e inclusivas

Estos robots aprendieron a superar obstáculos reales desde un entorno virtual gracias a la IA

Por qué la IA podría comerle la tostada a la computación cuántica