Este año, con el lanzamiento de su modelo generativo de creación de imágenes DALL-E 2, ha vuelto a marcar la agenda de la IA.
nCuando apareció en abril, DALL-E 2 desencadenó una explosión de creatividad e innovación que aún continúa. Pronto siguieron otros modelos, algunos mejores o de uso gratuito y que pueden adaptarse. Pero DALL-E 2 se ha mantenido igual desde su inicio, el primer momento "Wow" en un año que dejará una huella no solo en la IA, sino también en la sociedad y la cultura en los próximos años. Como reconoce Altman, ese impacto no es del todo positivo.
nHablé con Altman sobre lo que él había aprendido de DALL-E 2 y me dijo: "Creo que hay un conjunto importante de lecciones para nosotros sobre cómo será la próxima década para la IA". (Mi artículo sobre el impacto a largo plazo de la IA generativa puede leerse aquí).
nEstos extractos de nuestra conversación han sido editados para mayor claridad y extensión.
nSam Altman habla, en sus propias palabras, sobre:
n1/ Por qué DALL-E 2 tuvo tanto impacto
nCruzó un umbral donde podría producir imágenes fotorrealistas. Pero incluso con imágenes no fotorrealistas, parece que entiende los conceptos lo suficientemente bien como para combinar cosas de nuevas maneras, lo que crea sensación de inteligencia. Eso no sucedió con DALL-E 1.
nSin embargo, diría que la comunidad tecnológica estaba más sorprendida con GPT-3 en 2020 que con DALL-E. La primera vez que se notó la inteligencia de un sistema fue con GPT-3. Podía hacer lo que hacía un ser humano. Creo que consiguió que quien no creía en AGI [inteligencia artificial general, por sus siglas en inglés], empezara a tomársela en serio. Allí estaba pasando algo que ninguno de nosotros veía venir.
nNo obstante, las imágenes tienen un poder emocional. El resto del mundo estaba mucho más asombrado por DALL-E que por GPT-3.
n2/ Qué lecciones aprendió del éxito de DALL-E 2
nCreo que hay un conjunto importante de lecciones sobre cómo será la próxima década para la IA. La primera es su origen, un equipo de tres personas jugaba con una idea en un rincón del edificio de OpenAI.
nEsta única idea sobre los modelos de difusión, un pequeño avance en los algoritmos, nos llevó de crear algo que no era muy bueno a algo que puede tener un gran impacto en el mundo.
nOtro punto interesante es que esta fue la primera IA que todos usaban, por varias razones. Una de ellas es que crea productos completamente terminados. Si utilizamos Copilot, nuestra IA de generación de código, necesita mucha ayuda de nuestra parte. Pero con DALL-E 2, le dices lo que quieres, y es como hablar con un artista gráfico. Y creo que es la primera vez que vemos esto con una IA.
n3/ Qué significa DALL-E para la sociedad
nCuando nos dimos cuenta de que DALL-E 2 iba a ser muy importante, queríamos que fuera un ejemplo de cómo implementar la nueva tecnología: hacer que el mundo comprenda que las imágenes pueden ser falsificadas, y decir: "Oye, muy pronto habrá que dejar de confiar en las imágenes de inte et".
nTambién queríamos hablar primero con las personas que se verían más afectadas negativamente, y que se acostumbraran a utilizarlo. No es el marco actual pero, como campo de investigación, me gustaría que lleguemos a un mundo donde si ayudamos a entrenar una IA al proporcionar datos, habría que poseer parte de ese modelo.
nAdemás, es importante ser transparente. Esto va a impactar en el mercado laboral de los ilustradores. La cantidad que un ilustrador puede hacer aumentará en un factor de 10 o 100. Resulta muy difícil predecir cómo influirá eso en el mercado laboral: no lo sabemos. Puedo ver tanto que crezca fácilmente como que se reduzca. Por supuesto, habrá nuevos trabajos con estas herramientas, pero también habrá una transición.
nAl mismo tiempo, hay un gran beneficio social, donde todos obtienen este nuevo superpoder. He utilizado DALL-E 2 para muchas cosas. He creado arte que tengo en casa. También hice una remodelación de mi casa y la usé con éxito para algunas ideas arquitectónicas.
nUnos amigos míos se van a casar. Cada detalle de su web tiene imágenes generadas por DALL-E, y todas son significativas para la pareja. Nunca habrían contratado a un ilustrador para hacer eso.
nFinalmente, solo queríamos usar DALL-E 2 para educar al mundo de que lo lograremos; vamos a crear una IA poderosa que entienda el mundo como lo hace un ser humano y haga cosas útiles para ti. Queremos educar a la gente sobre el futuro para que podamos participar en lo que será una conversación social muy complicada.
n