Inteligencia Artificial
Programación, sanidad o literatura: ¿cómo usan ChatGPT-4 los expertos en IA?
Además, Baidu, el gigante tecnológico chino, acaba de lanzar su respuesta a ChatGPT
Esta historia apareció originalmente en The Algorithm, nuestro boletín semanal sobre IA. Para recibir historias como esta, suscríbete.
La semana pasada fue intensa. Varias empresas líderes en IA lanzaron productos importantes. Google aseguró que iba a dar acceso a los desarrolladores a sus modelos de lenguaje de IA, y la empresa Anthropic presentó a su asistente Claude. Sin embargo, hubo un anuncio que eclipsó a todos. El nuevo modelo de lenguaje multimodal de OpenAI: GPT-4. Mi colega William Douglas Heaven pudo verlo en exclusiva, puedes leer sus impresiones aquí.
El éxito viral de OpenAI, ChatGPT, es de libre acceso para el público en general, mientras GPT-4 solo está disponible para los desarrolladores. Todavía es pronto para que esta tecnología llegue a nuevos productos y servicios. Aun así, el público ya está probando sus capacidades libremente. A continuación, mis ejemplos preferidos sobre cómo lo están haciendo.
Gancho
En un ejemplo que se hizo viral en Twitter, Jackson Greathouse Fall, diseñador de marcas, pidió a GPT-4 que ganara el máximo dinero posible con un presupuesto inicial de 100 dólares (unos 91 euros). Greathouse Fall dijo que actuó como "enlace humano", y compró todo lo que el programa informático le aconsejó.
GPT-4 sugirió que creara una web de marketing de afiliación para ganar dinero promocionando enlaces a otros productos (en este caso, ecológicos). A continuación, Fall pidió a GPT-4 que creara un logotipo utilizando la IA de generación de imágenes DALL-E 2, también de OpenAI. Además, Fall indicó a GPT-4 que generara contenidos, y destinara dinero a la publicidad en redes sociales.
El truco atrajo mucha atención en redes sociales, la gente quería invertir en su negocio de marketing inspirado en GPT-4, y Fall terminó con 1.378,84 dólares (unos 1.263,07 euros) en efectivo. Era un truco publicitario, pero es un buen ejemplo de cómo se puede utilizar la IA para ayudar a las personas a tener ideas.
Productividad
Las grandes empresas tecnológicas quieren que utilices la IA en el trabajo. Esta es la forma en que la mayoría de personas experimentarán y probarán la nueva tecnología. Microsoft quiere que se utilice GPT-4 en su paquete de Office para resumir documentos y ayudar con las presentaciones de PowerPoint, tal y como predijimos en enero (parece que fuera hace eones).
No es casualidad que Google anunciara que incorporará una IA similar en sus productos ofimáticos, incluidos Google Docs y Gmail. Esto ayudará a los usuarios a redactar correos, corregir textos y generar imágenes para sus presentaciones.
Sanidad
Además, hablé con Nikhil Buduma y Mike Ng, cofundadores de Ambience Health, una empresa financiada por OpenAI. La start-up utiliza GPT-4 para generar documentación médica, basada en conversaciones entre médicos y pacientes. Aseguran que aliviará la carga de trabajo de los médicos al eliminar partes tediosas del trabajo, como la introducción de datos.
Según Buduma, GPT-4 sigue mejor las instrucciones que sus predecesores. Pero aún no está claro cómo le irá en un campo como la sanidad, donde la precisión es muy importante. OpenAI afirma que ha mejorado algunos de los defectos que suelen presentar los modelos lingüísticos de IA, pero GPT-4 aún no está libre de ellos. Inventa cosas, y presenta falsedades como si fueran hechos. Es decir, sigue estando sesgado. Por ello, según Mike Ng, la única forma de utilizar estos modelos con seguridad es asegurarse de que expertos humanos los dirijan, y corrijan sus errores.
Escribir código
Arvind Narayanan, profesor de informática de la Universidad de Princeton (EE UU), dice que tardó menos de diez minutos en conseguir que GPT-4 generara el código que convierte las URLs en citas.
Narayanan asegura que ha estado probando diferentes herramientas de IA para generar texto, imágenes y código, y que esta última le parece la aplicación más útil. "El beneficio de la generación de código LLM [gran modelo de lenguaje, “large language model” en inglés] es tanto ahorro de tiempo como psicológico", tuiteó el profesor.
En una demostración, Greg Brockman, cofundador de OpenAI, utilizó GPT-4 para crear una web a partir de una simple imagen de un diseño que dibujó en una servilleta. Como señala Narayanan, ahí es donde reside el poder de estas herramientas de IA: automatizar las tareas mundanas y poco arriesgadas, pero que consumen mucho tiempo.
Escribir libros
Reid Hoffman, cofundador y presidente ejecutivo de LinkedIn y uno de los primeros inversores en OpenAI, asegura que utilizó GPT-4 para escribir un libro titulado Impromptu: Amplifying Our Humanity through AI [Impromptu: amplificando nuestra humanidad a través de la IA]. Hoffman opina que es el primer libro coescrito por GPT-4; su predecesor, ChatGPT, se ha utilizado para crear toneladas de libros.
El verano pasado, Hoffman tuvo acceso al sistema y, desde entonces, ha estado escribiendo sus reflexiones sobre las distintas formas que este modelo de IA podría utilizarse en la educación, las artes, el sistema judicial, el periodismo y otros campos. En el libro, que incluye extractos copiados de sus interacciones con la herramienta, esboza su visión del futuro de la IA, utiliza GPT-4 como asistente de redacción para obtener nuevas ideas y analiza sus respuestas.
Unas breves palabras finales... GPT-4 es el juguete del momento, nuevo y brillante, para la comunidad de IA. Es innegable que se trata de una potente tecnología de asistencia que puede ayudarnos a concebir ideas, condensar textos, explicar conceptos y automatizar tareas mundanas. Es un avance bienvenido, sobre todo, para los trabajadores intelectuales de cuello blanco.
Sin embargo, cabe destacar que la propia OpenAI pide precaución a la hora de utilizar el modelo, y advierte de varios riesgos de seguridad, como vulnerar la privacidad, engañar a la gente haciendo creer que es humano y generar contenido dañino. También tiene el potencial de ser utilizado para otros comportamientos peligrosos, que aún no hemos encontrado. Así que entusiasmémonos, por supuesto, pero que no nos ciegue el bombo publicitario. Por el momento, nada impide que la gente utilice estos nuevos modelos para hacer cosas perjudiciales, y nada les obliga a rendir cuentas si lo hacen.
Deep Learning, aún más profundo
Baidu, el gigante tecnológico chino acaba de lanzar su respuesta a ChatGPT
Así que... muchos chatbots. Baidu, el gigante tecnológico chino, ha sido el último en entrar en el juego de los chatbots de inteligencia artificial. La semana pasada, Baidu presentó Ernie Bot, un nuevo modelo lingüístico de gran tamaño, que puede resolver preguntas matemáticas, redactar textos de marketing, responder a preguntas sobre literatura china y generar respuestas multimedia.
Una alternativa china: Ernie Bot (Enhanced Representation from kNowledge IntEgration en inglés, Representación mejorada de la integración del conocimiento en español; su nombre chino es 文心一言, o Wenxin Yiyan) funciona especialmente bien en tareas específicas de la cultura china. Por ejemplo, explicar un hecho histórico o escribir un poema tradicional. Lea más, gracias a mi colega Zeyi Yang.
Aprendizaje aún más profundo
Los modelos de lingüísticos pueden autocorregirse si les pide que lo hagan
Los grandes modelos lingüísticos son famosos por arrojar sesgos tóxicos, debido a la gran cantidad de contenidos horribles producidos por humanos que los entrenan. Pero si los modelos son lo suficientemente grandes, es posible que sean capaces de autocorregir algunos sesgos. Solo tenemos que preguntar, sorprendentemente.
Este es el fascinante hallazgo de los investigadores de Anthropic, el laboratorio de IA que ha probado varios modelos lingüísticos de distintos tamaños y con distintos niveles de entrenamiento. El trabajo plantea la pregunta obvia de si esta autocorrección podría, y debería, incorporarse a los modelos lingüísticos desde el inicio. Para más información, lea la historia completa de Niall Firth.
Bits y bytes
Google pone sus herramientas de IA generativa a disposición de los desarrolladores
Este es otro anuncio de Google que quedó eclipsado por el tren de la OpenAI. La empresa ha puesto parte de su potente tecnología de IA a disposición de los desarrolladores a través de una API, que permite crear productos a partir de sus grandes modelos de lenguaje PaLM. (Google)
La IA de Midjourney que convierte texto en imagen domina las manos, por fin
Este año, los sistemas de IA generadores de imágenes van a ser muy buenos. Un ejemplo es la
última iteración de IA texto aimagen de Midjourney, que ya puede crear imágenes de humanos con cinco dedos. Hasta ahora, los dedos deformados delataban que la imagen había sido generada por un programa informático. El resultado es que cada vez será más difícil saber qué es real, y qué no. (Ars Technica)
Una nueva herramienta permitiría a los artistas proteger sus imágenes para que no se utilicen en IA
Varios investigadores de la Universidad de Chicago (EE UU) han lanzado una herramienta que permite a los artistas añadir a sus obras una especie de capa digital protectora que impide su uso para entrenar modelos de IA generadores de imágenes. (Universidad de Chicago)
Runway lanza una IA de texto a video aún más potente
Los avances en IA generativa siguen para Runway, la start-up de edición de vídeo que co-creó Stable Diffusion, el modelo de texto a imagen. Runway ha lanzado una importante actualización de su software de creación de video generativo, solo un mes después del lanzamiento de la versión anterior. Gen-2, el nuevo modelo, mejora a Gen-1, sobre el que Will Douglas Heaven escribió aquí. Ya que aumenta la calidad de los vídeos generados y añade la posibilidad de generar vídeos desde cero con solo una indicación de texto.