Skip to main content

Inteligencia artificial

En el último año, el progreso de la IA ha sido extraordinario. Los innovadores lo están utilizando para redefinir industrias enteras y tratar de hacerlas seguras.

Connor Coley

MIT

Connor Coley, de 29 años, ha desarrollado un software de código abierto que utiliza la inteligencia artificial para ayudar a descubrir y sintetizar nuevas moléculas. El conjunto de herramientas, llamado ASKCOS, es utilizado en producción por más de una docena de empresas farmacéuticas y decenas de miles de químicos para crear nuevos medicamentos, nuevos materiales y procesos industriales más eficientes.

Uno de los mayores cuellos de botella en el desarrollo de nuevas moléculas ha sido durante mucho tiempo la identificación de candidatos interesantes para probar. Este proceso ha sido más o menos el mismo durante décadas: realizar una pequeña modificación a una molécula conocida y luego probar la nueva creación para sus propiedades biológicas, químicas o físicas.

El enfoque de Coley implica una forma de IA generativa para la química. Un químico indica qué propiedades son de interés y los algoritmos guiados por inteligencia artificial sugieren nuevas moléculas con el mayor potencial para tener esas propiedades. El sistema analiza las moléculas conocidas y sus propiedades actuales, para luego predecir cómo pequeños cambios estructurales pueden dar lugar a nuevos comportamientos.

Como resultado, los químicos deberían pasar menos tiempo probando candidatos que nunca resultan ser válidos. «Los métodos en los que trabajamos han reducido de dos, tres o tal vez diez veces el número de intentos necesarios para encontrar algo que funcione bien», explica Coley, que ahora es profesor de ingeniería química e informática en el MIT.

Una vez identificadas las moléculas candidatas, el software de Coley propone la mejor manera de producirlas. Aunque los químicos «imaginan o sueñan con una molécula», dice, entender cómo sintetizar algo no es trivial: «Todavía tenemos que producirla».

Para ello, el sistema proporciona a los químicos una «receta» de pasos a seguir que probablemente den los mejores resultados. El trabajo futuro de Coley implica entender cómo agregar a la mezcla los robots de laboratorio, de modo que sistemas aún más automatizados sean capaces de probar y perfeccionar las recetas propuestas siguiéndolas realmente.

por Russ Juskalian

12 de septiembre de 2023

Catherine De Wolf

ETH Zurich

Connor Coley, de 29 años, ha desarrollado un software de código abierto que utiliza la inteligencia artificial para ayudar a descubrir y sintetizar nuevas moléculas. El conjunto de herramientas, llamado ASKCOS, es utilizado en producción por más de una docena de empresas farmacéuticas y decenas de miles de químicos para crear nuevos medicamentos, nuevos materiales y procesos industriales más eficientes.

Uno de los mayores cuellos de botella en el desarrollo de nuevas moléculas ha sido durante mucho tiempo la identificación de candidatos interesantes para probar. Este proceso ha sido más o menos el mismo durante décadas: realizar una pequeña modificación a una molécula conocida y luego probar la nueva creación para sus propiedades biológicas, químicas o físicas.

El enfoque de Coley implica una forma de IA generativa para la química. Un químico indica qué propiedades son de interés y los algoritmos guiados por inteligencia artificial sugieren nuevas moléculas con el mayor potencial para tener esas propiedades. El sistema analiza las moléculas conocidas y sus propiedades actuales, para luego predecir cómo pequeños cambios estructurales pueden dar lugar a nuevos comportamientos.

Como resultado, los químicos deberían pasar menos tiempo probando candidatos que nunca resultan ser válidos. «Los métodos en los que trabajamos han reducido de dos, tres o tal vez diez veces el número de intentos necesarios para encontrar algo que funcione bien», explica Coley, que ahora es profesor de ingeniería química e informática en el MIT.

Una vez identificadas las moléculas candidatas, el software de Coley propone la mejor manera de producirlas. Aunque los químicos «imaginan o sueñan con una molécula», dice, entender cómo sintetizar algo no es trivial: «Todavía tenemos que producirla».

Para ello, el sistema proporciona a los químicos una «receta» de pasos a seguir que probablemente den los mejores resultados. El trabajo futuro de Coley implica entender cómo agregar a la mezcla los robots de laboratorio, de modo que sistemas aún más automatizados sean capaces de probar y perfeccionar las recetas propuestas siguiéndolas realmente.

por Russ Juskalian

12 de septiembre de 2023

Alhussein Fawzi

Google DeepMind

Alhussein Fawzi, de 34 años, es un pionero en el uso de la inteligencia artificial para acelerar los cálculos fundamentales. Pequeñas mejoras en los algoritmos más utilizados pueden hacer una enorme diferencia, reduciendo los costos y ahorrando energía en todos los dispositivos que los ejecutan.

Pero encontrar atajos en un código que ha sido estudiado por científicos humanos durante décadas es difícil. La clave de la intuición de Fawzi fue tratar el problema de encontrar nuevos algoritmos como una especie de juego y usar la inteligencia artificial de DeepMind, AlphaZero, para dominarlo.

Para hacer movimientos en un juego como el ajedrez, AlphaZero busca entre un número astronómico de posibilidades antes de elegir la jugada que tiene más probabilidades de llevar a la victoria. Organizar los pasos secuenciales de un algoritmo correcto es un poco como elegir las jugadas en una partida ganadora. Al igual que en el ajedrez, se trata de revisar innumerables posibilidades para alcanzar un objetivo.

Usando una versión adaptada de AlphaZero, Fawzi y sus colegas encontraron una manera de acelerar la multiplicación de matrices, un elemento fundamental de las matemáticas que subyacen en muchos programas informáticos comunes en sectores que van desde la gráfica hasta la física y el aprendizaje automático. Descubrieron algoritmos más rápidos que los mejores algoritmos anteriores desarrollados por humanos, batiendo un récord que se mantenía desde hace 50 años.

Google DeepMind utilizó el enfoque de Fawzi también para descubrir atajos previamente desconocidos en los algoritmos de ordenamiento, otro cálculo fundamental que se ejecuta miles de millones de veces al día.

«Es sorprendente si se piensa que muchos de los algoritmos fundamentales que usamos hoy fueron inventados antes de la era de las computadoras modernas, la mayoría en papel», dice Fawzi. «Es útil usar el aprendizaje automático para tratar de mejorarlos».

por Will Douglas Heaven

12 de septiembre de 2023

Sharon Li

Universidad de Wisconsin-Madison

Cuando lanzamos sistemas de inteligencia artificial del laboratorio al mundo real, debemos estar preparados para evitar que estos sistemas se rompan de maneras sorprendentes y catastróficas. Sharon Li, profesora asistente en la Universidad de Wisconsin, Madison, es una pionera en una función de seguridad de la IA llamada detección de fuera de distribución (OOD). Según Li, esta función ayuda a los modelos de inteligencia artificial a determinar cuándo deben abstenerse de actuar si se enfrentan a algo para lo que no han sido entrenados.

Li desarrolló uno de los primeros algoritmos para la detección de fuera de distribución en redes neuronales profundas. Desde entonces, Google ha creado un equipo dedicado para integrar la detección de OOD en sus productos. El año pasado, el análisis teórico de Li sobre la detección de OOD fue seleccionado entre más de 10,000 trabajos presentados como un documento excepcional en NeurIPS, una de las conferencias más prestigiosas sobre IA.

Actualmente, estamos en una carrera por el oro de la IA y las empresas tecnológicas compiten para lanzar sus modelos de IA. Pero la mayoría de los modelos actuales están entrenados para identificar cosas específicas y a menudo fallan cuando se encuentran con escenarios desconocidos típicos del mundo real, desordenado e impredecible. Su incapacidad para comprender de manera confiable lo que «saben» y lo que no «saben» es el punto débil de muchos desastres de la IA.

El enfoque de Li abraza la incertidumbre utilizando el aprendizaje automático para detectar los datos desconocidos en el mundo y diseñar modelos de IA que se adapten sobre la marcha. La detección de datos no conocidos podría ayudar a prevenir accidentes cuando los autos autónomos se encuentran con objetos desconocidos en la carretera, o hacer que los sistemas de IA médica sean más útiles en la búsqueda de una nueva enfermedad. «En todas estas situaciones, lo que realmente necesitamos es un modelo de aprendizaje automático consciente de la seguridad, capaz de identificar lo que no conoce», dice Li.

por Melissa Heikkilä

12 de septiembre de 2023

Sasha Luccioni

Abrazando la cara

En la carrera por construir modelos de IA cada vez más grandes y mejores, las empresas tecnológicas ocultan un sucio secreto: la huella de carbono de la IA. Los sistemas de IA requieren enormes cantidades de energía y agua para ser construidos y para funcionar, y una vez instalados, pueden emitir varias toneladas de CO2 al día.

Sasha Luccioni, de 33 años, investigadora en la startup de IA Hugging Face, ha desarrollado una mejor manera para que las empresas tecnológicas estimen y midan la huella de carbono de los modelos de IA. El método de Luccioni ayuda a las empresas a calcular las emisiones de dióxido de carbono de sus sistemas de IA, teniendo en cuenta el impacto climático durante todo su ciclo de vida, incluidos la energía, los materiales y la potencia de cálculo necesarios para entrenarlos. Por ejemplo, su equipo descubrió que el entrenamiento, la construcción y el funcionamiento del modelo lingüístico de IA BLOOM de Hugging Face generaron alrededor de 50 toneladas de emisiones de dióxido de carbono.

Su trabajo «representa el análisis más profundo, honesto y consciente de la huella de carbono de un modelo ML de gran escala», dijo en noviembre a MIT Technology Review Emma Strubell, profesora asistente en la escuela de informática de la Universidad Carnegie Mellon, autora de un artículo fundamental de 2019 sobre el impacto de la IA en el clima.

Luccioni sostiene que su enfoque ayuda a las personas a tomar decisiones más informadas sobre la IA. Afirma que nadie más ha realizado una verificación tan exhaustiva de las emisiones de un modelo lingüístico. Code Carbon, la herramienta en la que ayudó a crear, ha sido descargada más de 300,000 veces.

«Comprender el impacto ambiental de estos modelos es realmente muy importante para tratar de anticipar las cosas y hacerlas más eficientes», dice la autora.

por Melissa Heikkilä

12 de septiembre de 2023

Pranav Rajpurkar

Escuela de Medicina de Harvard

Pranav Rajpurkar, de 28 años, ha desarrollado una forma de enseñar a la inteligencia artificial a interpretar con precisión las imágenes médicas sin la ayuda del ser humano.

Sus sistemas ya son capaces de ofrecer un rendimiento al nivel de los expertos humanos, señalando patologías que de otro modo podrían pasar desapercibidas y previniendo procedimientos médicos innecesarios debido a falsos positivos. El modelo más reciente de Rajpurkar, llamado CheXzero, podría mejorar aún más su rendimiento y ampliar los tipos de imágenes que puede manejar.

Cuando Rajpurkar introdujo un primer modelo que permitía a los ordenadores leer las radiografías de tórax en 2018, hubo un problema: la falta de datos. En ese momento, él y otros operadores del sector dependían de los radiólogos para etiquetar manualmente las imágenes que los sistemas de IA utilizaban para el aprendizaje. Dado que una persona tarda unos pocos minutos en etiquetar una sola imagen, mientras que los sistemas de IA necesitan cientos de miles de imágenes para comprender lo que están observando, el campo pronto se estancó.

El nuevo enfoque de Rajpurkar evita por completo a los etiquetadores humanos, comparando una serie de imágenes médicas, tomadas de cualquier base de datos privada o pública, con los informes radiológicos que casi siempre las acompañan. El sistema es capaz de asociar automáticamente las imágenes con los problemas que los informes identifican por escrito. Esto significa que CheXzero puede utilizar enormes bases de datos para aprender a identificar problemas potenciales sin que el ser humano tenga que preparar los datos previamente, una técnica conocida como «auto-supervisión».

Rajpurkar, quien es profesor asistente de informática biomédica en la Harvard Medical School, afirma que su sueño es construir un sistema capaz de absorber las historias clínicas de un paciente e identificar los problemas que los médicos podrían haber pasado por alto.

por Russ Juskalian

12 de septiembre de 2023

Irene Solaiman

Abrazando la cara

Cuando se lanza un nuevo modelo de inteligencia artificial generativa, como un chatbot o un generador de imágenes, o el modelo subyacente, recibe mucha más atención que los detalles sobre las modalidades y los destinatarios del modelo, como si es de código abierto o licenciado para uso comercial. Pero estas decisiones tienen consecuencias profundas.

Una mayor apertura, por ejemplo, ofrece más oportunidades para verificar y evaluar los modelos, pero también la posibilidad de que los ciberdelincuentes los aprovechen. Los sistemas más cerrados pueden concentrar el poder pero limitar el potencial de daño.

En 2019, Irene Solaiman, entonces investigadora y responsable de políticas públicas en OpenAI, lideró un nuevo enfoque para el lanzamiento de GPT-2, un predecesor de ChatGPT, evaluando cómo equilibrar algunas salvaguardias para minimizar los daños y, al mismo tiempo, aumentar la apertura. Solaiman recomendó lanzar los nuevos modelos en etapas sucesivas, para tener más tiempo para probarlos y crear protecciones. OpenAI, Microsoft y Meta están utilizando este enfoque para ChatGPT, la nueva búsqueda de Bing y LLaMA, respectivamente.

Solaiman, de 28 años, dejó OpenAI y ahora trabaja en la startup Hugging Face, donde ocupa el cargo de directora global de políticas públicas. Continúa trabajando para construir procesos claros y estandarizados para el lanzamiento de futuros modelos de IA. También sigue trabajando en otros aspectos de la seguridad de la IA, incluido el desarrollo de formas para garantizar que los valores culturales de una comunidad sean considerados antes de que los nuevos sistemas se distribuyan en esa región.

En última instancia, lo que la motiva es el deseo de asegurarse de que la IA generativa funcione bien no solo para sus desarrolladores, sino también para “las personas que no interactúan directamente con los sistemas de IA generativa, pero que probablemente se verán influenciadas por la IA”. En otras palabras, todos.

por Eileen Guo

12 de septiembre de 2023

Richard Zhang

Adobe

Richard Zhang, de 34 años, investigador principal en Adobe, inventó los algoritmos de similitud visual que están en la base de modelos de IA generativa de imágenes como Stable Diffusion y Stylegan.

Zhang comenzó a explorar la IA generativa mientras completaba su doctorado en UC Berkeley, donde creó un algoritmo ampliamente utilizado para colorear fotos en blanco y negro (este trabajo se convirtió en la herramienta Colorize de Adobe Photoshop).

Durante este trabajo, Zhang se dio cuenta de que no existía una “buena métrica objetiva” para entrenar el sistema de inteligencia artificial. “Es realmente difícil escribir un mapa de lo que hace que una imagen se vea bien para una persona”, dice, ya sea en términos de colores realistas o de claridad de la imagen.

La mayoría de los algoritmos utilizan modelos matemáticos para medir la similitud de imágenes desde la perspectiva humana, pero la percepción humana es compleja y no puede ser capturada fácilmente con un problema matemático. Así que Zhang construyó algo mejor: LPIPS, su proyecto más influyente hasta la fecha.

LPIPS es único en su tipo porque incorpora en sus cálculos grandes conjuntos de datos de juicios perceptivos humanos. Esto le permitió superar todos los modelos anteriores, muchos de los cuales llevaban décadas en uso, y convertirse en el nuevo estándar para la similitud perceptiva. Sin LPIPS, la actual IA para la generación de imágenes no sería posible.

Desde que se unió a Adobe en 2018, la investigación de Zhang se ha integrado en herramientas comerciales de software, como landscape mixer y smart portrait. Zhang también ha trabajado en algoritmos que ayudan a las personas a detectar imágenes generadas por IA, que ahora forman parte de las herramientas forenses de Adobe Stock.

por Eileen Guo

12 de septiembre de 2023