.

Otros

Por qué es tan difícil utilizar la IA para diagnosticar el cáncer

0

El último esfuerzo de la Clínica Mayo contiene algunas pistas.

  • por James O'Donnell | traducido por
  • 21 Enero, 2025

Esta historia apareció originalmente en The Algorithm, nuestro boletín semanal sobre inteligencia artificial. Para recibir historias como esta en tu bandeja de entrada antes que nadie, regístrate aquí .

Para buscar y diagnosticar el cáncer en el interior del cuerpo es necesario detectar patrones. Los radiólogos utilizan rayos X e imágenes por resonancia magnética para iluminar los tumores, y los patólogos examinan el tejido de los riñones, el hígado y otras zonas con microscopios y buscan patrones que muestren la gravedad del cáncer, si determinados tratamientos podrían funcionar y hacia dónde se puede propagar la malignidad.

En teoría, la inteligencia artificial debería ser de gran ayuda. “Nuestro trabajo es el reconocimiento de patrones”, dice Andrew Norgan, patólogo y director médico de la plataforma de patología digital de Mayo Clinic. “Observamos la placa y recopilamos información que ha demostrado ser importante”.

El análisis visual es algo en lo que la IA se ha vuelto bastante buena desde que los primeros modelos de reconocimiento de imágenes comenzaron a despegar hace casi 15 años. Aunque ningún modelo será perfecto, es posible imaginar un algoritmo poderoso que algún día detecte algo que un patólogo humano no haya detectado, o al menos que acelere el proceso de obtención de un diagnóstico. Estamos empezando a ver muchos nuevos esfuerzos para construir un modelo de este tipo (al menos siete intentos solo en el último año), pero todos siguen siendo experimentales. ¿Qué hace falta para que sean lo suficientemente buenos como para poder usarse en el mundo real?

A principios de este mes, se publicaron en arXiv detalles sobre el último esfuerzo para crear un modelo de este tipo, dirigido por la empresa de inteligencia artificial para la salud Aignostics junto con la Clínica Mayo. El artículo no ha sido revisado por pares, pero revela mucho sobre los desafíos que supone llevar una herramienta de este tipo a entornos clínicos reales.

El modelo, llamado Atlas, se entrenó con 1,2 millones de muestras de tejido de 490.000 casos. Su precisión se probó frente a otros seis modelos de patología de IA líderes. Estos modelos compiten en pruebas compartidas, como la clasificación de imágenes de cáncer de mama o la clasificación de tumores, donde las predicciones del modelo se comparan con las respuestas correctas dadas por patólogos humanos. Atlas superó a los modelos rivales en seis de nueve pruebas. Obtuvo su puntuación más alta en la categorización de tejido colorrectal canceroso, llegando a la misma conclusión que los patólogos humanos el 97,1% de las veces. Sin embargo, para otra tarea (la clasificación de tumores a partir de biopsias de cáncer de próstata), Atlas superó las puntuaciones altas de los otros modelos con una puntuación de solo el 70,5%. Su promedio en nueve puntos de referencia mostró que obtuvo las mismas respuestas que los expertos humanos el 84,6% de las veces.

Pensemos en lo que esto significa. La mejor manera de saber qué les sucede a las células cancerosas en los tejidos es que un patólogo examine una muestra, por lo que ese es el desempeño con el que se miden los modelos de IA. Los mejores modelos se acercan a los humanos en determinadas tareas de detección, pero se quedan atrás en muchas otras. Entonces, ¿qué tan bueno debe ser un modelo para ser clínicamente útil?

“El noventa por ciento probablemente no sea suficiente. Es necesario mejorar aún más”, afirma Carlo Bifulco, director médico de Providence Genomics y cocreador de GigaPath, uno de los otros modelos de patología de IA examinados en el estudio de Mayo Clinic. Pero, dice Bifulco, los modelos de IA que no obtienen una puntuación perfecta pueden ser útiles a corto plazo y podrían ayudar a los patólogos a acelerar su trabajo y realizar diagnósticos más rápidamente.

¿Qué obstáculos impiden un mejor rendimiento? El problema número uno son los datos de entrenamiento.

“Menos del 10% de las prácticas patológicas en los EE. UU. están digitalizadas”, dice Norgan. Eso significa que las muestras de tejido se colocan en portaobjetos y se analizan bajo microscopios, y luego se almacenan en registros masivos sin documentarse digitalmente. Aunque las prácticas europeas tienden a estar más digitalizadas y hay esfuerzos en marcha para crear conjuntos de datos compartidos de muestras de tejido para que los modelos de IA se entrenen en ellos, todavía no hay mucho con lo que trabajar.

Sin conjuntos de datos diversos, los modelos de IA tienen dificultades para identificar la amplia gama de anomalías que los patólogos humanos han aprendido a interpretar. Eso incluye las enfermedades raras, dice Maximilian Alber, cofundador y director de tecnología de Aignostics. Al buscar muestras de tejido de enfermedades particularmente raras en las bases de datos disponibles públicamente, "encontrarás 20 muestras en 10 años", dice.

En 2022, la Clínica Mayo previó que esta falta de datos de entrenamiento sería un problema. Decidió digitalizar todas sus prácticas patológicas de ahora en adelante, junto con 12 millones de diapositivas de sus archivos que databan de hace décadas (los pacientes habían dado su consentimiento para que se usaran para la investigación). Contrató a una empresa para construir un robot que comenzó a tomar fotografías de alta resolución de los tejidos, trabajando con hasta un millón de muestras por mes. A partir de estos esfuerzos, el equipo pudo recolectar los 1,2 millones de muestras de alta calidad que se utilizaron para entrenar el modelo de Mayo.

Esto nos lleva al segundo problema del uso de la IA para detectar el cáncer. Las muestras de tejido de las biopsias son diminutas (a menudo, de apenas un par de milímetros de diámetro), pero se amplían hasta tal punto que las imágenes digitales de ellas contienen más de 14 mil millones de píxeles. Eso las hace aproximadamente 287.000 veces más grandes que las imágenes utilizadas para entrenar los mejores modelos de reconocimiento de imágenes de IA hasta la fecha.

“Eso obviamente significa muchos costos de almacenamiento y demás”, dice Hoifung Poon, un investigador de inteligencia artificial en Microsoft que trabajó con Bifulco para crear GigaPath, que apareció en Nature. El año pasado, sin embargo, también obliga a tomar decisiones importantes sobre qué partes de la imagen se utilizan para entrenar el modelo de IA y qué células se pueden pasar por alto en el proceso. Para crear Atlas, la Clínica Mayo utilizó lo que se conoce como método de mosaicos, que consiste básicamente en crear muchas instantáneas de la misma muestra para alimentar el modelo de IA. Descubrir cómo seleccionar estos mosaicos es tanto un arte como una ciencia, y aún no está claro qué formas de hacerlo conducen a los mejores resultados.

En tercer lugar, está la cuestión de qué parámetros son los más importantes para que un modelo de IA de detección de cáncer funcione bien. Los investigadores de Atlas probaron su modelo en el difícil ámbito de los parámetros de referencia relacionados con las moléculas, lo que implica tratar de encontrar pistas a partir de imágenes de tejido de muestra para adivinar qué está sucediendo a nivel molecular. He aquí un ejemplo: los genes de reparación de desajustes de nuestro cuerpo son de especial preocupación en el caso del cáncer, porque detectan errores que se producen cuando se replica nuestro ADN. Si estos errores no se detectan, pueden impulsar el desarrollo y la progresión del cáncer.

“Algunos patólogos pueden decir que tienen una especie de presentimiento cuando piensan que algo tiene deficiencias en la reparación de desajustes basándose en su apariencia”, dice Norgan. Pero los patólogos no actúan solo en base a esa intuición. Pueden hacer pruebas moleculares para obtener una respuesta más definitiva. ¿Qué pasaría si, en cambio, pudiéramos usar la IA para predecir lo que está sucediendo a nivel molecular? Es un experimento: ¿podría el modelo de IA detectar cambios moleculares subyacentes que los humanos no pueden ver?

En general, no, al menos no todavía. El promedio de Atlas para las pruebas moleculares fue del 44,9 %. Es el mejor desempeño de la IA hasta el momento, pero demuestra que este tipo de pruebas aún tienen un largo camino por recorrer.

Bifulco afirma que Atlas representa un progreso gradual pero real. “Lamentablemente, tengo la sensación de que todos están estancados en un nivel similar”, afirma. “Necesitamos algo diferente en términos de modelos para lograr un progreso realmente espectacular, y necesitamos conjuntos de datos más grandes”.


Ahora lee el resto de El Algoritmo

Aprendizaje más profundo

OpenAI ha creado un modelo de IA para la ciencia de la longevidad

La inteligencia artificial lleva mucho tiempo incursionando en la ciencia del plegamiento de proteínas, pero OpenAI afirma haber creado un modelo que puede diseñar proteínas y convertir células normales en células madre. Este objetivo lo han perseguido las empresas que se dedican a la ciencia de la longevidad, porque las células madre pueden producir cualquier otro tejido del cuerpo y, en teoría, podrían ser un punto de partida para rejuvenecer animales, construir órganos humanos o proporcionar suministros de células de reemplazo.

Por qué es importante: El trabajo fue producto de la colaboración de OpenAI con la empresa de longevidad Retro Labs, en la que Sam Altman invirtió 180 millones de dólares. Representa el primer modelo de OpenAI centrado en datos biológicos y su primera afirmación pública de que sus modelos pueden ofrecer resultados científicos. Según se informa, el modelo de IA diseñó proteínas más efectivas y más rápidamente que los científicos de la empresa. Pero los científicos externos no pueden evaluar las afirmaciones hasta que se hayan publicado los estudios. Lea más de Antonio Regalado .

Bits y bytes

Lo que sabemos sobre la prohibición de TikTok

La popular aplicación de videos dejó de funcionar en Estados Unidos el sábado por la noche y luego volvió a funcionar alrededor del mediodía del domingo, incluso cuando entró en vigor una ley que la prohibía. ( The New York Times )

Por qué Meta podría no terminar como X

X perdió mucho dinero en publicidad cuando Elon Musk cambió las políticas de la plataforma. Pero la escala masiva de Facebook e Instagram hace que sea difícil para los anunciantes evitarlas. ( Wall Street Journal )

Qué esperar de Neuralink en 2025

Más voluntarios recibirán el implante cerebral de Elon Musk, pero no esperen un producto pronto. ( MIT Technology Review )

Un antiguo medio de verificación de datos de Meta firmó un nuevo acuerdo para ayudar a entrenar modelos de IA

Meta ha pagado durante años a medios de comunicación como Agence France-Presse para que verifiquen los datos en sus plataformas. Desde que Meta anunció que cerraría esos programas, la empresa líder de inteligencia artificial de Europa, Mistral, ha firmado un acuerdo con AFP para utilizar parte de su contenido en sus modelos de inteligencia artificial. ( Financial Times )

El modelo de razonamiento de IA de OpenAI a veces “piensa” en chino, y nadie sabe realmente por qué

En lo que respecta a su respuesta, el modelo a menudo cambia al chino, tal vez como reflejo del hecho de que muchos etiquetadores de datos tienen su sede en China. ( Tech Crunch )

Otros

  1. Mark Zuckerberg y el poder de los medios de comunicación

    Es cierto que hay fuerzas poderosas que controlan lo que se puede ver en Facebook e Instagram, pero no son los medios los que toman esas decisiones.

  2. Neuralink ante las promesas de Musk: más voluntarios y algunos avances

    Más voluntarios recibirán el implante cerebral de Elon Musk, pero no se espera su comercialización como producto pronto

  3. Robotaxis

    Las 10 Tecnologías Emergentes 2025: los coches sin conductor solicitados mediante 'apps' se extienden a más ciudades