Taco Cohen (Países Bajos), 30
Qualcomm Research
Su red neuronal multiplica por 10 la eficiencia de los datos para convertir al aprendizaje profundo en un experto en imágenes médicas
Ante un problema de salud, no todo el mundo tiene acceso al mejor especialista. Y quienes sí lo tienen, pueden sufrir las consecuencias de un error humano. Un pequeño detalle que pasado por alto puede impedir que se detecte correctamente una enfermedad. Para reducir este problema, la industria sanitaria ha puesto sus ojos en la inteligencia artificial (IA), concretamente, en el aprendizaje automático (o machine learning).
Esta técnica de IA es capaz de aprender a interpretar imágenes médicas como escáneres y radiografías con una precisión que puede llegar a superar a la humana (ver Una IA derrota a los mejores médicos en el diagnóstico de la retinopatía diabética). Pero para lograrlo, es necesario disponer de una gran base de datos se debidamente clasificados por especialistas para entrenar a la máquina. Este obstáculo se agudiza cuando se trata de información sensible, como son los historiales de pacientes. Para resolver el problema del acceso a la información, Taco Cohen propone aumentar la eficiencia de los datos disponibles. Es decir, hacer más, con menos. Gracias a su enfoque, Cohen se ha convertido en uno de los ganadores de Innovadores menores de 35 Europa 2018 de MIT Technology Review en español.
Este neerlandés, que recibió la distinción cum laude en Ciencias de la Computación y después completó un máster en Inteligencia Artificial, se alió con su director de tesis, Max Welling, para crear Scyfer, una spin-off de la Universidad de Ámsterdam (Países Bajos). La empresa estaba especializada en investigar y mejorar la eficiencia de los datos en inteligencia artificial para solucionar gran parte de los problemas prácticos que el uso de esta tecnología conlleva. Interesados en este potencial, acabó siendo adquirida por Qualcomm, que decidió mantener a Cohen como ingeniero investigador. En sus primeros experimentos, Qualcomm ha multiplicado por diez el rendimiento de los datos empleados.
La arquitectura de red neuronal profunda actual que más éxito tiene es la llamada CNN. Esta red es capaz de detectar un objeto visual, independientemente de la posición en la que aparezca y sin necesidad de haber sido entrenada con ejemplos de ese objeto en cada ubicación posible. O como lo explica Cohen: "La CNN explota la simetría de traducción inherente en la mayoría de tareas de visión artificial".
Pero las imágenes médicas obedecen a muchas más simetrías: las células dañinas pueden aparecer en todas las orientaciones, y los nódulos pulmonares pueden tener varios tamaños. Para solucionar este reto, Cohen inventó una red a la que ha bautizado como Grupo Equivariante CNN (G-CNN). Su innovación consiste en generalizar la capacidad de una red estándar CNN para reconocer objetos visuales. Es decir, consigue identificar ese objeto en muchas más situaciones y con características diferentes, habiendo recibido el mismo entrenamiento que una red CNN convencional.
En la práctica, la esperanza de Taco Cohen es que su trabajo impulse la implementación mundial del análisis de imágenes médicas con aprendizaje profundo para mejorar la asistencia médica de millones de personas. Su idea es que su sistema, su "doctor digital", lea los escáneres de pacientes de todo el mundo para ofrecer diagnósticos a prácticamente coste cero.
Su creador detalla: "En lugar de tener que enseñar a diferentes médicos a reconocer lesiones, lo que es caro, costoso en tiempo y poco escalable, solo tendríamos que enseñar a un programa a reconocer muy bien cada una de estas heridas para convertirlo en un gran experto mundial en cáncer de piel, de malaria, de nódulos pulmonares, etcétera".
El director del Instituto de Investigación en Inteligencia Artificial del CISC (España) y miembro del jurado de Innovadores menores de 35 Europa 2018, Ramón López de Mántaras, afirma que "se trata de un proyecto muy fuerte", y considera a Cohen como una persona "brillante". El experto considera que "si los resultados se pueden generalizar a otros conjuntos de datos, lograrán un gran avance para los algoritmos de aprendizaje profundo".