Una inteligencia artificial inspirada en los conos de luz, la descripción matemática de los límites de causa y efecto en el espacio-tiempo, ha mejorado su estimación de lo que está a punto de suceder. El enfoque podría ser muy útil para entender la progresión de enfermedades y para la conducción autónoma
Aunque nadie sabe cómo será el futuro, algunas predicciones son más acertadas que otras. Una pelota de fútbol después de chutarla no retrocederá en el aire y no volverá al pie del quien la chutó. Una hamburguesa con queso a medio comer no volverá a estar entera. Un brazo roto no sanará de la noche a la mañana.
A partir de una descripción fundamental de causa y efecto de la teoría de la relatividad especial de Einstein, los investigadores del Imperial College de Londres (Reino Unido) han encontrado una forma de ayudar a la inteligencia artificial (IA) a hacer mejores estimaciones.
El mundo avanza paso a paso, y cada instante surge de los que le preceden. Podemos hacer buenas conjeturas sobre lo que sucederá próximamente porque tenemos fuertes intuiciones sobre la causa y el efecto, perfeccionadas al observar cómo funciona el mundo desde el momento en el que nacemos y al procesar esas observaciones con nuestros cerebros programados mediante millones de años de evolución.
Para los ordenadores, sin embargo, el razonamiento causal resulta difícil. Los modelos de aprendizaje automático son excelentes para detectar correlaciones, pero tienen dificultades para explicar por qué un acontecimiento debe seguir a otro. Eso es un problema, porque sin un sentido de causa y efecto, las predicciones pueden estar completamente equivocadas. ¿Por qué una pelota de fútbol no debería retroceder en el aire?
Esta es una gran preocupación del diagnóstico impulsado por IA. Las enfermedades se correlacionan a menudo con varios síntomas. Por ejemplo, las personas con diabetes tipo 2 suelen tener sobrepeso y dificultades respiratorias. Pero la dificultad para respirar no está causada por la diabetes, y tratar a un paciente con insulina no ayuda con ese síntoma.
La comunidad de la IA se está dando cuenta de la importancia que puede tener el razonamiento causal para el aprendizaje automático y se esfuerza en encontrar formas de incorporarlo.
Los investigadores han probado varias maneras de ayudar a los ordenadores a predecir lo que podría suceder. Los enfoques existentes entrenan un modelo de aprendizaje automático para detectar patrones en secuencias de acciones. Muestran a la IA algunas imágenes de un tren saliendo de una estación y luego le piden que genere las siguientes imágenes de la secuencia, por ejemplo.
La IA puede predecir bien algunas imágenes de acciones futuras, pero la precisión disminuye drásticamente después de cinco o 10 fotogramas, afirma el investigador del Imperial College de Londres (Reino Unido) Athanasios Vlontzos. Como la IA utiliza las imágenes anteriores para generar las siguientes de la secuencia, los pequeños errores desde el principio (por ejemplo, algunos píxeles equivocados) se transforman en problemas mayores a medida que avanza la secuencia.
Vlontzos y sus colegas querían probar un enfoque diferente. En lugar de que una IA aprenda a predecir una secuencia específica de imágenes futuras a partir de millones de videoclips, le permitieron generar una amplia gama de fotogramas aproximadamente similares a los anteriores y que eligiera los que tenían más probabilidades de aparecer. La IA puede hacer estimaciones sobre el futuro sin tener que aprender nada sobre la progresión del tiempo, explica Vlontzos.
Para conseguirlo, el equipo desarrolló un algoritmo inspirado en los conos de luz, la descripción matemática de los límites de causa y efecto en el espacio-tiempo, propuesta por primera vez en la teoría de la relatividad especial de Einstein y luego perfeccionada su antiguo profesor Hermann Minkowski. En física, los conos de luz surgen porque la velocidad de la luz es constante. Muestran los límites de expansión de un rayo de luz, y de todo lo demás, cuando surge de un acontecimiento inicial, como una explosión.
Podemos marcar un evento con un punto en una hoja de papel y dibujar un círculo con ese evento en el centro. La distancia entre el punto y el borde del círculo es la distancia que la luz ha viajado en un período de tiempo, por ejemplo, un segundo. Dado que nada, ni siquiera la información, puede viajar más rápido que la luz, el borde de este círculo es un límite estricto sobre la influencia causal del evento original. En principio, cualquier cosa dentro del círculo podría haber sido afectada por el evento; pero algo de fuera del círculo, no.
Al cabo de dos segundos, la luz ha viajado el doble de la distancia y el tamaño del círculo se ha duplicado: hay muchos más futuros posibles para ese evento. Imagínese estos círculos cada vez más grandes que se elevan segundo a segundo de la hoja de papel, y el resultado sería un cono invertido con el evento original en la punta. Eso es un cono de luz. Una imagen espejo del cono también puede extenderse hacia atrás, detrás de la hoja de papel; contendrá todos los pasados posibles que podrían haber llevado al evento original.
Vlontzos y sus colegas han utilizado este concepto para restringir las imágenes futuras que la IA podría elegir. Probaron su idea en dos conjuntos de datos: Moving MNIST, que consiste en videoclips cortos de dígitos escritos a mano que se mueven en una pantalla, y la serie de acciones humanas KTH, que contiene vídeos de personas caminando o moviendo los brazos. En ambos casos, entrenaron a la IA para generar imágenes similares a las del conjunto de datos. Pero lo más importante, las imágenes del conjunto de datos de entrenamiento no se mostraban en secuencia y el algoritmo no aprendía a completar una serie.
Luego le pidieron a la IA que eligiera cuál de las nuevas imágenes era más probable que siguiera a otra. Para llevarlo a cabo, la IA agrupó las imágenes generadas por similitud y luego utilizó el algoritmo del cono de luz para trazar un límite alrededor de aquellas que podrían estar relacionados causalmente con la imagen dada. A pesar de no estar entrenada para continuar una secuencia, la IA hizo buenas suposiciones sobre qué imagen venía a continuación. Si le daba imagen en la que una persona de pelo corto camina con una camisa puesta, la IA rechazaba las imágenes de una persona con el pelo largo o sin camisa, asegura Vlontzos. El trabajo se encuentra en las etapas finales de revisión en NeurIPS, la importante conferencia sobre aprendizaje automático.
Una ventaja de este enfoque consiste en que debería funcionar con diferentes tipos de aprendizaje automático, siempre que el modelo pueda generar nuevas imágenes similares a las del conjunto de entrenamiento. También podría usarse para mejorar la precisión de las IA entrenadas en secuencias de vídeo.
Para probar el enfoque, el equipo hizo que los conos se expandieran a un ritmo fijo. Pero en la práctica, el ritmo variará. Una pelota en un campo de fútbol tendrá más posibles posiciones en el futuro que una pelota que avanza por rieles, por ejemplo. Esto significa que se necesitaría un cono que se expandiera a un ritmo más rápido para el balón en un campo de fútbol.
Calcular estas velocidades supone profundizar en la termodinámica, lo cual no es práctico. Por ahora, el equipo planea establecer el diámetro de los conos a mano. Pero al ver un vídeo de un partido de fútbol, por ejemplo, la IA podría aprender cuánto se movían los objetos y lo rápido que lo hacían, lo que le permitiría establecer el diámetro del cono. La IA también podría aprender sobre la marcha, observando lo rápido que cambia un sistema real y ajustando el tamaño del cono para que coincida con eso.
Predecir el futuro resulta importante para muchas aplicaciones. Los vehículos autónomos deben poder predecir si un niño está a punto de salir a la carretera o si un ciclista representa un peligro. Los robots que necesitan interactuar con objetos físicos deben ser capaces de prever cómo se comportarán esos objetos cuando se muevan. Los sistemas predictivos en general serán más precisos si pueden razonar sobre la relación causa-efecto y no solo sobre la correlación.
Pero Vlontzos y sus colegas están especialmente interesados en la medicina. Se podría usar una IA para simular cómo un paciente podría responder a un determinado tratamiento, por ejemplo, explicando cómo ese tratamiento podría seguir su curso, paso a paso. "Al crear todos estos posibles resultados, se podría ver cómo un medicamento afectaría a una enfermedad", sostiene Vlontzos. El enfoque también se podría usar con imágenes médicas. Con una resonancia magnética de un cerebro, la IA podría identificar las posibles formas en las que una enfermedad podría progresar.
El investigador que trabaja en inferencia causal en Spotify y el University College Londres Ciaran Lee opina: "Es fantástico ver que se usan ideas de la física fundamental para hacer esto. La comprensión de la causalidad es realmente importante si se tienen que tomar acciones o decisiones en el mundo real". Está directamente relacionado con cómo las cosas llegan a ser como son, y concluye: "Si queremos preguntarnos '¿Por qué?' hay que entender la causa y el efecto".