Kaggle, de Alphabet, premiará con 80.000 euros a los algoritmos de aprendizaje automático que mejores apuestan realicen en la liga universitaria de baloncesto. Pero las máquinas se enfrentan a un problema: el torneo incluye muchos factores que no se pueden medir
La locura de marzo (o la March Madness) es uno de los eventos deportivos más populares de EE. UU. La creciente popularidad de los partidos eliminatorios del Campeonato de Baloncesto de la División I de la Asociación Nacional Atlética Estudiantil (NCAA, por sus siglas en inglés) se debe, en parte, al enorme interés por predecir qué equipos permanecerán en las distintas fases del torneo. Entre los grupos de apuestas de oficinas y otras apuestas organizadas, se calcula que este año más de 40 millones de estadounidenses completarán sus propios diagramas de árbol de los partidos para participar, según la Asociación de Juegos de Estados Unidos, que estima que el valor de las apuestas ascenderá a unos 8,4 millones de euros. Las posibilidades de acertar un diagrama de árbol perfecto que explique de qué manera puede ganarse el torneo (algo que nadie ha hecho nunca) son de, como mínimo, una entre 128.000 millones, pero podrían llegar a ser de una y podrían ser una entre 9,2 trillones.
A pesar de las diminutas posibilidades, el aprendizaje automático podría lograrlo
Kaggle, la plataforma online para análisis de competiciones y modelos predictivos que fue adquirida el año pasado por la empresa matriz de Google, Alphabet, ha organizado una competición para los torneos masculinos y femeninos de la NCAA. Kaggle proporciona un conjunto de datos con información que incluye aspectos como los cabezas de serie desde la temporada 1984-1985, las puntuaciones finales de todos los juegos de la temporada regular, etcétera. En total, la plataforma ofrece más de 40 millones de puntos de datos.
Los competidores no deben completar un diagrama tradicional. En lugar de eso, crean y usan modelos para predecir la probabilidad que tiene un equipo de ganar cada partido. El modelo se juzga tanto por el resultado del partido como por la confianza que el modelo encuentra en su predicción. Así que, si un modelo está convencido en al 99 % de que un equipo ganará y acierta, obtiene más puntos que otro que también haya acertado pero su confianza para el resultado solo fuera del 95 %. Sin embargo, si un modelo está muy seguro de su información pero falla, perderá más puntos. Este enfoque limita las posibilidades de ganar por puro azar. Los premios de la competición, valorados en más de 80.000 euros, se dividirán entre los tres mejores diagramas para ambos torneos. Las inscripciones se cerraron la semana pasada con más de 900 equipos participantes.
Pero no está claro que el aprendizaje automático esté listo para abordar este tipo de reto. Los equipos universitarios cambian de jugadores cada temporada, así que es posible que los algoritmos ni siquiera tengan los datos correctos para analizar la búsqueda de patrones.
Luego están los elementos incuantificables, como los jugadores y los equipo en racha. Las ciudades que albergan los torneos también pueden influir en el rendimiento de un equipo de formas que un algoritmo no puede anticipar. Por ejemplo, los partidos en una ciudad como Denver (EE. UU.) podrían generar problemas de altitud para los equipos acostumbrados a jugar al nivel del mar, o una multitud particularmente ruidosa podría ayudar a un equipo a ganar impulso. Este año, por primera vez en la historia, los equipos de la Competición de los 10 Grandes (o Big Ten Conference en inglés) han tenido dos semanas de descanso antes del March Madness. Así que los jugadores de estos equipos podrían estar más descansados que los de otras formaciones. Un algoritmo no puede tener en cuenta algo que nunca ha visto antes. Las derrotas sorpresivas se llaman así por algo, así que si el aprendizaje automático fuera capaz de predecirles, habría que reconsiderar el término.
En un hilo de Reddit llamado "Pregúnteme lo que Quiera", el CEO de Kaggle, Anthony Goldbloom, admitió: "No creo que una competición como la NCAA [March Madness] sea un lugar adecuado para el aprendizaje automático. Hay muchos menos partidos en el March Madness que clics en anuncios fraudulentos".
Kaggle ha albergado cuatro competiciones anteriores de la locura de marzo, aunque esta es la primera que ofrece premios en metálico. El ganador del año pasado, Andrew Landgraf, basó su modelo en los algoritmos de los ganadores anteriores, pero con un giro. Tuvo en cuenta las capacidades de su competidores y dirigió su algoritmo para aprovecharse de sus posibles errores. A nivel de calle, la gente hace lo mismo con sus apuestas: si estuviera en una oficina con un montón de fanáticos del equipo de la Universidad de Duke (EE. UU.), apostar contra ellos podría generar más beneficios. Pero Landgraf reconoce que aunque su modelo estaba cuidadosamente planeado, la suerte tuvo mucho peso en su éxito.
Es probable que los algoritmos lleguen ser tan buenos como para predecir cosas como las rachas de suerte, pero mientras tanto, la colaboración entre el humano y la máquina podría ser clave en el futuro inmediato de los diagramas de juego. Los sindicatos de apuestas están de acuerdo, y ya han empezado a usar análisis predictivos y datos de los mercados de apuestas online para rellenar sus diagramas, según el investigador y autor de The Perfect Bet: How Science and Math Are Taking the Luck Out of Gambling, Adam Kucharski.
El experto señala: "A pesar de todos sus defectos, los mercados de apuestas son una buena forma de sondear el conocimiento de la multitud. Hay que entender que el factor humano puede ser muy útil".
Para juzgar los resultados del torneo de Kaggle de este año se puede echar mano de los diagramas imperfectos de los últimos años. La mayor tasa de acierto en la historia de un diagrama logró predecir correctamente 39 partidos, una cifra que se ha convertido en la referencia del éxito. Así que si uno de los algoritmos que compiten en Kaggle (una colaboración humano-máquina) logra el objetivo final, le espera una gran recompensa. El multimillonario Warren Buffett lanzó oferta hace tiempo en la que asegura que pagará un millón de dólares (unos 800.000 euros) al año para toda la vida a cualquiera de sus empleados que obtenga un diagrama perfecto.
Pero, ¿qué pasará después de que alguien (o algo) logre un diagrama perfecto. La competición de Kaggle comienza después de que se hayan seleccionado a los 64 equipos que participarán en la locura de marzo. Así que tal vez el próximo desafío consista en predecir a los ganadores del torneo antes de saber si quiera qué equipos van a participar.