Imagina sintonizar el saque inicial de un partido del Mundial y ver a un jugador enviar intencionadamente el balón por todo el campo y directamente fuera de banda en el lado del oponente. Los aficionados ocasionales podrían quedarse perplejos. ¿Dónde está la lógica en ceder la posesión a los pocos segundos de empezar un partido? Sin embargo, si fueras Jesse Davis, sabrías que esta jugada podría ser una preparación excelente para marcar.
Davis es profesor de informática en la KU Leuven en Bélgica y director de su Laboratorio de Análisis Deportivo, que ha estado a la vanguardia de un despertar de los datos en el fútbol desde su creación hace más de una década. Aunque el grupo de investigación aplica modelos de aprendizaje automático a una variedad de deportes —incluyendo baloncesto, voleibol y hockey sobre hierba—, su impacto no se siente en ningún lugar más que en el campo de fútbol.
Davis y su equipo de investigadores emplean analítica de datos avanzada para revelar una serie de hallazgos revolucionarios que están transformando la toma de decisiones de los clubes profesionales. “Su laboratorio es el laboratorio de analítica deportiva más influyente en el fútbol,” afirma Hugo Rios-Neto, responsable de captación de datos para el Royal Sporting Club Anderlecht en Bélgica. Han ayudado a los equipos a evaluar mejor sus plantillas, ideado formas de evaluar la eficiencia (o no) de las estrategias, y desarrollado algoritmos que descubren patrones tácticos ocultos.
Como, por ejemplo, el valor de despejar el balón fuera de banda cerca de la portería y permitir que el rival realice el saque de banda—una estrategia que ha ido ganando protagonismo en algunas de las principales ligas del mundo en los últimos años.
Para argumentar estadísticamente a favor de esta jugada aparentemente contraproducente, el grupo de Davis construyó un conjunto de datos de entrenamiento compuesto por más de 1,4 millones de pases y unos 60.000 saques de banda —en parte procedentes del Mundial de 2022. Utilizaron modelos de conjunto de árboles (esencialmente una combinación de árboles de decisión) para simular la táctica. La conclusión, que los investigadores presentaron en un artículo de 2024 bajo el acertado título de «Boot it»: cuando el balón está en el tercio central del campo, mandarlo fuera de banda en el lado de los contrarios puede situarte a 10 acciones (como pases y regates) de un gol. Esto puede ser muy significativo en un partido que cuenta con 1.500 o más acciones por partido y muy pocos goles. La idea, explica Davis, es que te estás preparando para recuperar el balón en una situación ventajosa.
Más allá de proporcionar análisis específicos para el día del partido, Davis también ocupa un nicho único en el mundo del análisis deportivo, donde muchos clubes contratan ahora a sus propios equipos de datos inte os para mantener una ventaja competitiva. Pone la mayor parte de su investigación a disposición de forma gratuita a través de herramientas de análisis de código abierto, pero la vida académica también le otorga la libertad de abordar problemas más complejos —como estandarizar los datos en el juego, un proyecto que facilitará el análisis de las imágenes de partidos y la elaboración de estrategias ganadoras.
Davis, de 45 años, creció en Wisconsin y pasó su infancia cautivado por el baloncesto y el fútbol americano. El fútbol fue un deporte marginal para él hasta la universidad, cuando el Mundial de 2002 —en el que Brasil arrasó el to eo de forma memorable— lo enganchó. Pero la idea de dedicarse a analizar el deporte nunca se le pasó por la cabeza. Sus estudios de doctorado en informática en la Universidad de Wisconsin–Madison le llevaron a trabajar con radiólogos para analizar informes de mamografías.
En octubre de 2010, se incorporó a la KU Leuven como profesor de informática, centrado en la intersección entre la IA y la atención sanitaria, con un enfoque en la monitorización del rendimiento deportivo. Su equipo de investigación estudió, por ejemplo, la combinación de elementos como la frecuencia cardíaca con otras métricas para determinar si alguien estaba en situación de sobreentrenamiento. También se adentraron en la biomecánica de la carrera.
Los aspectos tácticos y técnicos de los deportes, y del fútbol en particular, se convirtieron en el objeto del trabajo profesoral de Davis cuando contrató a Jan Van Haaren, un estudiante de ingeniería centrado en inteligencia artificial y autoproclamado fanático del fútbol. Se preguntó si el análisis de datos podría usarse para estudiar aspectos como los pases, los tiros y la progresión del balón — métricas que el juego apenas empezaba a procesar digitalmente en ese momento.
Davis comprendió que el aprendizaje automático y otras herramientas de inteligencia artificial se prestaban bien a la complejidad, fluidez y velocidad del fútbol.
No es necesario ser un experto en la aplicación del modelo Moneyball a los deportes profesionales para ver que es relativamente fácil aplicar un trabajo estadístico profundo al béisbol o al baloncesto. Se pueden aislar acciones como los tiros en suspensión y asignar valor a los que se realizan de cerca o de lejos. Pronto un entrenador de baloncesto se da cuenta de que un jugador que no puede hacer una bandeja, pero que lanza casi igual de bien desde la línea de tres puntos que con tiros de media distancia, bien podría optar por el tiro que da más puntos.
El fútbol, en comparación, parecía un candidato poco propicio para ese tipo de análisis. «La inmensa, inmensa mayoría de las acciones realmente no conducen al resultado de un gol ni siquiera a un tiro», dice Rios-Neto. «Así que es difícil elaborar o derivar una estrategia ganadora a partir de los datos».
Pero el amor de Van Haaren por el deporte, y el de Davis por los deportes en general, los inspiró a intentarlo. Con el tiempo, Davis se dio cuenta de que el machine lea ing y otras herramientas de inteligencia artificial se prestaban bien a la complejidad, fluidez y velocidad del fútbol. En 2014, fundó oficialmente el Laboratorio de Análisis Deportivo.
Con un equipo de unos 10 estudiantes y posdoctorandos en cada momento, el laboratorio comenzó a sentar lo que Van Haaren denomina las "bases intelectuales de cómo se analiza el juego hoy en día". Los investigadores desglosaron las acciones del partido y, de repente, estaban valorando la posesión del balón, la estrategia de los penaltis (apuntar al centro) y los méritos de los tiros lejanos a puerta (realizarlos). "Una de las tendencias en el fútbol en los últimos cinco o diez años es que el número de tiros lejanos ha aumentado drásticamente", dice Davis. "Lo que los datos te permiten es cuantificar realmente cuáles son las probabilidades de esas cosas."
Desde que Davis y su equipo comenzaron a desentrañar las tácticas individuales de fútbol, sus ideas han empezado a extenderse por clubes de toda Europa, como el Club Brugge KV de Bélgica, así como por organizaciones nacionales de fútbol en EE. UU. y Bélgica. «El trabajo que sale del laboratorio es genuinamente útil —dice Rios-Neto—, y los clubes lo aplican para una variedad de propósitos.»
Van Haaren, quien ahora es el director de inteligencia futbolística en el Club Brugge, es uno de los muchos analistas inte os que adaptan el trabajo del laboratorio al fútbol profesional. «Nuestra colaboración con el laboratorio se centra en traducir la filosofía futbolística [del equipo] en resultados medibles y basados en datos», afirma. Cuando un club quiere evaluar, por ejemplo, lo bien que un defensa central está moviendo el balón por el campo, su objetivo es contabilizar cuántas veces el balón terminó en la parte del campo más cercana a la portería del equipo contrario. Lo hace combinando datos de eventos, que registran las acciones con el balón, con datos de seguimiento, que registran el movimiento del jugador. Esto muestra lo bien que los jugadores cumplen sus roles, lo cual es útil para el desarrollo y también para la búsqueda de nuevos fichajes.
El laboratorio de Davis, por su parte, sigue formulando preguntas que se aplican al juego en su conjunto. Para determinar si existe una ventaja en realizar más tiros de larga distancia, por ejemplo, la investigadora postdoctoral Maaike Van Roy y sus colegas modelaron el comportamiento de equipos de la Premier League inglesa utilizando un proceso de decisión de Markov, un marco computacional en el que algunas acciones están bajo el control de una persona mientras que otras son aleatorias. (Esa dualidad es particularmente útil para el fútbol, donde el movimiento puede parecer cualquier cosa menos lineal.) Los resultados, presentados en 2021 en la Conferencia de Análisis Deportivo MIT Sloan, demostraron que el Chelsea podría conseguir 1,6 goles más por temporada al disparar desde lejos un 20% más a menudo.
A pesar de este tipo de hallazgos del laboratorio de Davis y de grupos de investigación similares que han surgido en la última década en instituciones como el MIT y Ca egie Mellon, el fútbol se queda algo atrás respecto a muchos otros deportes profesionales en cuanto a la recopilación de los datos que los analistas necesitan. Todos los equipos emplean a personas para ver vídeos y utilizar software para anotar tácticas específicas del juego, cuyos detalles solo tienen sentido para los aficionados más entregados. Es un proceso mayoritariamente manual, que puede llevar hasta seis horas por partido. «Es una auténtica pesadilla trabajar con ella como analista de datos», afirma Davis.
Así que, mientras el laboratorio sigue en marcha, Davis también se ha unido a investigadores de otras instituciones en un esfuerzo por estandarizar los datos en todos los partidos. El grupo está experimentando con transformers, la arquitectura de red neuronal que sustenta los grandes modelos de lenguaje como ChatGPT. Si esto se pudiera aplicar al mundo del fútbol, un anotador humano de partidos podría etiquetar una táctica —por ejemplo, una escapada de tres contra dos— unas pocas veces, y eso podría entrenar el modelo sobre el concepto para que pudiera etiquetar instancias posteriores por sí solo. «Se ha avanzado mucho», dice Davis. «Pero sigue siendo bastante difícil».
Pero si hacemos balance, el trabajo del laboratorio ya ha facilitado el proceso de análisis gracias a las herramientas de código abierto que ha publicado, algunas de las cuales registran miles de descargas al mes. Uno es un framework llamado VAEP, un modelo que evalúa los efectos de todas las acciones sobre el balón. Otro es un modelo de xG (goles esperados), que analiza la calidad de una ocasión de gol. Otro más es un paquete para sincronizar datos de eventos con datos de seguimiento. «Mucha gente de la industria utiliza nuestro código en sus flujos de trabajo diarios», dice Davis.
Para él, la aplicación práctica de tener su código disponible es importante, pero el verdadero aliciente es ver cómo la teoría se convierte en práctica. Como él mismo dice, “Estoy realmente motivado para resolver problemas que surgen en ento os reales y ver que mi trabajo tiene un impacto”.
Andrew Zaleski es un redactor colaborador en Washingtonian revista.

