Kiko Llaneras ha explicado algunas cosas muy interesantes desde el punto de vista matemático y de programación sobre el modelo de predicción del mundial de fútbol Rusia 2018 que han preparado para El País, del cual hay también una metodología detallada.
El fútbol tampoco es para nada una ciencia exacta y en los cálculos y predicciones se utilizan datos estadísticos y diversos criterios para crear un modelo matemático que se pone a prueba en simulaciones y se puede evaluar sólo cuando se han celebrado las competiciones. Si esto fuera algo fácil los matemáticos ganarían las quinielas cada semana. Pero tampoco es algo que dependa sólo del azar; de hecho las casas de apuestas viven de ello. Todo el mundo es consciente de que las probabilidades de que gane el mundial Brasil, Alemania o España son mucho más altas que las de Arabia Saudí, Túnez o Panamá.
La metodología de El País mide la «fortaleza» de las selecciones mediante un sistema de puntuación Elo, similar al que se utiliza en ajedrez y otros deportes. Mide la «capacidad relativa» entre equipos, que ganan y pierden «puntos» cuando se enfrentan entre sí. De hecho cuenta que lo han modelado para combinar tres variantes: un Elo sobre los históricos de los equipos en sí, otro sobre oportunidades en los partidos y otro sobre los jugadores que componen la selección – lo cual tiene bastante sentido común. Todo esto se «cocina» asignando unos pesos a cada variante según parezca más o menos relevante a los expertos.
Luego se utiliza un modelo de partidos (programado en lenguaje R) para entrenar al modelo matemático. En total se utilizan varias decenas de miles de históricos y datos de más de 150 selecciones nacionales (también las que no compiten en este mundial). Luego se comprueba si el modelo es acertado –cuánto se acercó a las predicciones– y se van ajustando parámetros para que encaje todo mejor. El resultado son «goles a favor y en contra» para cada nuevo partido planteado, lo cual permite adaptar fácilmente el software al formato del torneo – e incluso a los casos de prórrogas por empates en las fases finales.
Finalmente se hace una simulación: en total ya se ha jugado virtualmente 10.000 veces el mundial que empezará dentro de unos días, y el resultado es el que puede verse en la tabla: Brasil gana el 17,9% de las veces, Alemania el 15,6% y España el 15,3%, etcétera.
Curiosamente, las probabilidades de los favoritos están muy igualadas: ninguna selección tiene más de un 20% de probabilidades de ganar a priori, lo cual presagia buen fútbol. Los factores como árbitros, lesiones, estado del campo y demás se consideran neutros a todos los efectos (o bien que beneficiarán o perjudicarán a todos por igual – o al menos «igual que les ha sucedido históricamente»). Y el «factor campo» por el hecho de que Rusia juegue en casa tampoco parece que pueda variar mucho su clasificación porque está muy abajo en la tabla.
Suerte a todos los equipos; si las matemáticas aciertan hay bastante posibilidades de que España esta vez también pase de cuartos.