Distribución de Poisson y modelado de goles en el fútbol
Si alguna vez has visto un programa de previa de partido donde el presentador dice "este partido tiene una línea de goles esperados de 2,3, lo que implica un 61% de probabilidad de Más de 2,5", estabas viendo aritmética de Poisson en acción. Si has visto una tripleta de probabilidad (victoria local 58%, empate 25%, victoria visitante 17%) que parecía salir de la nada, el cálculo que la produjo era casi con seguridad una simulación de Poisson.
Poisson es el motor estadístico bajo la mayoría de los modelos de goles del fútbol. Lleva ahí 50 años, generando silenciosamente las cifras de probabilidad que luego se describen con vocabulario más a la moda. Entender cómo funciona desmitifica mucho de lo que la "predicción de fútbol con IA" está haciendo realmente bajo el capó.
Este artículo recorre Poisson en lenguaje claro, muestra cómo se aplica al fútbol específicamente, dónde funciona, dónde no, y qué refinamientos modernos añaden encima de él.
Qué es Poisson realmente
Una distribución de Poisson describe la probabilidad de algún número de eventos que ocurren en una ventana de tiempo fija, dada una tasa media.
Formalmente: si los eventos ocurren a una tasa media constante λ (lambda) por unidad de tiempo, y ocurren independientemente entre sí, entonces la probabilidad de que ocurran exactamente k eventos en esa ventana es:
P(k) = (λ^k × e^(-λ)) / k!
No necesitas amar las matemáticas. El significado práctico:
- λ = 1 significa que el evento promedia una vez por ventana. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 significa dos veces por ventana. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 significa tres veces por ventana. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
La distribución captura que la media es una cosa, pero los resultados específicos se agrupan en torno a esa media con probabilidad conocida. Cuando λ = 2, esperas 2, pero 0 y 3 y 4 ocurren en porcentajes significativos de las veces.
Por qué Poisson encaja con los goles del fútbol
Tres razones por las que la suposición se sostiene aproximadamente para el fútbol.
Los goles son raros. La mayoría de los partidos ven 0-5 goles. Poisson maneja el rango 0-5 limpiamente; se rompe en conteos muy altos, pero el fútbol rara vez prueba eso.
Los goles ocurren en momentos aproximadamente independientes. Una vez que quitas los efectos del estado del juego (que discutiremos), los goles dentro de un partido ocurren a una tasa aproximadamente constante. Un gol en el minuto 10 no cambia la probabilidad de un gol en el minuto 40 tan drásticamente como podrías pensar.
La tasa puede derivarse de la calidad del equipo. Si la tasa media de gol del Equipo A es 1,5 goles/partido y la tasa defensiva del Equipo B encaja 1,2 goles/partido, los goles esperados para el Equipo A en este partido son alguna mezcla ponderada (1,5 × 1,2 / media de la liga, con escalado por ventaja local). Poisson toma ese λ y produce una distribución completa.
Combina esto y obtienes un modelo trabajable: para cada partido, deriva tasas esperadas para ambos equipos, aplica Poisson a cada una para producir distribuciones de conteo de goles, combínalas en una matriz de resultados (victorias locales / empate / victorias visitantes / Más 2,5 / BTTS / etc.).
Cómo Poisson construye una tripleta de probabilidad
Para un partido entre el Equipo A (goles esperados 1,8) y el Equipo B (goles esperados 1,2), la simulación:
- Usando Poisson con λ=1,8 para el Equipo A, calcula P(Equipo A marca 0), P(1), P(2), P(3), P(4), P(5+).
- Usando Poisson con λ=1,2 para el Equipo B, calcula lo mismo para el Equipo B.
- Asumiendo independencia (la primera suposición de Poisson), multiplica: P(Equipo A marca N y Equipo B marca M) = P(A=N) × P(B=M).
- Suma sobre N > M para victorias locales, N = M para empates, N < M para victorias visitantes.
- Normaliza si es necesario.
El resultado: tripleta de probabilidad para el partido, derivada enteramente de dos números de goles esperados. Un ajuste decente para la mayoría de los partidos.
Esto es lo que los "modelos de predicción impulsados por xG" suelen ser en su forma más simple: dos números de entrada, una distribución de probabilidad de salida, Poisson como motor.
Dónde se rompe Poisson
Cuatro modos de fallo reales que el modelado moderno intenta corregir.
Dependencia del estado del juego. Un equipo que persigue un déficit 0-1 en los últimos 20 minutos juega distinto. Su tasa de goles sube por encima de la expectativa pre-partido; la tasa del rival se mantiene similar pero los errores defensivos disparan ocasiones encajadas. El Poisson independiente, de tasa constante, sub-predice la frecuencia de remontadas y sobre-predice el dominio en estado estable.
Inflación de empates. En partidos con pocos goles (λ por debajo de 1,5 por equipo), Poisson sobre-predice 1-1 y 0-0 simultáneamente, sub-prediciendo los empates en general. Dixon y Coles propusieron una corrección en 1997 que ajusta las casillas de marcador bajo de la matriz de resultados. La mayoría de los modelos de producción usan Dixon-Coles o similar.
Correlación entre equipos. Los goles de un equipo no son completamente independientes de los del otro. Un equipo que encaja temprano a menudo cae en calidad a medida que continúa el partido. Los modelos de Poisson bivariada añaden un pequeño parámetro de correlación. Sin él, los resultados conjuntos se tratan demasiado independientemente.
Marcadores extremos. La cola derecha de las distribuciones de Poisson (5-0, 6-0, 7-0) es delgada en Poisson en bruto pero se observa más a menudo en la práctica en desajustes. Los modelos modernos aplican correcciones de cola o usan distribuciones binomiales negativas, que tienen la misma media que Poisson pero permiten más varianza.
La regla utilizable: el Poisson en bruto es una línea base útil pero los modelos de producción siempre añaden refinamientos. Los refinamientos no cambian la interpretación (tripletas de probabilidad, Más/Menos, BTTS) pero ajustan los números contra la realidad.
Poisson más allá de las probabilidades de resultado
Las matemáticas de Poisson permiten varias métricas posteriores:
Puntos esperados (xPts). Para cada partido, simula la distribución de resultados vía Poisson, calcula los puntos esperados para cada equipo. Suma a lo largo de una temporada, tienes los xPts.
Goles esperados a favor/en contra a lo largo de una ventana. El historial de xG de un equipo combinado con Poisson produce una distribución de probabilidad de sus totales de goles de temporada.
Líneas justas de hándicap asiático. Traducir xG a cuotas de hándicap asiático usa simulación de Poisson para la distribución de diferencia de goles.
Probabilidades de Más/Menos y BTTS. Todas derivables de la matriz de resultados que construye la simulación de Poisson.
En efecto, una vez que tienes xG por equipo (o tasa de gol esperada), Poisson te da toda la superficie de probabilidad del partido, no solo la tripleta victoria/empate/derrota.
Cómo Tactiq maneja el modelado de goles tipo Poisson
El análisis de Tactiq usa estimación de probabilidad basada en simulación como parte de su pipeline para producir las tripletas de probabilidad mostradas en la tarjeta de partido. El enfoque específico, los refinamientos aplicados sobre el Poisson básico y cómo la simulación maneja las interacciones de estado del juego y calidad del rival permanecen dentro del producto.
Para el usuario, el efecto es que las tres probabilidades en la tarjeta de partido reflejan una distribución de resultados simulada basada en estimaciones de goles esperados y señales de fuerza de equipo, en lugar de heurísticas codificadas a mano. El indicador de confianza refleja cuán sensible es la distribución a pequeños cambios en las señales de entrada para ese partido específico.
Lo que ve el usuario en la tarjeta de partido:
- Tripletas de probabilidad para el resultado, producidas mediante simulación.
- Goles esperados para cada equipo con una tendencia reciente.
- Un análisis escrito que nombra el resultado en lenguaje claro: "El local entra con una ventaja modesta en goles esperados, lo que se traduce en una división de probabilidad de aproximadamente 52-25-23".
- Sin datos de mercado externos en ningún sitio. Sin redirecciones a plataformas de terceros. Sin moneda virtual. Solo análisis estadístico.
La conclusión
Poisson es el caballo de batalla estadístico bajo la mayoría del modelado de goles del fútbol. Es lo suficientemente simple para calcular rápidamente, lo suficientemente bueno para encajar la mayoría de los partidos y la base sobre la cual se construyen refinamientos más sofisticados (Dixon-Coles, bivariada, binomial negativa).
Entender Poisson desmitifica las tripletas de probabilidad que ves en cada panel analítico. No son magia; son simulaciones a partir de entradas de goles esperados. Lo que separa los buenos modelos de los malos son los refinamientos que corrigen las debilidades conocidas de Poisson.
Tactiq usa estimación de probabilidad basada en simulación con refinamientos aplicados para manejar la complejidad del partido real. El análisis muestra tripletas de probabilidad calibradas en cada tarjeta de partido. Más de 1.200 competiciones, localización a 32 idiomas, plan gratuito de ocho análisis al día, sin tarjeta requerida.
Si has seguido la serie, el vocabulario de métricas ahora abarca cómo la IA predice los partidos de fútbol, xG, xA, npxG, PPDA, Field Tilt, acciones progresivas, SCA/GCA, xPts, ratings Elo y calibración con Brier score. Poisson es el motor de probabilidad que une la mayoría de las métricas anteriores cuando hay que producir una predicción.