Distribución de Poisson y modelado de goles en el fútbol

Por Tactiq AI · 2026-05-07 · 9 min de lectura · IA y Fútbol

Si alguna vez has visto un programa de previa de partido donde el presentador dice "este partido tiene una línea de goles esperados de 2,3, lo que implica un 61% de probabilidad de Más de 2,5", estabas viendo aritmética de Poisson en acción. Si has visto una tripleta de probabilidad (victoria local 58%, empate 25%, victoria visitante 17%) que parecía salir de la nada, el cálculo que la produjo era casi con seguridad una simulación de Poisson.

Poisson es el motor estadístico bajo la mayoría de los modelos de goles del fútbol. Lleva ahí 50 años, generando silenciosamente las cifras de probabilidad que luego se describen con vocabulario más a la moda. Entender cómo funciona desmitifica mucho de lo que la "predicción de fútbol con IA" está haciendo realmente bajo el capó.

Este artículo recorre Poisson en lenguaje claro, muestra cómo se aplica al fútbol específicamente, dónde funciona, dónde no, y qué refinamientos modernos añaden encima de él.

Qué es Poisson realmente

Una distribución de Poisson describe la probabilidad de algún número de eventos que ocurren en una ventana de tiempo fija, dada una tasa media.

Formalmente: si los eventos ocurren a una tasa media constante λ (lambda) por unidad de tiempo, y ocurren independientemente entre sí, entonces la probabilidad de que ocurran exactamente k eventos en esa ventana es:

P(k) = (λ^k × e^(-λ)) / k!

No necesitas amar las matemáticas. El significado práctico:

  • λ = 1 significa que el evento promedia una vez por ventana. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 significa dos veces por ventana. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 significa tres veces por ventana. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

La distribución captura que la media es una cosa, pero los resultados específicos se agrupan en torno a esa media con probabilidad conocida. Cuando λ = 2, esperas 2, pero 0 y 3 y 4 ocurren en porcentajes significativos de las veces.

Por qué Poisson encaja con los goles del fútbol

Tres razones por las que la suposición se sostiene aproximadamente para el fútbol.

Los goles son raros. La mayoría de los partidos ven 0-5 goles. Poisson maneja el rango 0-5 limpiamente; se rompe en conteos muy altos, pero el fútbol rara vez prueba eso.

Los goles ocurren en momentos aproximadamente independientes. Una vez que quitas los efectos del estado del juego (que discutiremos), los goles dentro de un partido ocurren a una tasa aproximadamente constante. Un gol en el minuto 10 no cambia la probabilidad de un gol en el minuto 40 tan drásticamente como podrías pensar.

La tasa puede derivarse de la calidad del equipo. Si la tasa media de gol del Equipo A es 1,5 goles/partido y la tasa defensiva del Equipo B encaja 1,2 goles/partido, los goles esperados para el Equipo A en este partido son alguna mezcla ponderada (1,5 × 1,2 / media de la liga, con escalado por ventaja local). Poisson toma ese λ y produce una distribución completa.

Combina esto y obtienes un modelo trabajable: para cada partido, deriva tasas esperadas para ambos equipos, aplica Poisson a cada una para producir distribuciones de conteo de goles, combínalas en una matriz de resultados (victorias locales / empate / victorias visitantes / Más 2,5 / BTTS / etc.).

Cómo Poisson construye una tripleta de probabilidad

Para un partido entre el Equipo A (goles esperados 1,8) y el Equipo B (goles esperados 1,2), la simulación:

  1. Usando Poisson con λ=1,8 para el Equipo A, calcula P(Equipo A marca 0), P(1), P(2), P(3), P(4), P(5+).
  2. Usando Poisson con λ=1,2 para el Equipo B, calcula lo mismo para el Equipo B.
  3. Asumiendo independencia (la primera suposición de Poisson), multiplica: P(Equipo A marca N y Equipo B marca M) = P(A=N) × P(B=M).
  4. Suma sobre N > M para victorias locales, N = M para empates, N < M para victorias visitantes.
  5. Normaliza si es necesario.

El resultado: tripleta de probabilidad para el partido, derivada enteramente de dos números de goles esperados. Un ajuste decente para la mayoría de los partidos.

Esto es lo que los "modelos de predicción impulsados por xG" suelen ser en su forma más simple: dos números de entrada, una distribución de probabilidad de salida, Poisson como motor.

Dónde se rompe Poisson

Cuatro modos de fallo reales que el modelado moderno intenta corregir.

Dependencia del estado del juego. Un equipo que persigue un déficit 0-1 en los últimos 20 minutos juega distinto. Su tasa de goles sube por encima de la expectativa pre-partido; la tasa del rival se mantiene similar pero los errores defensivos disparan ocasiones encajadas. El Poisson independiente, de tasa constante, sub-predice la frecuencia de remontadas y sobre-predice el dominio en estado estable.

Inflación de empates. En partidos con pocos goles (λ por debajo de 1,5 por equipo), Poisson sobre-predice 1-1 y 0-0 simultáneamente, sub-prediciendo los empates en general. Dixon y Coles propusieron una corrección en 1997 que ajusta las casillas de marcador bajo de la matriz de resultados. La mayoría de los modelos de producción usan Dixon-Coles o similar.

Correlación entre equipos. Los goles de un equipo no son completamente independientes de los del otro. Un equipo que encaja temprano a menudo cae en calidad a medida que continúa el partido. Los modelos de Poisson bivariada añaden un pequeño parámetro de correlación. Sin él, los resultados conjuntos se tratan demasiado independientemente.

Marcadores extremos. La cola derecha de las distribuciones de Poisson (5-0, 6-0, 7-0) es delgada en Poisson en bruto pero se observa más a menudo en la práctica en desajustes. Los modelos modernos aplican correcciones de cola o usan distribuciones binomiales negativas, que tienen la misma media que Poisson pero permiten más varianza.

La regla utilizable: el Poisson en bruto es una línea base útil pero los modelos de producción siempre añaden refinamientos. Los refinamientos no cambian la interpretación (tripletas de probabilidad, Más/Menos, BTTS) pero ajustan los números contra la realidad.

Poisson más allá de las probabilidades de resultado

Las matemáticas de Poisson permiten varias métricas posteriores:

Puntos esperados (xPts). Para cada partido, simula la distribución de resultados vía Poisson, calcula los puntos esperados para cada equipo. Suma a lo largo de una temporada, tienes los xPts.

Goles esperados a favor/en contra a lo largo de una ventana. El historial de xG de un equipo combinado con Poisson produce una distribución de probabilidad de sus totales de goles de temporada.

Líneas justas de hándicap asiático. Traducir xG a cuotas de hándicap asiático usa simulación de Poisson para la distribución de diferencia de goles.

Probabilidades de Más/Menos y BTTS. Todas derivables de la matriz de resultados que construye la simulación de Poisson.

En efecto, una vez que tienes xG por equipo (o tasa de gol esperada), Poisson te da toda la superficie de probabilidad del partido, no solo la tripleta victoria/empate/derrota.

Cómo Tactiq maneja el modelado de goles tipo Poisson

El análisis de Tactiq usa estimación de probabilidad basada en simulación como parte de su pipeline para producir las tripletas de probabilidad mostradas en la tarjeta de partido. El enfoque específico, los refinamientos aplicados sobre el Poisson básico y cómo la simulación maneja las interacciones de estado del juego y calidad del rival permanecen dentro del producto.

Para el usuario, el efecto es que las tres probabilidades en la tarjeta de partido reflejan una distribución de resultados simulada basada en estimaciones de goles esperados y señales de fuerza de equipo, en lugar de heurísticas codificadas a mano. El indicador de confianza refleja cuán sensible es la distribución a pequeños cambios en las señales de entrada para ese partido específico.

Lo que ve el usuario en la tarjeta de partido:

  • Tripletas de probabilidad para el resultado, producidas mediante simulación.
  • Goles esperados para cada equipo con una tendencia reciente.
  • Un análisis escrito que nombra el resultado en lenguaje claro: "El local entra con una ventaja modesta en goles esperados, lo que se traduce en una división de probabilidad de aproximadamente 52-25-23".
  • Sin datos de mercado externos en ningún sitio. Sin redirecciones a plataformas de terceros. Sin moneda virtual. Solo análisis estadístico.

La conclusión

Poisson es el caballo de batalla estadístico bajo la mayoría del modelado de goles del fútbol. Es lo suficientemente simple para calcular rápidamente, lo suficientemente bueno para encajar la mayoría de los partidos y la base sobre la cual se construyen refinamientos más sofisticados (Dixon-Coles, bivariada, binomial negativa).

Entender Poisson desmitifica las tripletas de probabilidad que ves en cada panel analítico. No son magia; son simulaciones a partir de entradas de goles esperados. Lo que separa los buenos modelos de los malos son los refinamientos que corrigen las debilidades conocidas de Poisson.

Tactiq usa estimación de probabilidad basada en simulación con refinamientos aplicados para manejar la complejidad del partido real. El análisis muestra tripletas de probabilidad calibradas en cada tarjeta de partido. Más de 1.200 competiciones, localización a 32 idiomas, plan gratuito de ocho análisis al día, sin tarjeta requerida.

Si has seguido la serie, el vocabulario de métricas ahora abarca cómo la IA predice los partidos de fútbol, xG, xA, npxG, PPDA, Field Tilt, acciones progresivas, SCA/GCA, xPts, ratings Elo y calibración con Brier score. Poisson es el motor de probabilidad que une la mayoría de las métricas anteriores cuando hay que producir una predicción.

Preguntas frecuentes

¿Qué es una distribución de Poisson en una frase?
Poisson describe con qué frecuencia ocurre un evento raro en un período fijo, dada una tasa media. En el fútbol, el 'evento raro' es un gol, el 'período fijo' son 90 minutos, y la 'tasa' se deriva de la calidad del equipo, el xG o el contexto del partido. La distribución te dice la probabilidad de 0 goles, 1 gol, 2 goles, y así sucesivamente.
¿Por qué Poisson es el estándar para los goles del fútbol?
Tres razones. Los goles son relativamente raros (promedio en torno a 2,5 por partido en las ligas top). Ocurren en momentos aproximadamente aleatorios dentro de un partido con poca agrupación una vez que corriges por el estado del juego. Y las matemáticas de Poisson son lo suficientemente simples para calcular rápidamente, lo que las hace prácticas para simular miles de posibles resultados de partido. La combinación lo convierte en un caballo de batalla para el modelado del fútbol.
¿Cuáles son las entradas de un modelo de goles de Poisson?
Dos tasas: una para cada equipo. El enfoque más común deriva las tasas de la fuerza del equipo (tasa de ataque menos tasa de defensa del rival, con la ventaja local incorporada). Las variantes modernas alimentan valores de xG por partido en lugar de tasas basadas en victorias, produciendo distribuciones más receptivas y precisas.
¿Dónde se rompe Poisson?
Tres modos de fallo principales. Estado de juego tardío: un equipo que persigue un déficit juega distinto que uno que defiende una ventaja, así que la tasa de goles no es constante a lo largo de los 90 minutos. Correlación entre equipos: si un equipo encaja un gol tardío, a menudo encaja otro en la misma fase, lo cual Poisson trata como independiente. Partidos con muy pocos o muchos goles: las colas de Poisson sub-representan los resultados extremos.
¿Tactiq usa Poisson directamente en el análisis?
La estimación de probabilidad basada en simulación es una de varias técnicas que contribuyen a las tripletas de probabilidad mostradas en la tarjeta de partido. El enfoque específico de simulación, cómo se derivan las tasas y cómo el modelo maneja las debilidades conocidas de Poisson permanece dentro del producto. Para el usuario, el efecto es que las tres probabilidades en pantalla reflejan una distribución de resultados simulada, no una regla codificada a mano.
¿Hay mejores alternativas a Poisson?
Binomial negativa, Poisson bivariada, Dixon-Coles (que añade correlación para partidos con pocos goles) y distribuciones Skellam han sido propuestas como refinamientos. Cada una captura una debilidad específica del Poisson básico a costa de complejidad adicional. La mayoría de los modelos de fútbol de producción usan uno de estos refinamientos en lugar de Poisson en bruto.