Distribution de Poisson et modélisation des buts au football

Questions fréquentes

Qu'est-ce qu'une distribution de Poisson en une phrase ?
Poisson décrit la fréquence à laquelle un événement rare se produit dans une période fixe, étant donné un taux moyen. Au football, l'« événement rare » est un but, la « période fixe » est de 90 minutes, et le « taux » est dérivé de la qualité des équipes, du xG ou du contexte du match. La distribution donne la probabilité de 0 but, 1 but, 2 buts, et ainsi de suite.
Pourquoi Poisson est-il le défaut pour les buts au football ?
Trois raisons. Les buts sont relativement rares (en moyenne autour de 2,5 par match dans les championnats majeurs). Ils surviennent à des moments à peu près aléatoires dans un match avec peu d'agrégation une fois corrigé l'état du jeu. Et les maths de Poisson sont assez simples pour calculer rapidement, ce qui rend pratique la simulation de milliers d'issues possibles. La combinaison en fait un cheval de bataille de la modélisation footballistique.
Quelles sont les entrées d'un modèle de buts Poisson ?
Deux taux : un par équipe. L'approche la plus courante dérive les taux de la force des équipes (taux d'attaque moins taux de défense de l'adversaire, avec l'avantage du terrain intégré). Les variantes modernes utilisent des valeurs de xG par match plutôt que des taux basés sur les victoires, produisant des distributions plus réactives et plus précises.
Où Poisson craque-t-il ?
Trois modes d'échec principaux. État de fin de match : une équipe qui court après un déficit joue différemment d'une équipe qui défend une avance, donc le taux de buts n'est pas constant sur 90 minutes. Corrélation entre équipes : si un côté encaisse un but tardif, il en encaisse souvent un autre dans la même phase, ce que Poisson traite comme indépendant. Matchs à très peu ou très beaucoup de buts : les queues de Poisson sous-représentent les issues extrêmes.
Tactiq utilise-t-il Poisson directement dans l'analyse ?
L'estimation de probabilité par simulation est l'une des techniques qui contribuent aux triplets de probabilités affichés sur la carte du match. L'approche de simulation précise, la façon dont les taux sont dérivés et la manière dont le modèle gère les faiblesses connues de Poisson restent dans le produit. Pour l'utilisateur, l'effet est que les trois probabilités à l'écran reflètent une distribution d'issues simulée, pas une règle codée à la main.
Existe-t-il de meilleures alternatives à Poisson ?
La distribution binomiale négative, Poisson bivariée, Dixon-Coles (qui ajoute de la corrélation pour les matchs à faible score) et Skellam ont toutes été proposées comme raffinements. Chacune capture une faiblesse spécifique du Poisson de base au prix d'une complexité supplémentaire. La plupart des modèles de production utilisent l'un de ces raffinements plutôt que du Poisson brut.