Rozkład Poissona i modelowanie goli w piłce nożnej

Często zadawane pytania

Czym jest rozkład Poissona w jednym zdaniu?
Poisson opisuje, jak często rzadkie zdarzenie zachodzi w określonym okresie przy danym średnim tempie. W piłce nożnej „rzadkie zdarzenie" to gol, „określony okres" to 90 minut, a „tempo" wywodzi się z jakości drużyny, xG lub kontekstu meczu. Rozkład mówi wam o prawdopodobieństwie 0 goli, 1 gola, 2 goli i tak dalej.
Dlaczego Poisson jest domyślny dla goli piłkarskich?
Trzy powody. Gole są stosunkowo rzadkie (średnio około 2,5 na mecz w czołowych ligach). Dzieją się w zasadniczo losowych momentach w meczu z niewielkim grupowaniem, gdy skorygować na stan gry. A matematyka Poissona jest na tyle prosta, by liczyć szybko, co czyni ją praktyczną do symulowania tysięcy możliwych wyników meczu. Połączenie czyni z niej konia roboczego modelowania piłki.
Jakie są wejścia modelu goli Poissona?
Dwa tempa: po jednym dla każdej drużyny. Najczęstsze podejście wywodzi tempa z siły drużyny (tempo ataku minus tempo obrony przeciwnika, z wbudowaną przewagą gospodarza). Nowoczesne warianty zasilają wartościami xG na mecz zamiast temp opartych na zwycięstwach, produkując bardziej responsywne i dokładne rozkłady.
Gdzie Poisson się załamuje?
Trzy główne tryby awarii. Stan późnego meczu: drużyna goniąca deficyt gra inaczej niż ta broniąca prowadzenia, więc tempo goli nie jest stałe przez 90 minut. Korelacja między drużynami: jeśli strona traci późny gol, często traci kolejny w tej samej fazie, co Poisson traktuje jako niezależne. Mecze z bardzo niskim lub bardzo wysokim wynikiem: ogony Poissona niedoreprezentują skrajnych wyników.
Czy Tactiq używa Poissona bezpośrednio w analizie?
Estymacja prawdopodobieństwa oparta na symulacji jest jedną z kilku technik wnoszących wkład do trójek prawdopodobieństw na karcie meczu. Konkretne podejście symulacji, sposób wywodzenia temp i radzenia sobie modelu ze znanymi słabościami Poissona pozostają wewnątrz produktu. Dla użytkownika efekt jest taki, że trzy prawdopodobieństwa na ekranie odzwierciedlają symulowany rozkład wyników, a nie regułę zakodowaną ręcznie.
Czy są lepsze alternatywy dla Poissona?
Ujemny dwumianowy, dwuwymiarowy Poisson, Dixon-Coles (który dodaje korelację dla niskoscoringowych meczów) i rozkłady Skellama były proponowane jako udoskonalenia. Każde łapie konkretną słabość podstawowego Poissona kosztem dodatkowej złożoności. Większość produkcyjnych modeli piłkarskich używa jednego z tych udoskonaleń zamiast surowego Poissona.