Poissonovo rozdělení a modelování gólů ve fotbale
Pokud jste někdy sledovali pořad s předzápasovou analýzou, kde moderátor řekne "tento zápas má linku 2,3 očekávaných gólů, což znamená 61% šanci na Více než 2,5", sledovali jste Poissonovu aritmetiku v akci. Pokud jste viděli trojici pravděpodobnosti (výhra domácích 58%, remíza 25%, výhra hostů 17%), která jako by se vzala odnikud, výpočet, který ji vyprodukoval, byl téměř jistě Poissonova simulace.
Poisson je statistický motor pod většinou fotbalových golových modelů. Je tam už 50 let, tiše generuje pravděpodobnostní čísla, která se později popisují módnějším slovníkem. Pochopení toho, jak funguje, demystifikuje hodně z toho, co "AI fotbalová predikce" pod kapotou skutečně dělá.
Tento článek prochází Poissonem srozumitelnou řečí, ukazuje, jak se aplikuje konkrétně na fotbal, kde funguje, kde ne, a co moderní vylepšení přidávají navrch.
Co Poisson vlastně je
Poissonovo rozdělení popisuje pravděpodobnost určitého počtu událostí v pevném časovém okně při dané průměrné míře.
Formálně: pokud se události dějí konstantní průměrnou mírou λ (lambda) za jednotku času a dějí se navzájem nezávisle, pak pravděpodobnost přesně k událostí v tomto okně je:
P(k) = (λ^k × e^(-λ)) / k!
Matematiku nemusíte milovat. Praktický význam:
- λ = 1 znamená, že událost má průměr jednou za okno. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 znamená dvakrát za okno. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 znamená třikrát za okno. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Rozdělení zachycuje, že průměr je jedna věc, ale konkrétní výsledky se shlukují kolem tohoto průměru se známou pravděpodobností. Když λ = 2, očekáváte 2, ale 0 a 3 a 4 se všechny dějí ve smysluplném procentu případů.
Proč Poisson sedí na střílení gólů ve fotbale
Tři důvody, proč předpoklad zhruba pro fotbal platí.
Góly jsou vzácné. Většina zápasů vidí 0-5 gólů. Poisson zvládá rozsah 0-5 čistě; rozpadá se při velmi vysokých počtech, ale fotbal to zřídka testuje.
Góly se dějí v zhruba nezávislých časech. Jakmile odstraníte efekty stavu hry (k tomu se dostaneme), góly v zápase padají v zhruba konstantní míře. Gól v 10. minutě nemění pravděpodobnost gólu ve 40. minutě tak ostře, jak byste si mohli myslet.
Míru lze odvodit z kvality týmu. Pokud má tým A průměrnou střelbu 1,5 gólu/zápas a obranná míra týmu B inkasuje 1,2 gólu/zápas, očekávané góly pro tým A v tomto zápase jsou nějaký vážený průměr (1,5 × 1,2 / ligový průměr, se škálováním domácí výhody). Poisson vezme to λ a vyprodukuje plné rozdělení.
Spojte tyhle a získáte funkční model: pro každý zápas odvoďte očekávané míry pro obě strany, aplikujte Poisson na každou pro vyprodukování rozdělení počtu gólů, zkombinujte to do matice výsledků (výhry domácích / remíza / výhry hostů / Více než 2,5 / BTTS atd.).
Jak Poisson sestaví trojici pravděpodobnosti
Pro zápas mezi týmem A (očekávané góly 1,8) a týmem B (očekávané góly 1,2) simulace:
- Pomocí Poissonu s λ=1,8 pro tým A spočtěte P(tým A skóruje 0), P(1), P(2), P(3), P(4), P(5+).
- Pomocí Poissonu s λ=1,2 pro tým B spočtěte to samé pro tým B.
- Předpokládajíce nezávislost (první Poissonův předpoklad), vynásobte: P(tým A skóruje N a tým B skóruje M) = P(A=N) × P(B=M).
- Sečtěte přes N > M pro výhry domácích, N = M pro remízy, N < M pro výhry hostů.
- V případě potřeby normalizujte.
Výsledek: trojice pravděpodobnosti pro zápas, odvozená výhradně ze dvou čísel očekávaných gólů. Slušné padnutí pro většinu zápasů.
To je to, čím "predikční modely poháněné xG" obvykle ve své nejjednodušší podobě jsou: dvě čísla dovnitř, rozdělení pravděpodobnosti ven, Poisson jako motor.
Kde se Poisson rozpadá
Čtyři skutečné způsoby selhání, které moderní modelování zkouší napravit.
Závislost na stavu hry. Tým honící manko 0-1 v posledních 20 minutách hraje jinak. Jeho golová míra stoupá nad předzápasové očekávání; míra soupeře zůstává podobná, ale obranné chyby spouštějí inkasované šance. Nezávislý Poisson s konstantní mírou podpredikuje frekvenci comebacků a nadhodnocuje setrvalou dominanci.
Inflace remíz. V nízkoskórových zápasech (λ pod 1,5 na stranu) Poisson nadpredikuje 1-1 a 0-0 současně, podpredikuje remízy celkově. Dixon a Coles v roce 1997 navrhli korekci, která upravuje buňky výsledkové matice s nízkým skóre. Většina produkčních modelů používá Dixon-Coles nebo podobné.
Korelace mezi týmy. Góly jednoho týmu nejsou plně nezávislé na druhém. Strana, která inkasuje brzy, často klesne v kvalitě, jak zápas pokračuje. Bivariate Poissonovy modely přidávají malý korelační parametr. Bez něj jsou společné výsledky zacházeny příliš nezávisle.
Extrémní skóre. Pravý ohon Poissonových rozdělení (5-0, 6-0, 7-0) je v surovém Poissonu tenký, ale v praxi pozorovaný častěji v nesourodých zápasech. Moderní modely aplikují korekce ohonu nebo používají negativní binomická rozdělení, která mají stejnou střední hodnotu jako Poisson, ale umožňují větší rozptyl.
Použitelné pravidlo: surový Poisson je užitečná základní linie, ale produkční modely vždy přidávají vylepšení. Vylepšení nemění interpretaci (trojice pravděpodobnosti, Více/Méně, BTTS), ale utahují čísla proti realitě.
Poisson za hranicí pravděpodobností výsledku
Poissonova matematika umožňuje několik navazujících metrik:
Očekávané body (xPts). Pro každý zápas simulujte rozdělení výsledku přes Poisson, spočtěte očekávané body pro každou stranu. Sečtěte přes sezonu, máte xPts.
Očekávané góly pro/proti přes okno. xG historie týmu zkombinovaná s Poissonem produkuje pravděpodobnostní rozdělení jeho sezónních golových součtů.
Asijský handicap férové linie. Překlad xG do kurzů asijského handicapu používá Poissonovu simulaci pro rozdělení rozdílu gólů.
Pravděpodobnosti Více/Méně a BTTS. Vše odvoditelné z výsledkové matice, kterou Poissonova simulace staví.
V efektu, jakmile máte xG na tým (nebo očekávanou míru skórování), Poisson vám dá celý pravděpodobnostní povrch zápasu, ne jen trojici výhra/remíza/prohra.
Jak Tactiq nakládá s modelováním gólů ve stylu Poissona
Analýza Tactiqu používá pravděpodobnostní odhad založený na simulaci jako součást svého pipelinu pro produkci trojic pravděpodobnosti zobrazených na kartě zápasu. Konkrétní přístup, vylepšení aplikovaná oproti základnímu Poissonu a způsob, jakým simulace nakládá s interakcemi stavu hry a kvality soupeře, zůstává uvnitř produktu.
Pro uživatele je výsledkem to, že tři pravděpodobnosti na kartě zápasu odrážejí simulované rozdělení výsledku zakotvené v odhadech očekávaných gólů a signálech síly týmu, místo ručně kódovaných heuristik. Ukazatel důvěry odráží, jak citlivé je rozdělení na malé změny ve vstupních signálech pro tento konkrétní zápas.
Co uživatel vidí na kartě zápasu:
- Trojice pravděpodobnosti pro výsledek, vyprodukované simulací.
- Očekávané góly pro každou stranu s aktuálním trendem.
- Psanou analýzu, která pojmenovává výsledek běžnou řečí: "Domácí strana vstupuje s mírnou převahou v očekávaných gólech, což se promítá do zhruba 52-25-23 rozdělení pravděpodobnosti."
- Žádná externí tržní data nikde. Žádná přesměrování na platformy třetích stran. Žádná virtuální měna. Pouze statistická analýza.
Závěr
Poisson je statistický pracovní kůň pod většinou fotbalového modelování gólů. Je dost jednoduchý, aby se počítal rychle, dost dobrý, aby seděl na většinu zápasů, a základ, na kterém staví sofistikovanější vylepšení (Dixon-Coles, bivariate, negativní binomické).
Pochopení Poissona demystifikuje trojice pravděpodobnosti, které vidíte na každém analytickém dashboardu. Nejsou to kouzla; jsou to simulace ze vstupů očekávaných gólů. Co odděluje dobré modely od špatných, jsou vylepšení, která korigují známé slabiny Poissona.
Tactiq používá pravděpodobnostní odhad založený na simulaci s vylepšeními aplikovanými pro zvládání reálné složitosti zápasu. Analýza zobrazuje kalibrované trojice pravděpodobnosti na každé kartě zápasu. Více než 1.200 soutěží, lokalizace do 32 jazyků, bezplatná úroveň osmi analýz denně, bez karty.
Pokud sledujete sérii, slovník metrik nyní pokrývá jak AI předpovídá fotbalové zápasy, xG, xA, npxG, PPDA, Field Tilt, progresivní akce, SCA/GCA, xPts, Elo hodnocení a Brierovo skóre kalibrace. Poisson je pravděpodobnostní motor, který svazuje většinu předchozích metrik dohromady, když má být vyprodukována predikce.