Poissonovo rozdelenie a modelovanie gólov vo futbale
Ak ste niekedy sledovali zápasový náhľad, kde moderátor hovorí "tento zápas má hranicu očakávaných gólov 2,3, čo implikuje 61% šancu na Viac ako 2,5", sledovali ste Poissonovu aritmetiku v akcii. Ak ste videli trojicu pravdepodobností (výhra domácich 58%, remíza 25%, výhra hostí 17%), ktorá akoby vyšla odnikadiaľ, výpočet, ktorý ju produkoval, bola takmer určite Poissonova simulácia.
Poisson je štatistický motor pod väčšinou futbalových gólových modelov. Je tam už 50 rokov, ticho generujúci čísla pravdepodobnosti, ktoré sú neskôr opísané módnejším slovníkom. Pochopenie toho, ako funguje, demystifikuje veľa toho, čo "AI futbalová predikcia" v skutočnosti robí pod kapotou.
Tento článok prejde Poissonom v bežnom jazyku, ukáže, ako sa aplikuje konkrétne na futbal, kde funguje, kde nie, a aké moderné vylepšenia naňho pridávajú.
Čo Poisson skutočne je
Poissonovo rozdelenie opisuje pravdepodobnosť určitého počtu udalostí dejúcich sa v pevnom časovom okne pri danej priemernej miere.
Formálne: ak sa udalosti dejú s konštantnou priemernou mierou λ (lambda) na časovú jednotku a dejú sa nezávisle od seba, potom pravdepodobnosť presne k udalostí v tom okne je:
P(k) = (λ^k × e^(-λ)) / k!
Nemusíte milovať matematiku. Praktický význam:
- λ = 1 znamená, že udalosť priemerne nastane raz za okno. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 znamená dvakrát za okno. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 znamená trikrát za okno. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Rozdelenie zachytáva, že priemer je jedna vec, ale konkrétne výsledky sa zhlukujú okolo priemeru s známou pravdepodobnosťou. Keď λ = 2, očakávate 2, ale 0 a 3 a 4 všetky nastanú vo významných percentách prípadov.
Prečo Poisson sedí pri strieľaní gólov vo futbale
Tri dôvody, prečo predpoklad zhruba platí pre futbal.
Góly sú vzácne. Väčšina zápasov vidí 0-5 gólov. Poisson čisto spracováva rozsah 0-5; zlyháva pri veľmi vysokých počtoch, ale futbal to zriedka testuje.
Góly sa dejú v zhruba nezávislých časoch. Akonáhle odstránite efekty stavu hry (o ktorých budeme diskutovať), góly v rámci zápasu sa dejú zhruba konštantnou mierou. Gól v 10. minúte nemení pravdepodobnosť gólu v 40. minúte tak ostro, ako by ste si mysleli.
Mieru možno odvodiť z kvality tímu. Ak je priemerná skórovacia miera tímu A 1,5 gólu na zápas a obranná miera tímu B inkasuje 1,2 gólu na zápas, očakávané góly pre tím A v tomto zápase sú nejakou váženou zmesou (1,5 × 1,2 / ligový priemer, so škálovaním domácou výhodou). Poisson vezme λ a vyprodukuje plné rozdelenie.
Skombinujte tieto a dostanete použiteľný model: pre každý zápas odvodíte očakávané miery pre obe strany, aplikujete Poissona na každú, aby ste vyprodukovali rozdelenia počtu gólov, kombinujete ich do výsledkovej matice (výhry domácich / remíza / výhry hostí / Viac ako 2,5 / BTTS / atď.).
Ako Poisson stavia trojicu pravdepodobností
Pre zápas medzi tímom A (očakávané góly 1,8) a tímom B (očakávané góly 1,2), simulácia:
- Použitím Poissona s λ=1,8 pre tím A, vypočítajte P(tím A skóruje 0), P(1), P(2), P(3), P(4), P(5+).
- Použitím Poissona s λ=1,2 pre tím B, vypočítajte to isté pre tím B.
- Predpokladajúc nezávislosť (prvý Poissonov predpoklad), násobte: P(tím A skóruje N a tím B skóruje M) = P(A=N) × P(B=M).
- Sčítajte cez N > M pre výhry domácich, N = M pre remízy, N < M pre výhry hostí.
- Normalizujte v prípade potreby.
Výsledok: trojica pravdepodobností pre zápas, odvodená úplne z dvoch čísel očakávaných gólov. Slušný fit pre väčšinu zápasov.
Toto sú "predikčné modely riadené xG" zvyčajne v ich najjednoduchšej forme: dve čísla dnu, rozdelenie pravdepodobnosti von, Poisson ako motor.
Kde Poisson zlyháva
Štyri skutočné módy zlyhania, ktoré moderné modelovanie skúša korigovať.
Závislosť od stavu hry. Tím dobiehajúci stratu 0-1 v posledných 20 minútach hrá inak. Ich gólová miera stúpa nad predzápasové očakávanie; miera ich súpera zostáva podobná, ale obranné chyby spúšťajú inkasované šance. Nezávislý Poisson s konštantnou mierou podpredpovedá frekvenciu obratu a nadpredpovedá ustálenú dominanciu.
Inflácia remíz. Pri nízkoskórovaných zápasoch (λ pod 1,5 na stranu) Poisson nadpredpovedá 1-1 a 0-0 zároveň, podpredpovedajúc remízy celkovo. Dixon a Coles navrhli korekciu v 1997, ktorá upravuje bunky nízkeho skóre vo výsledkovej matici. Väčšina produkčných modelov používa Dixon-Coles alebo podobné.
Korelácia medzi tímami. Góly jedného tímu nie sú úplne nezávislé od druhého. Strana, ktorá inkasuje skoro, často klesá v kvalite, ako zápas pokračuje. Bivariátne Poissonove modely pridávajú malý korelačný parameter. Bez neho sa spoločné výsledky berú príliš nezávisle.
Extrémne výsledky. Pravý chvost Poissonových rozdelení (5-0, 6-0, 7-0) je tenký v surovom Poissonovi, ale pozorovaný častejšie v praxi pri nepomerných zápasoch. Moderné modely aplikujú korekcie chvostov alebo používajú negatívne binomické rozdelenia, ktoré majú ten istý priemer ako Poisson, ale dovoľujú väčší rozptyl.
Použiteľné pravidlo: surový Poisson je užitočný základ, ale produkčné modely vždy pridávajú vylepšenia. Vylepšenia nemenia interpretáciu (trojice pravdepodobností, Viac/Menej, BTTS), ale tlačia čísla bližšie k realite.
Poisson nad rámec pravdepodobností výsledkov
Poissonova matematika umožňuje viacero následných metrík:
Očakávané body (xPts). Pre každý zápas simulujte rozdelenie výsledkov cez Poissona, vypočítajte očakávané body pre každú stranu. Spočítajte cez sezónu, máte xPts.
Očakávané góly za/proti cez okno. xG história tímu kombinovaná s Poissonom produkuje rozdelenie pravdepodobnosti ich sezónnych celkových gólov.
Spravodlivé hodnoty ázijského handicapu. Preklad xG do ázijských handicapových kurzov používa Poissonovu simuláciu pre rozdelenie rozdielu gólov.
Pravdepodobnosti Viac/Menej a BTTS. Všetky odvoditeľné z výsledkovej matice, ktorú Poissonova simulácia stavia.
V skutočnosti, akonáhle máte xG na tím (alebo očakávanú skórovaciu mieru), Poisson vám dáva celý povrch pravdepodobnosti zápasu, nie len trojicu výhra/remíza/prehra.
Ako Tactiq zaobchádza s modelovaním gólov v štýle Poissona
Analýza Tactiq používa odhad pravdepodobnosti založený na simulácii ako súčasť svojej pipeline na produkciu trojíc pravdepodobností zobrazených na karte zápasu. Konkrétny prístup, vylepšenia aplikované nad základným Poissonom, a ako simulácia spracováva interakcie stav hry-kvalita súpera, zostáva vnútri produktu.
Pre používateľa je efekt taký, že tri pravdepodobnosti na karte zápasu odrážajú simulované rozdelenie výsledkov založené na odhadoch očakávaných gólov a signáloch sily tímu, namiesto ručne kódovaných heuristík. Indikátor istoty odráža, ako citlivé je rozdelenie na malé zmeny vo vstupných signáloch pre tento konkrétny zápas.
Čo používateľ vidí na karte zápasu:
- Trojicu pravdepodobností pre výsledok, vyprodukovanú cez simuláciu.
- Očakávané góly pre každú stranu s nedávnym trendom.
- Písomnú analýzu, ktorá pomenováva výsledok v bežnom jazyku: "Domáca strana vstupuje so skromnou výhodou v očakávaných góloch, čo sa premieta do zhruba 52-25-23 rozdelenia pravdepodobnosti."
- Žiadne externé trhové dáta nikde. Žiadne presmerovania na platformy tretích strán. Žiadna virtuálna mena. Iba štatistická analýza.
Záver
Poisson je štatistický pracovný kôň pod väčšinou futbalového modelovania gólov. Je dosť jednoduchý na rýchly výpočet, dosť dobrý na fit väčšiny zápasov, a základ, na ktorom stavajú sofistikovanejšie vylepšenia (Dixon-Coles, bivariátny, negatívny binomický).
Pochopenie Poissona demystifikuje trojice pravdepodobností, ktoré vidíte na každom analytickom dashboarde. Nie sú to mágia; sú to simulácie zo vstupov očakávaných gólov. Čo oddeľuje dobré modely od zlých, sú vylepšenia, ktoré korigujú známe slabosti Poissona.
Tactiq používa odhad pravdepodobnosti založený na simulácii s vylepšeniami aplikovanými na spracovanie skutočnej zložitosti zápasov. Analýza zobrazuje kalibrované trojice pravdepodobností na každej karte zápasu. 1.200 a viac súťaží, lokalizácia do 32 jazykov, bezplatná úroveň ôsmich analýz denne, bez kreditnej karty.
Ak ste sledovali sériu, slovník metrík teraz pokrýva ako AI predikuje futbalové zápasy, xG, xA, npxG, PPDA, Field Tilt, progresívne akcie, SCA/GCA, xPts, Elo ratingy a kalibráciu Brier skóre. Poisson je pravdepodobnostný motor, ktorý spája väčšinu predchádzajúcich metrík dohromady, keď treba vyprodukovať predikciu.