Poissonova porazdelitev in modeliranje golov v nogometu
Če ste kdaj gledali predogled tekme, kjer voditelj reče "ta tekma ima črto pričakovanih golov 2,3, kar pomeni 61% možnosti za Več kot 2,5", ste gledali Poissonovo aritmetiko v akciji. Če ste videli verjetnostno trojico (domača zmaga 58%, neodločeno 25%, gostujoča zmaga 17%), ki se je zdela prišla iz nikoder, je bil izračun, ki jo je proizvedel, skoraj zagotovo Poissonova simulacija.
Poisson je statistični motor pod večino nogometnih modelov golov. Tam je 50 let in tiho ustvarja verjetnostne številke, ki so kasneje opisane z bolj modernim besednjakom. Razumevanje, kako deluje, demistificira veliko tega, kar "AI nogometna napoved" dejansko počne pod pokrovom.
Ta članek obravnava Poisson v preprostem jeziku, prikaže, kako se uporablja posebej za nogomet, kje deluje, kje ne, in kaj sodobne izboljšave dodajajo na vrh.
Kaj je Poisson dejansko
Poissonova porazdelitev opisuje verjetnost nekega števila dogodkov v fiksnem časovnem oknu glede na povprečno stopnjo.
Formalno: če se dogodki pojavljajo s konstantno povprečno stopnjo λ (lambda) na časovno enoto in se zgodijo neodvisno drug od drugega, potem je verjetnost natančno k dogodkov v tem oknu:
P(k) = (λ^k × e^(-λ)) / k!
Ne potrebujete ljubiti matematike. Praktični pomen:
- λ = 1 pomeni, da dogodek povprečno enkrat na okno. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 pomeni dvakrat na okno. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 pomeni trikrat na okno. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Porazdelitev zajema, da je povprečje ena stvar, vendar specifični izidi grupirajo okoli tega povprečja z znano verjetnostjo. Ko je λ = 2, pričakujete 2, vendar se 0 in 3 in 4 vsi zgodijo v pomembnem odstotku časa.
Zakaj se Poisson prilega nogometnemu doseganju golov
Trije razlogi, zakaj predpostavka grobo drži za nogomet.
Goli so redki. Večina tekem vidi 0,5 golov. Poisson čisto upravlja razpon 0,5; odpove pri zelo visokih številkah, vendar nogomet to redko preizkuša.
Goli se zgodijo ob približno neodvisnih časih. Ko izvlečete učinke stanja igre (o čemer bomo razpravljali), se goli znotraj tekme zgodijo s približno konstantno stopnjo. Gol v 10. minuti ne spremeni verjetnosti gola v 40. minuti tako ostro, kot bi morda mislili.
Stopnja se lahko izpelje iz kakovosti ekipe. Če je povprečna stopnja doseganja Ekipe A 1,5 gola/tekmo in obrambna stopnja Ekipe B prejme 1,2 gola/tekmo, je pričakovani gol za Ekipo A v tej tekmi neka utežena mešanica (1,5 × 1,2 / ligaško povprečje, s skaliranjem za domačo prednost). Poisson vzame to λ in proizvede polno porazdelitev.
Združite to in dobite delujoč model: za vsako tekmo izpeljite pričakovani stopnji za obe strani, uporabite Poisson za vsako, da proizvedete porazdelitve števila golov, jih združite v matrico izidov (domače zmage / neodločene / gostujoče zmage / Več kot 2,5 / BTTS / itd.).
Kako Poisson zgradi verjetnostno trojico
Za tekmo med Ekipo A (pričakovani goli 1,8) in Ekipo B (pričakovani goli 1,2) simulacija:
- Z uporabo Poisson z λ=1,8 za Ekipo A izračunajte P(Ekipa A doseže 0), P(1), P(2), P(3), P(4), P(5+).
- Z uporabo Poisson z λ=1,2 za Ekipo B izračunajte enako za Ekipo B.
- Ob predpostavki neodvisnosti (prva Poissonova predpostavka) pomnožite: P(Ekipa A doseže N in Ekipa B doseže M) = P(A=N) × P(B=M).
- Seštejte za N > M za domače zmage, N = M za neodločene, N < M za gostujoče zmage.
- Normalizirajte, če je potrebno.
Rezultat: verjetnostna trojica za tekmo, izpeljana izključno iz dveh številk pričakovanih golov. Spodobno prilagajanje za večino tekem.
To so "napovedni modeli, gnani z xG" običajno v svoji najpreprostejši obliki: dve številki noter, verjetnostna porazdelitev ven, Poisson kot motor.
Kje Poisson odpove
Štirje pravi neuspeli načini, ki jih sodobno modeliranje skuša popraviti.
Odvisnost od stanja igre. Ekipa, ki preganja zaostanek 0,1 v zadnjih 20 minutah, igra drugače. Njihova stopnja golov se dvigne nad pred-tekemsko pričakovanje; stopnja nasprotnika ostane podobna, vendar obrambne napake sprožijo prejete priložnosti. Neodvisni Poisson s konstantno stopnjo podnapove pogostost preobratov in prenapove dominantnost stalnega stanja.
Inflacija neodločenih. Pri tekmah z malo goli (λ pod 1,5 na stran) Poisson prenapove 1,1 in 0,0 hkrati, podnapoveduje neodločene na splošno. Dixon in Coles sta leta 1997 predlagala popravek, ki prilagodi celice z nizkim rezultatom v matrici izidov. Večina produkcijskih modelov uporablja Dixon,Coles ali podobno.
Korelacija med ekipama. Goli ene ekipe niso popolnoma neodvisni od drugih. Stran, ki zgodaj prejme gol, pogosto pade v kakovosti, ko tekma napreduje. Dvospremenljivi Poissonovi modeli dodajajo majhen parameter korelacije. Brez tega so skupni izidi obravnavani preveč neodvisno.
Ekstremni rezultati. Desni rep Poissonovih porazdelitev (5,0, 6,0, 7,0) je tanek v surovem Poissonu, vendar se v praksi opazi pogosteje pri neuravnoteženih tekmah. Sodobni modeli uporabljajo popravke repa ali uporabljajo negativne binomske porazdelitve, ki imajo isto povprečje kot Poisson, vendar dovoljujejo več variance.
Uporabno pravilo: surov Poisson je uporabna osnovna linija, vendar produkcijski modeli vedno dodajajo izboljšave. Izboljšave ne spremenijo razlage (verjetnostne trojice, Več/Manj, BTTS), vendar zategnejo številke proti resničnosti.
Poisson onkraj verjetnosti izidov
Poissonova matematika omogoča več podrejenih metrik:
Pričakovane točke (xPts). Za vsako tekmo simulirajte porazdelitev izidov prek Poissona, izračunajte pričakovane točke za vsako stran. Seštejte čez sezono, imate xPts.
Pričakovani goli za/proti čez okno. Zgodovina xG ekipe, kombinirana s Poissonom, proizvede verjetnostno porazdelitev njihovih sezonskih skupnih golov.
Poštene linije Asian handicap. Prevajanje xG v kvote Asian handicap uporablja Poissonovo simulacijo za porazdelitev gol razlike.
Verjetnosti Več/Manj in BTTS. Vse izpeljive iz matrice izidov, ki jo gradi Poissonova simulacija.
V učinku, ko enkrat imate xG na ekipo (ali pričakovano stopnjo doseganja), vam Poisson da celotno verjetnostno površino tekme, ne samo trojice zmaga/neodločeno/poraz.
Kako Tactiq upravlja Poissonovo modeliranje golov
Tactiqova analiza uporablja simulacijsko oceno verjetnosti kot del svojega cevovoda za proizvajanje verjetnostnih trojic, izpostavljenih na kartici tekme. Specifičen pristop, izboljšave, uporabljene nad osnovnim Poissonom, in kako simulacija upravlja interakcije stanja igre in kakovosti nasprotnika, ostane znotraj produkta.
Za uporabnika je učinek, da tri verjetnosti na kartici tekme odražajo simulirano porazdelitev izidov, ki temelji na ocenah pričakovanih golov in signalih moči ekipe, namesto ročno kodiranih hevristik. Indikator zaupanja odraža, kako občutljiva je porazdelitev na majhne spremembe v vhodnih signalih za to specifično tekmo.
Kar uporabnik vidi na kartici tekme:
- Verjetnostne trojice za izid, proizvedene s simulacijo.
- Pričakovani goli za vsako stran z najnovejšo smernico.
- Pisana analiza, ki izid poimenuje v preprostem jeziku: "Domača stran vstopa s skromno prednostjo v pričakovanih golih, kar se prevede v približno 52,25,23 verjetnostni razdelitvi."
- Brez zunanjih tržnih podatkov kjerkoli. Brez preusmeritev na platforme tretjih oseb. Brez navidezne valute. Samo statistična analiza.
Zaključek
Poisson je statistično konjsko delo pod večino nogometnih modelov golov. Dovolj je preprost za hitro računanje, dovolj dober za prilagajanje večini tekem in temelj, na katerem gradijo bolj sofisticirane izboljšave (Dixon,Coles, dvospremenljiva, negativna binomska).
Razumevanje Poissona demistificira verjetnostne trojice, ki jih vidite na vsaki analitični nadzorni plošči. Niso čarovnija; so simulacije iz vhodov pričakovanih golov. Kar loči dobre modele od slabih, so izboljšave, ki popravljajo znane šibkosti Poissona.
Tactiq uporablja simulacijsko oceno verjetnosti z izboljšavami, uporabljenimi za upravljanje kompleksnosti resnične tekme. Analiza izpostavlja kalibrirane verjetnostne trojice na vsaki kartici tekme. Več kot 1.200 tekmovanj, lokalizacija v 32 jezikov, brezplačna raven z osmimi analizami na dan, brez zahtevane kreditne kartice.
Če ste sledili seriji, besednjak metrik zdaj zajema kako AI napoveduje nogometne tekme, xG, xA, npxG, PPDA, Field Tilt, progresivne akcije, SCA/GCA, xPts, Elo ocene in Brierjeva ocena kalibracija. Poisson je verjetnostni motor, ki poveže večino prejšnjih metrik, ko je treba proizvesti napoved.