Poisson-jakauma ja maalimallinnus jalkapallossa
Jos olet koskaan katsonut otteluesittelyohjelmaa jossa juontaja sanoo "tällä ottelulla on 2,3 odotettujen maalien rivi, mikä tarkoittaa 61% mahdollisuutta Yli 2,5:lle", katsoit Poisson-laskutoimitusta toiminnassa. Jos olet nähnyt todennäköisyyskolmikon (kotivoitto 58%, tasapeli 25%, vierasvoitto 17%) joka näytti tulevan tyhjästä, sen tuottanut laskenta oli lähes varmasti Poisson-simulaatio.
Poisson on tilastollinen moottori useimpien jalkapallomaalimallien alla. Se on ollut siellä 50 vuotta, hiljaa tuottaen todennäköisyyslukuja, joita myöhemmin kuvataan muodikkaammalla sanastolla. Sen toiminnan ymmärtäminen demystifioi paljon siitä, mitä "AI-jalkapalloennuste" oikeasti tekee konepellin alla.
Tämä artikkeli käy läpi Poissonin selkeällä kielellä, näyttää kuinka sitä sovelletaan jalkapalloon erityisesti, missä se toimii, missä ei, ja mitä modernit hienosäädöt lisäävät sen päälle.
Mikä Poisson oikeasti on
Poisson-jakauma kuvaa todennäköisyyttä, että jokin määrä tapahtumia sattuu kiinteässä aikaikkunassa, annetulla keskitiheydellä.
Muodollisesti: jos tapahtumat sattuvat vakiomääräisellä keskitiheydellä λ (lambda) per aikayksikkö, ja ne tapahtuvat itsenäisesti toisistaan, niin todennäköisyys tarkalleen k tapahtumalle siinä ikkunassa on:
P(k) = (λ^k × e^(-λ)) / k!
Sinun ei tarvitse rakastaa matematiikkaa. Käytännön merkitys:
- λ = 1 tarkoittaa että tapahtuma keskimäärin kerran ikkunassa. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 tarkoittaa kahdesti per ikkuna. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 tarkoittaa kolme kertaa per ikkuna. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Jakauma vangitsee että keskiarvo on yksi asia, mutta tietyt lopputulokset klusteroituvat tämän keskiarvon ympärille tunnetulla todennäköisyydellä. Kun λ = 2, odotat 2, mutta 0, 3 ja 4 kaikki tapahtuvat merkityksellisellä prosentilla.
Miksi Poisson sopii jalkapallomaalintekoon
Kolme syytä miksi oletus pätee karkeasti jalkapallolle.
Maalit ovat harvinaisia. Useimmat ottelut näkevät 0-5 maalia. Poisson käsittelee 0-5 alueen siististi; se hajoaa hyvin korkeissa määrissä, mutta jalkapallo testaa sen harvoin.
Maalit tapahtuvat suunnilleen itsenäisinä aikoina. Kun riisut pelitilavaikutukset (joista keskustelemme), maalit ottelussa tapahtuvat suunnilleen vakiomääräisellä tiheydellä. Maali 10. minuutilla ei muuta maalin todennäköisyyttä 40. minuutilla niin terävästi kuin saattaisit ajatella.
Tiheys voidaan johtaa joukkueen laadusta. Jos joukkue A:n keskimaalinteon tiheys on 1,5 maalia/ottelu ja joukkue B:n puolustustiheys päästää 1,2 maalia/ottelu, A:n odotetut maalit tässä ottelussa on jokin painotettu sekoitus (1,5 × 1,2 / sarjakeskiarvo, kotietu-skaalauksella). Poisson ottaa tuon λ:n ja tuottaa täyden jakauman.
Yhdistä nämä ja saat toimivan mallin: jokaiselle ottelulle, johda odotetut tiheydet kummallekin puolelle, sovella Poissonia kumpaankin tuottaaksesi maalimäärä-jakaumat, yhdistä ne lopputulosmatriisiksi (kotivoitot / tasapeli / vierasvoitot / Yli 2,5 / BTTS / jne.).
Kuinka Poisson rakentaa todennäköisyyskolmikon
Ottelussa joukkue A:n (odotetut maalit 1,8) ja joukkue B:n (odotetut maalit 1,2) välillä, simulaatio:
- Käyttäen Poissonia λ=1,8 joukkueelle A, laske P(A tekee 0), P(1), P(2), P(3), P(4), P(5+).
- Käyttäen Poissonia λ=1,2 joukkueelle B, laske sama B:lle.
- Olettaen itsenäisyyden (ensimmäinen Poisson-oletus), kerro: P(A tekee N ja B tekee M) = P(A=N) × P(B=M).
- Summaa N > M kotivoitoille, N = M tasapeleille, N < M vierasvoitoille.
- Normalisoi tarvittaessa.
Tulos: todennäköisyyskolmikko ottelulle, johdettu kokonaan kahdesta odotettujen maalien luvusta. Kunnollinen sopivuus useimmille otteluille.
Tämä on mitä "xG-vetoiset ennustemallit" yleensä ovat yksinkertaisimmillaan: kaksi lukua sisään, todennäköisyysjakauma ulos, Poisson moottorina.
Missä Poisson murtuu
Neljä todellista vikatilaa, joita moderni mallinnus yrittää korjata.
Pelitilariippuvuus. Joukkue takaa-ajamassa 0-1 vajetta viimeisen 20 minuutin aikana pelaa eri tavalla. Heidän maalitiheytensä nousee yli ottelua edeltävän odotuksen; vastustajan tiheys pysyy samanlaisena mutta puolustusvirheet laukaisevat päästettyjä mahdollisuuksia. Itsenäinen, vakiotiheyksinen Poisson aliennustaa paluut ja yliennustaa tasaisen tilan dominanssin.
Tasapelin paisuminen. Matalapistemääräisissä otteluissa (λ alle 1,5 per puoli), Poisson yliennustaa 1-1 ja 0-0 samaan aikaan, aliennustaen tasapelit kokonaan. Dixon ja Coles ehdottivat korjausta vuonna 1997 joka säätää matalapistemääräisten lopputulosmatriisin solujen lukuja. Useimmat tuotantomallit käyttävät Dixon-Colesia tai vastaavaa.
Korrelaatio joukkueiden välillä. Yhden joukkueen maalit eivät ole täysin itsenäisiä toisen maaleista. Puoli joka päästää aikaisin usein putoaa laadussa ottelun jatkuessa. Kahden muuttujan Poisson-mallit lisäävät pienen korrelaatioparametrin. Ilman sitä yhteislopputulokset käsitellään liian itsenäisinä.
Ääripäätulokset. Poisson-jakauman oikea häntä (5-0, 6-0, 7-0) on ohut raa'assa Poissonissa mutta havaittu useammin käytännössä epätasaisissa otteluissa. Modernit mallit soveltavat häntäkorjauksia tai käyttävät negatiivisia binomijakaumia, joilla on sama keskiarvo kuin Poissonilla mutta sallivat enemmän vaihtelua.
Käyttökelpoinen sääntö: raaka Poisson on hyödyllinen perustaso mutta tuotantomallit aina lisäävät hienosäätöjä. Hienosäädöt eivät muuta tulkintaa (todennäköisyyskolmikot, Yli/Alle, BTTS) mutta ne tiukentavat lukuja todellisuutta vasten.
Poisson lopputulostodennäköisyyksien yli
Poisson-matematiikka mahdollistaa useita johdannaisia mittareita:
Odotetut pisteet (xPts). Jokaiselle ottelulle, simuloi lopputulosjakauma Poissonilla, laske odotetut pisteet kummallekin puolelle. Summaa kauden yli, sinulla on xPts.
Odotetut maalit puolesta/vastaan ikkunan yli. Joukkueen xG-historia yhdistettynä Poissoniin tuottaa todennäköisyysjakauman heidän kauden maalimääristään.
Aasialaisten tasoitusten reilut rivit. xG:n kääntäminen aasialaisten tasoitusten kertoimiksi käyttää Poisson-simulaatiota maaliero-jakaumalle.
Yli/Alle ja BTTS todennäköisyydet. Kaikki johdettavissa lopputulosmatriisista, jonka Poisson-simulaatio rakentaa.
Käytännössä, kun sinulla on per-joukkue xG (tai odotettu maalintekotiheys), Poisson antaa sinulle koko ottelun todennäköisyyspinnan, ei vain voitto/tasapeli/häviö-kolmikon.
Kuinka Tactiq käsittelee Poisson-tyylistä maalimallinnusta
Tactiq:n analyysi käyttää simulaatiopohjaista todennäköisyysarviointia osana putkeaan tuottaakseen ottelukortilla esitetyt todennäköisyyskolmikot. Tarkka lähestymistapa, perus-Poissonin päälle sovelletut hienosäädöt, ja kuinka simulaatio käsittelee pelitila- ja vastustajan-laatu-vuorovaikutuksia pysyy tuotteen sisällä.
Käyttäjälle vaikutus on, että kolme todennäköisyyttä ottelukortilla heijastavat simuloitua lopputulosjakaumaa pohjautuen odotettujen maalien arvioihin ja joukkueen vahvuussignaaleihin, eivätkä käsinkoodattuihin heuristiikkoihin. Luottamusilmaisin heijastaa kuinka herkkä jakauma on syötesignaalien pieniin muutoksiin sille tietylle ottelulle.
Mitä käyttäjä näkee ottelukortilla:
- Todennäköisyyskolmikot lopputulokselle, tuotettu simulaation kautta.
- Odotetut maalit kummallekin puolelle viimeaikaisella trendillä.
- Kirjoitettu analyysi joka nimeää lopputuloksen selkeällä kielellä: "Kotipuoli astuu sisään vaatimattomalla edulla odotetuissa maaleissa, mikä kääntyy noin 52-25-23 todennäköisyysjakoon."
- Ei ulkoista markkinadataa missään. Ei uudelleenohjauksia kolmansien osapuolien alustoille. Ei virtuaalivaluuttaa. Vain tilastollinen analyysi.
Yhteenveto
Poisson on tilastollinen työjuhta useimpien jalkapallomaalimallien alla. Se on tarpeeksi yksinkertainen laskea nopeasti, tarpeeksi hyvä sopimaan useimpiin otteluihin, ja perusta jolle hienostuneemmat hienosäädöt (Dixon-Coles, kahden muuttujan, negatiivinen binomi) rakentuvat.
Poissonin ymmärtäminen demystifioi todennäköisyyskolmikot joita näet jokaisella analytiikkapaneelilla. Ne eivät ole taikuutta; ne ovat simulaatioita odotettujen maalien syötteistä. Mikä erottaa hyvät mallit huonoista on hienosäädöt jotka korjaavat Poissonin tunnettuja heikkouksia.
Tactiq käyttää simulaatiopohjaista todennäköisyysarviointia hienosäädöillä todellisen ottelun monimutkaisuuden käsittelyyn. Analyysi nostaa esiin kalibroidut todennäköisyyskolmikot jokaisella ottelukortilla. Yli 1 200 sarjaa, 32-kielinen lokalisointi, ilmainen taso kahdeksalla analyysillä päivässä, ilman korttia.
Jos olet seurannut sarjaa, mittaristosanasto kattaa nyt kuinka AI ennustaa jalkapallo-otteluita, xG, xA, npxG, PPDA, Field Tilt, progressiiviset toimet, SCA/GCA, xPts, Elo-arvot ja Brier-piste kalibrointi. Poisson on todennäköisyysmoottori joka sitoo useimmat aiemmat mittarit yhteen kun ennuste täytyy tuottaa.