Poisson-fordeling og målmodellering i fotball
Hvis du noen gang har sett en kampvisningsprogram der verten sier "denne kampen har en 2,3 forventet mål-linje, som impliserer 61% sjanse for Over 2,5", så du på Poisson-aritmetikk i aksjon. Hvis du har sett en sannsynlighetstrippel (hjemmeseier 58%, uavgjort 25%, borteseier 17%) som virket å komme ut av ingenting, var beregningen som produserte den nesten sikkert en Poisson-simulering.
Poisson er den statistiske motoren under de fleste fotballmålmodeller. Den har vært der i 50 år og stille generert sannsynlighetstallene som senere blir beskrevet med mer fasjonabelt vokabular. Å forstå hvordan den fungerer avmystifiserer mye av hva "AI-fotballforutsigelse" faktisk gjør under panseret.
Denne artikkelen går gjennom Poisson på klart språk, viser hvordan den brukes på fotball spesifikt, hvor den fungerer, hvor den ikke gjør det, og hva moderne forfininger legger til.
Hva Poisson faktisk er
En Poisson-fordeling beskriver sannsynligheten for at et visst antall hendelser skjer i et fast tidsvindu, gitt en gjennomsnittlig rate.
Formelt: hvis hendelser skjer ved en konstant gjennomsnittlig rate λ (lambda) per tidsenhet, og de skjer uavhengig av hverandre, så er sannsynligheten for at nøyaktig k hendelser skjer i det vinduet:
P(k) = (λ^k × e^(-λ)) / k!
Du trenger ikke å elske matematikken. Den praktiske betydningen:
- λ = 1 betyr at hendelsen i gjennomsnitt skjer én gang per vindu. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 betyr to ganger per vindu. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 betyr tre ganger per vindu. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Fordelingen fanger at gjennomsnittet er én ting, men spesifikke utfall klynger seg rundt gjennomsnittet med kjent sannsynlighet. Når λ = 2, forventer du 2, men 0 og 3 og 4 skjer alle meningsfulle prosenter av tiden.
Hvorfor Poisson passer fotballmålscoring
Tre grunner til at antagelsen holder grovt for fotball.
Mål er sjeldne. De fleste kamper ser 0-5 mål. Poisson håndterer 0-5-området rent; den brister ved svært høye antall, men fotballen tester sjelden det.
Mål skjer på omtrent uavhengige tidspunkter. Når du fjerner kampstatus-effekter (som vi skal diskutere), skjer mål innen en kamp ved en omtrent konstant rate. Et mål i 10. minutt endrer ikke sannsynligheten for et mål i 40. minutt så skarpt som du kanskje tror.
Raten kan utledes fra lagkvalitet. Hvis lag As gjennomsnittlige scoringsrate er 1,5 mål/kamp og lag Bs forsvarsrate slipper inn 1,2 mål/kamp, er forventet mål for lag A i denne kampen en vektet blanding (1,5 × 1,2 / liga-gjennomsnitt, med hjemmefordel-skalering). Poisson tar den λ-en og produserer en full fordeling.
Kombiner disse, og du får en brukbar modell: for hver kamp utled forventede rater for begge sider, bruk Poisson på hver for å produsere målantallfordelinger, kombiner disse til en utfallsmatrise (hjemmeseier / uavgjort / borteseier / Over 2,5 / BTTS / etc.).
Hvordan Poisson bygger en sannsynlighetstrippel
For en kamp mellom lag A (forventede mål 1,8) og lag B (forventede mål 1,2), simuleringen:
- Bruk Poisson med λ=1,8 for lag A, beregn P(lag A scorer 0), P(1), P(2), P(3), P(4), P(5+).
- Bruk Poisson med λ=1,2 for lag B, beregn det samme for lag B.
- Anta uavhengighet (den første Poisson-antagelsen), multipliser: P(lag A scorer N og lag B scorer M) = P(A=N) × P(B=M).
- Summer over N > M for hjemmeseier, N = M for uavgjort, N < M for borteseier.
- Normaliser om nødvendig.
Resultatet: sannsynlighetstrippel for kampen, utledet helt fra to forventede mål-tall. En anstendig tilpasning for de fleste kamper.
Dette er hva "xG-drevne forutsigelsesmodeller" vanligvis er på sitt enkleste: to tall inn, en sannsynlighetsfordeling ut, Poisson som motor.
Hvor Poisson brister
Fire reelle feilmoduser som moderne modellering prøver å korrigere for.
Kampstatus-avhengighet. Et lag som jakter på et 0-1-underskudd i de siste 20 minuttene spiller annerledes. Målraten deres stiger over forhåndskamp-forventningen; motstanderens rate forblir lik, men forsvarsfeil utløser sjanser som slippes inn. Uavhengig, konstant-rate Poisson underforutsier comeback-frekvens og overforutsier stabil-status-dominans.
Uavgjort-inflasjon. I lavt-scorende kamper (λ under 1,5 per side) overforutsier Poisson 1-1 og 0-0 samtidig, og underforutsier uavgjort totalt. Dixon og Coles foreslo en korreksjon i 1997 som justerer lavt-scorende celler i utfallsmatrisen. De fleste produksjonsmodeller bruker Dixon-Coles eller lignende.
Korrelasjon mellom lag. Det ene lagets mål er ikke fullt uavhengige av det andres. En side som slipper inn tidlig faller ofte i kvalitet ettersom kampen fortsetter. Bivariate Poisson-modeller legger til en liten korrelasjonsparameter. Uten den behandles felles utfall for uavhengig.
Ekstreme resultater. Den høyre halen av Poisson-fordelinger (5-0, 6-0, 7-0) er tynn i rå Poisson, men observert oftere i praksis ved skjeve oppgjør. Moderne modeller bruker halekorreksjoner eller bruker negative binomiale fordelinger, som har samme middelverdi som Poisson, men tillater mer varians.
Den brukbare regelen: rå Poisson er en nyttig grunnlinje, men produksjonsmodeller legger alltid til forfininger. Forfiningene endrer ikke tolkningen (sannsynlighetstripler, Over/Under, BTTS), men de strammer tallene mot virkeligheten.
Poisson utover utfallssannsynligheter
Poisson-matematikk muliggjør flere nedstrøms-metrikker:
Forventede poeng (xPts). For hver kamp, simuler utfallsfordelingen via Poisson, beregn forventede poeng for hver side. Summer over en sesong, og du har xPts.
Forventede mål for/mot over et vindu. Et lags xG-historikk kombinert med Poisson produserer en sannsynlighetsfordeling av deres totale sesongmål.
Asiatiske handikaplinjer. Å oversette xG til asiatiske handikaplinjer bruker Poisson-simulering for målforskjellsfordelingen.
Over/Under- og BTTS-sannsynligheter. Alle kan utledes fra utfallsmatrisen Poisson-simuleringen bygger.
I praksis, når du har per-lag xG (eller forventet scoringsrate), gir Poisson deg hele sannsynlighetsoverflaten av kampen, ikke bare seier/uavgjort/tap-trippelen.
Hvordan Tactiq håndterer Poisson-stil målmodellering
Tactiqs analyse bruker simuleringsbasert sannsynlighetsestimering som en del av sin pipeline for å produsere sannsynlighetstriplene som vises på kampkortet. Den spesifikke tilnærmingen, forfiningene som brukes over grunnleggende Poisson, og hvordan simuleringen håndterer kampstatus- og motstanderkvalitets-interaksjoner forblir innen produktet.
For brukeren er effekten at de tre sannsynlighetene på kampkortet reflekterer en simulert utfallsfordeling forankret i forventede mål-estimater og lagstyrkesignaler, snarere enn håndkodede heuristikker. Tillitsindikatoren reflekterer hvor følsom fordelingen er for små endringer i inndatasignalene for den spesifikke kampen.
Det brukeren ser på kampkortet:
- Sannsynlighetstripler for utfallet, produsert gjennom simulering.
- Forventede mål for hver side med en nyere trend.
- En skriftlig analyse som navngir utfallet på klart språk: "Hjemmelaget kommer inn med en moderat fordel i forventede mål, som oversettes til omtrent 52-25-23 sannsynlighetsdeling."
- Ingen eksterne markedsdata noe sted. Ingen omdirigeringer til tredjepartsplattformer. Ingen virtuell valuta. Kun statistisk analyse.
Konklusjonen
Poisson er den statistiske arbeidshesten under de fleste fotballmålmodelleringer. Den er enkel nok til å beregne raskt, god nok til å passe de fleste kamper, og fundamentet som mer sofistikerte forfininger (Dixon-Coles, bivariat, negativ binomial) bygger på.
Å forstå Poisson avmystifiserer sannsynlighetstriplene du ser på hvert analysedashbord. De er ikke magi; de er simuleringer fra forventede mål-inndata. Det som skiller gode modeller fra dårlige, er forfiningene som korrigerer for Poissons kjente svakheter.
Tactiq bruker simuleringsbasert sannsynlighetsestimering med forfininger anvendt for å håndtere virkelig-kamp-kompleksitet. Analysen viser kalibrerte sannsynlighetstripler på hvert kampkort. Over 1 200 konkurranser, lokalisering til 32 språk, gratisnivå med åtte analyser per dag, uten kort.
Hvis du har fulgt serien, spenner metrikkvokabularet nå over hvordan AI forutsier fotballkamper, xG, xA, npxG, PPDA, Field Tilt, progressive aksjoner, SCA/GCA, xPts, Elo-rating og Brier-skår-kalibrering. Poisson er sannsynlighetsmotoren som binder de fleste tidligere metrikkene sammen når en forutsigelse må produseres.