Poisson-fordeling og målmodellering i fodbold

Af Tactiq AI · 2026-05-07 · 9 min læsning · AI og Fodbold

Hvis du nogensinde har set et kamp-preview-program, hvor værten siger "dette opgør har en 2,3 forventet mål-linje, hvilket indebærer en 61% chance for Over 2,5", så så du Poisson-aritmetik i aktion. Hvis du har set en sandsynlighedstriplet (hjemmesejr 58%, uafgjort 25%, udesejr 17%), der så ud til at komme ud af det blå, var beregningen, der producerede den, næsten helt sikkert en Poisson-simulation.

Poisson er den statistiske motor under de fleste fodboldmålmodeller. Den har været der i 50 år og stille genereret de sandsynlighedstal, der senere bliver beskrevet med mere moderigtig vokabular. At forstå hvordan den virker afmystificerer meget af, hvad "AI-fodboldforudsigelse" faktisk laver under motorhjelmen.

Denne artikel gennemgår Poisson på almindeligt sprog, viser hvordan den anvendes specifikt på fodbold, hvor den virker, hvor den ikke virker, og hvilke moderne forfining der lægges oven på.

Hvad Poisson faktisk er

En Poisson-fordeling beskriver sandsynligheden for et bestemt antal begivenheder i et fast tidsvindue, givet en gennemsnitlig rate.

Formelt: hvis begivenheder sker med en konstant gennemsnitlig rate λ (lambda) per tidsenhed, og de sker uafhængigt af hinanden, er sandsynligheden for præcis k begivenheder i det vindue:

P(k) = (λ^k × e^(-λ)) / k!

Du behøver ikke elske matematikken. Den praktiske betydning:

  • λ = 1 betyder, at begivenheden gennemsnitligt sker en gang per vindue. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 betyder to gange per vindue. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 betyder tre gange per vindue. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Fordelingen fanger, at gennemsnittet er én ting, men specifikke udfald klynger sig omkring det gennemsnit med kendt sandsynlighed. Når λ = 2, forventer du 2, men 0 og 3 og 4 sker alle med meningsfulde procentdele af tiden.

Hvorfor Poisson passer til fodboldmålscoring

Tre grunde til at antagelsen omtrent holder for fodbold.

Mål er sjældne. De fleste kampe ser 0-5 mål. Poisson håndterer 0-5-intervallet rent; den brister ved meget høje tællinger, men fodbold tester sjældent det.

Mål sker på nogenlunde uafhængige tidspunkter. Når du fjerner spilstatuseffekter (som vi vil diskutere), sker mål inden for en kamp med en nogenlunde konstant rate. Et mål i det 10. minut ændrer ikke sandsynligheden for et mål i det 40. minut så skarpt, som du måske tror.

Raten kan udledes af holdkvalitet. Hvis hold A's gennemsnitlige scoringsrate er 1,5 mål/kamp, og hold B's defensive rate lukker 1,2 mål/kamp ind, er de forventede mål for hold A i dette opgør en vægtet blanding (1,5 × 1,2 / liga-gennemsnit, med hjemmebanefordel-skalering). Poisson tager det λ og producerer en fuld fordeling.

Kombiner disse, og du får en brugbar model: for hver kamp, udled forventede rater for begge sider, anvend Poisson på hver for at producere måltælle-fordelinger, kombinér dem til en udfaldsmatrix (hjemmesejr / uafgjort / udesejr / Over 2,5 / BTTS / osv.).

Hvordan Poisson bygger en sandsynlighedstriplet

For et opgør mellem hold A (forventede mål 1,8) og hold B (forventede mål 1,2), simulationen:

  1. Med Poisson med λ=1,8 for hold A, beregn P(hold A scorer 0), P(1), P(2), P(3), P(4), P(5+).
  2. Med Poisson med λ=1,2 for hold B, beregn det samme for hold B.
  3. Antag uafhængighed (den første Poisson-antagelse), gang: P(hold A scorer N og hold B scorer M) = P(A=N) × P(B=M).
  4. Summér over N > M for hjemmesejre, N = M for uafgjort, N < M for udesejre.
  5. Normalisér om nødvendigt.

Resultatet: sandsynlighedstriplet for kampen, helt afledt af to forventede-måltal. En anstændig pasform for de fleste kampe.

Det er, hvad "xG-drevne forudsigelsesmodeller" normalt er på deres enkleste: to tal ind, en sandsynlighedsfordeling ud, Poisson som motoren.

Hvor Poisson brister

Fire reelle fejlmodi, som moderne modellering forsøger at korrigere for.

Spilstatusafhængighed. Et hold der jagter et 0-1-underskud i de sidste 20 minutter spiller anderledes. Deres målrate stiger over forhåndsforventningen; deres modstanders rate forbliver lignende, men defensive fejl udløser indkasserede chancer. Uafhængig, konstant-rate Poisson underforudsiger comeback-frekvens og overforudsiger steady-state-dominans.

Uafgjort-inflation. I lavscoringskampe (λ under 1,5 per side) overforudsiger Poisson 1-1 og 0-0 samtidigt, mens den underforudsiger uafgjorte samlet. Dixon og Coles foreslog en korrektion i 1997, der justerer lavscoringscellerne i udfaldsmatrixen. De fleste produktionsmodeller bruger Dixon-Coles eller lignende.

Korrelation mellem hold. Et holds mål er ikke fuldt uafhængige af det andets. En side der lukker tidligt mål ind, falder ofte i kvalitet, efterhånden som kampen skrider frem. Bivariate Poisson-modeller tilføjer en lille korrelationsparameter. Uden den behandles fælles udfald for uafhængigt.

Ekstreme resultater. Højre hale af Poisson-fordelinger (5-0, 6-0, 7-0) er tynd i rå Poisson, men observeres oftere i praksis i mismatch. Moderne modeller anvender hale-korrektioner eller bruger negative binomialfordelinger, som har samme middel som Poisson, men tillader mere varians.

Den brugbare regel: rå Poisson er en nyttig baseline, men produktionsmodeller tilføjer altid forfining. Forfiningen ændrer ikke fortolkningen (sandsynlighedstripletter, Over/Under, BTTS), men de strammer tallene mod virkeligheden.

Poisson ud over udfaldssandsynligheder

Poisson-matematik muliggør flere downstream-metrikker:

Forventede point (xPts). For hver kamp, simulér udfaldsfordelingen via Poisson, beregn de forventede point for hver side. Summér over en sæson, og du har xPts.

Forventede mål for/imod over et vindue. Et holds xG-historik kombineret med Poisson producerer en sandsynlighedsfordeling af deres samlede sæsonmål.

Asian handicap-fair-linjer. At oversætte xG til asian handicap-odds bruger Poisson-simulation til målforskelsfordelingen.

Over/Under og BTTS-sandsynligheder. Alle afledelige fra udfaldsmatrixen, Poisson-simulationen bygger.

I praksis, når du har per-hold xG (eller forventet scoringsrate), giver Poisson dig hele kampens sandsynlighedsoverflade, ikke kun sejr/uafgjort/nederlag-tripletten.

Hvordan Tactiq håndterer Poisson-stil målmodellering

Tactiqs analyse bruger simulationsbaseret sandsynlighedsestimering som del af sin pipeline til at producere sandsynlighedstripletterne, der vises på kampkortet. Den specifikke fremgangsmåde, forfiningen anvendt over grundlæggende Poisson, og hvordan simulationen håndterer spilstatus- og modstanderkvalitet-interaktioner forbliver inden for produktet.

For brugeren er effekten, at de tre sandsynligheder på kampkortet reflekterer en simuleret udfaldsfordeling forankret i forventede-mål-estimater og holdstyrkesignaler snarere end håndkodede heuristikker. Tillidsindikatoren reflekterer hvor følsom fordelingen er over for små ændringer i inputsignalerne for netop dette opgør.

Hvad brugeren ser på kampkortet:

  • Sandsynlighedstripletter for udfaldet, produceret gennem simulation.
  • Forventede mål for hver side med en nyere trend.
  • En skreven analyse, der navngiver udfaldet i klart sprog: "Hjemmesiden går ind med en moderat fordel i forventede mål, hvilket oversættes til en omtrentlig 52-25-23 sandsynlighedsfordeling."
  • Ingen eksterne markedsdata nogen steder. Ingen omdirigeringer til tredjepartsplatforme. Ingen virtuel valuta. Kun statistisk analyse.

Konklusionen

Poisson er den statistiske arbejdshest under de fleste fodboldmålmodeller. Den er enkel nok til at beregne hurtigt, god nok til at passe til de fleste kampe og fundamentet, hvorpå mere sofistikerede forfining (Dixon-Coles, bivariat, negativ binomial) bygges.

At forstå Poisson afmystificerer sandsynlighedstripletterne, du ser på hvert analytics-dashboard. De er ikke magi; de er simulationer fra forventede-mål-input. Hvad der adskiller gode modeller fra dårlige er forfiningen, der korrigerer for Poissons kendte svagheder.

Tactiq bruger simulationsbaseret sandsynlighedsestimering med forfining anvendt til at håndtere virkelig-kamp-kompleksitet. Analysen viser kalibrerede sandsynlighedstripletter på hvert kampkort. Over 1.200 turneringer, 32-sprogs lokalisering, gratisniveau med otte analyser per dag, intet kreditkort krævet.

Hvis du har fulgt serien, dækker metrikvokabularet nu hvordan AI forudsiger fodboldkampe, xG, xA, npxG, PPDA, Field Tilt, progressive aktioner, SCA/GCA, xPts, Elo-ratings og Brier-score-kalibrering. Poisson er sandsynlighedsmotoren, der binder de fleste af de tidligere metrikker sammen, når en forudsigelse skal produceres.

Ofte stillede spørgsmål

Hvad er en Poisson-fordeling i én sætning?
Poisson beskriver hvor ofte en sjælden begivenhed sker i en fast periode, givet en gennemsnitlig rate. I fodbold er den 'sjældne begivenhed' et mål, den 'faste periode' er 90 minutter, og 'raten' er afledt af holdkvalitet, xG eller kampkontekst. Fordelingen fortæller dig sandsynligheden for 0 mål, 1 mål, 2 mål og så videre.
Hvorfor er Poisson standarden for fodboldmål?
Tre grunde. Mål er relativt sjældne (gennemsnit omkring 2,5 per kamp i topligaer). De sker på nogenlunde tilfældige tidspunkter inden for en kamp med lidt klyngedannelse, når man korrigerer for spilstatus. Og Poisson-matematikken er enkel nok til at beregne hurtigt, hvilket gør det praktisk at simulere tusindvis af mulige kampudfald. Kombinationen gør den til en arbejdshest for fodboldmodellering.
Hvad er inputtene til en Poisson-målmodel?
To rater: en for hvert hold. Den mest almindelige tilgang afleder raterne fra holdstyrke (angrebsrate minus modstanderens forsvarsrate, med hjemmebanefordel indbygget). Moderne varianter fodrer xG-per-kamp-værdier i stedet for sejrsbaserede rater, hvilket producerer mere responsive og præcise fordelinger.
Hvor brister Poisson?
Tre vigtigste fejlmodi. Sen-spil-status: et hold der jagter et underskud spiller anderledes end et der forsvarer en føring, så målraten er ikke konstant over 90 minutter. Korrelation mellem hold: hvis en side lukker et sent mål ind, lukker de ofte endnu et ind i samme fase, hvilket Poisson behandler som uafhængigt. Meget lave eller meget høje måltal: Poisson-halerne underrepræsenterer ekstreme udfald.
Bruger Tactiq Poisson direkte i analysen?
Simulationsbaseret sandsynlighedsestimering er en af flere teknikker, der bidrager til sandsynlighedstripletterne, der vises på kampkortet. Den specifikke simulationsfremgangsmåde, hvordan rater afledes, og hvordan modellen håndterer Poissons kendte svagheder forbliver inden for produktet. For brugeren er effekten, at de tre sandsynligheder på skærmen reflekterer en simuleret udfaldsfordeling, ikke en håndkodet regel.
Findes der bedre alternativer til Poisson?
Negativ binomial, bivariat Poisson, Dixon-Coles (som tilføjer korrelation for lavscoringskampe) og Skellam-fordelinger er alle blevet foreslået som forfining. Hver fanger en specifik svaghed ved grundlæggende Poisson på bekostning af yderligere kompleksitet. De fleste produktions-fodboldmodeller bruger en af disse forfining snarere end rå Poisson.