Distribuția Poisson și modelarea golurilor în fotbal

De Tactiq AI · 2026-05-07 · 9 min citire · AI și Fotbal

Dacă ai urmărit vreodată un program de previzualizare a unui meci în care gazda spune "acest meci are o linie de goluri așteptate de 2,3, ceea ce implică o șansă de 61% pentru Peste 2,5", ai urmărit aritmetica Poisson în acțiune. Dacă ai văzut un triplet de probabilitate (victorie gazdă 58%, egal 25%, victorie oaspete 17%) care părea să apară din neant, calculul care l-a produs a fost aproape sigur o simulare Poisson.

Poisson este motorul statistic sub majoritatea modelelor de goluri din fotbal. A fost acolo de 50 de ani, generând în liniște numerele de probabilitate care mai târziu sunt descrise cu vocabular mai la modă. Înțelegerea modului în care funcționează demistifică o mare parte din ceea ce face de fapt "predicția fotbalului prin AI".

Acest articol parcurge Poisson într-un limbaj clar, arată cum este aplicat fotbalului în mod specific, unde funcționează, unde nu și ce adaugă rafinamentele moderne pe deasupra.

Ce este de fapt Poisson

O distribuție Poisson descrie probabilitatea unui anumit număr de evenimente care se întâmplă într-o fereastră de timp fixă, având o rată medie.

Formal: dacă evenimentele apar la o rată medie constantă λ (lambda) pe unitatea de timp și se întâmplă independent unele de altele, atunci probabilitatea ca exact k evenimente să apară în acea fereastră este:

P(k) = (λ^k × e^(-λ)) / k!

Nu trebuie să iubești matematica. Sensul practic:

  • λ = 1 înseamnă că evenimentul se medie o dată per fereastră. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 înseamnă de două ori per fereastră. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 înseamnă de trei ori per fereastră. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Distribuția captează că media este un singur lucru, dar rezultatele specifice se grupează în jurul acelei medii cu probabilitate cunoscută. Când λ = 2, te aștepți la 2, dar 0 și 3 și 4 toate se întâmplă în procente semnificative din timp.

De ce Poisson se potrivește marcării de goluri în fotbal

Trei motive pentru care presupunerea se menține aproximativ pentru fotbal.

Golurile sunt rare. Majoritatea meciurilor văd 0-5 goluri. Poisson gestionează curat intervalul 0-5; se rupe la numere foarte mari, dar fotbalul rar testează asta.

Golurile se întâmplă la momente aproximativ independente. Odată ce elimini efectele de stare a jocului (despre care vom discuta), golurile dintr-un meci se întâmplă la o rată aproximativ constantă. Un gol în minutul 10 nu schimbă probabilitatea unui gol în minutul 40 atât de net cât ai putea crede.

Rata poate fi derivată din calitatea echipei. Dacă rata medie de marcare a Echipei A este 1,5 goluri/meci și rata defensivă a Echipei B primește 1,2 goluri/meci, golurile așteptate pentru Echipa A în acest meci sunt un amestec ponderat (1,5 × 1,2 / media ligii, cu scalare de avantaj al terenului propriu). Poisson ia acel λ și produce o distribuție completă.

Combină aceste trei și obții un model funcțional: pentru fiecare meci, derivă ratele așteptate pentru ambele părți, aplică Poisson la fiecare pentru a produce distribuții de numărare a golurilor, combină-le într-o matrice de rezultate (gazdă câștigă / egal / oaspete câștigă / Peste 2,5 / BTTS / etc.).

Cum construiește Poisson un triplet de probabilitate

Pentru un meci între Echipa A (goluri așteptate 1,8) și Echipa B (goluri așteptate 1,2), simularea:

  1. Folosind Poisson cu λ=1,8 pentru Echipa A, calculează P(Echipa A marchează 0), P(1), P(2), P(3), P(4), P(5+).
  2. Folosind Poisson cu λ=1,2 pentru Echipa B, calculează același lucru pentru Echipa B.
  3. Presupunând independență (prima presupunere Poisson), înmulțește: P(Echipa A marchează N și Echipa B marchează M) = P(A=N) × P(B=M).
  4. Însumează pe N > M pentru victorii ale gazdelor, N = M pentru egaluri, N < M pentru victorii ale oaspeților.
  5. Normalizează dacă este nevoie.

Rezultatul: triplet de probabilitate pentru meci, derivat în întregime din două numere de goluri așteptate. O potrivire decentă pentru majoritatea meciurilor.

Asta sunt de obicei "modelele de predicție bazate pe xG" la cea mai simplă formă: două numere intrare, o distribuție de probabilitate ieșire, Poisson ca motor.

Unde se rupe Poisson

Patru moduri reale de eșec pe care modelarea modernă încearcă să le corecteze.

Dependența de starea jocului. O echipă care urmărește un deficit de 0-1 în ultimele 20 de minute joacă diferit. Rata sa de gol crește peste așteptarea pre-meci; rata adversarului rămâne similară, dar greșelile defensive declanșează ocazii primite. Poisson independent, cu rată constantă, sub-prezice frecvența reveniilor și supra-prezice dominanța la stare staționară.

Inflația egalurilor. În meciurile cu puține goluri (λ sub 1,5 pe parte), Poisson supra-prezice 1-1 și 0-0 simultan, sub-prezicând egalurile în general. Dixon și Coles au propus o corecție în 1997 care ajustează celulele cu scor mic ale matricei rezultatelor. Majoritatea modelelor de producție folosesc Dixon-Coles sau similar.

Corelația între echipe. Golurile unei echipe nu sunt complet independente de cele ale celeilalte. O parte care primește devreme adesea scade în calitate pe măsură ce meciul continuă. Modelele Poisson bivariate adaugă un mic parametru de corelație. Fără el, rezultatele comune sunt tratate prea independent.

Scoruri extreme. Coada dreaptă a distribuțiilor Poisson (5-0, 6-0, 7-0) este subțire în Poisson brut, dar observată mai des în practică în meciurile dezechilibrate. Modelele moderne aplică corecții de coadă sau folosesc distribuții binomiale negative, care au aceeași medie ca Poisson, dar permit mai multă varianță.

Regula utilizabilă: Poisson brut este o bază utilă, dar modelele de producție adaugă întotdeauna rafinamente. Rafinamentele nu schimbă interpretarea (triplete de probabilitate, Peste/Sub, BTTS), dar strâng numerele față de realitate.

Poisson dincolo de probabilitățile rezultatelor

Matematica Poisson permite mai multe metrici descendente:

Puncte așteptate (xPts). Pentru fiecare meci, simulează distribuția rezultatelor prin Poisson, calculează punctele așteptate pentru fiecare parte. Însumează pe sezon, ai xPts.

Goluri așteptate pentru/împotriva pe o fereastră. Istoricul xG al unei echipe combinat cu Poisson produce o distribuție de probabilitate a totalurilor sale de goluri pe sezon.

Linii corecte de handicap asiatic. Traducerea xG în cote de handicap asiatic folosește simularea Poisson pentru distribuția diferenței de goluri.

Probabilități Peste/Sub și BTTS. Toate derivabile din matricea rezultatelor pe care o construiește simularea Poisson.

În efect, odată ce ai xG per echipă (sau rata așteptată de marcare), Poisson îți oferă întreaga suprafață de probabilitate a meciului, nu doar tripletul victorie/egal/înfrângere.

Cum gestionează Tactiq modelarea golurilor în stil Poisson

Analiza Tactiq folosește estimarea probabilității bazată pe simulare ca parte a pipeline-ului său pentru producerea tripletelor de probabilitate afișate pe cardul de meci. Abordarea specifică, rafinamentele aplicate peste Poisson de bază și modul în care simularea gestionează interacțiunile dintre starea jocului și calitatea adversarului rămân în interiorul produsului.

Pentru utilizator, efectul este că cele trei probabilități de pe cardul de meci reflectă o distribuție simulată a rezultatelor ancorată în estimări de goluri așteptate și semnale de putere a echipei, în loc de euristici codate manual. Indicatorul de încredere reflectă cât de sensibilă este distribuția la mici schimbări în semnalele de intrare pentru acel meci specific.

Ce vede utilizatorul pe cardul de meci:

  • Triplete de probabilitate pentru rezultat, produse prin simulare.
  • Goluri așteptate pentru fiecare echipă cu un trend recent.
  • O analiză scrisă care numește rezultatul în limbaj clar: "Gazda intră cu un avantaj modest în goluri așteptate, ceea ce se traduce într-o împărțire de probabilitate aproximativ 52-25-23."
  • Niciun fel de date externe de piață. Niciun redirect către platforme terțe. Nicio monedă virtuală. Doar analiză statistică.

Concluzia

Poisson este calul de povară statistic sub majoritatea modelării golurilor din fotbal. Este suficient de simplu pentru a calcula rapid, suficient de bun pentru a se potrivi majorității meciurilor și fundația pe care se construiesc rafinamente mai sofisticate (Dixon-Coles, bivariat, binomial negativ).

Înțelegerea Poisson demistifică tripletele de probabilitate pe care le vezi pe fiecare tablou de bord analitic. Nu sunt magie; sunt simulări din intrările de goluri așteptate. Ceea ce separă modelele bune de cele rele sunt rafinamentele care corectează slăbiciunile cunoscute ale Poisson.

Tactiq folosește estimarea probabilității bazată pe simulare cu rafinamente aplicate pentru a gestiona complexitatea reală a meciurilor. Analiza afișează triplete de probabilitate calibrate pe fiecare card de meci. Peste 1.200 de competiții, localizare în 32 de limbi, nivel gratuit de opt analize pe zi, fără card de credit necesar.

Dacă ai urmărit seria, vocabularul metricilor se întinde acum pe cum prezice AI meciurile de fotbal, xG, xA, npxG, PPDA, Field Tilt, acțiunile progresive, SCA/GCA, xPts, ratingurile Elo și calibrarea scorului Brier. Poisson este motorul probabilității care leagă majoritatea metricilor anterioare împreună atunci când trebuie produsă o predicție.

Întrebări frecvente

Ce este o distribuție Poisson într-o singură propoziție?
Poisson descrie cât de des se întâmplă un eveniment rar într-o perioadă fixă, având o rată medie. În fotbal, 'evenimentul rar' este un gol, 'perioada fixă' este 90 de minute, iar 'rata' este derivată din calitatea echipei, xG sau contextul meciului. Distribuția îți spune probabilitatea a 0 goluri, 1 gol, 2 goluri și așa mai departe.
De ce Poisson este implicit pentru golurile din fotbal?
Trei motive. Golurile sunt relativ rare (medie în jur de 2,5 pe meci în ligile de top). Se întâmplă la momente aproximativ aleatorii într-un meci, cu puțină grupare odată ce corectezi pentru starea jocului. Iar matematica Poisson este suficient de simplă pentru a calcula rapid, ceea ce o face practică pentru simularea miilor de rezultate posibile ale meciului. Combinația o face un cal de povară pentru modelarea fotbalului.
Care sunt intrările unui model Poisson de goluri?
Două rate: una pentru fiecare echipă. Cea mai obișnuită abordare derivă ratele din puterea echipei (rata de atac minus rata de apărare a adversarului, cu avantajul terenului propriu inclus). Variantele moderne folosesc valori xG-pe-meci în loc de rate bazate pe victorii, producând distribuții mai receptive și mai exacte.
Unde se rupe Poisson?
Trei moduri principale de eșec. Starea de joc târziu: o echipă care urmărește un deficit joacă diferit față de una care apără un avantaj, deci rata de gol nu este constantă pe parcursul a 90 de minute. Corelația între echipe: dacă o parte primește un gol târziu, adesea primește altul în aceeași fază, ceea ce Poisson tratează ca independent. Meciuri cu foarte puține sau foarte multe goluri: cozile Poisson sub-reprezintă rezultatele extreme.
Folosește Tactiq Poisson direct în analiză?
Estimarea probabilității bazată pe simulare este una dintre mai multe tehnici care contribuie la tripletele de probabilitate afișate pe cardul de meci. Abordarea specifică de simulare, cum sunt derivate ratele și cum gestionează modelul slăbiciunile cunoscute ale Poisson rămân în interiorul produsului. Pentru utilizator, efectul este că cele trei probabilități de pe ecran reflectă o distribuție simulată a rezultatelor, nu o regulă codată manual.
Există alternative mai bune la Poisson?
Negativ binomial, Poisson bivariat, Dixon-Coles (care adaugă corelație pentru meciurile cu puține goluri) și distribuțiile Skellam au fost toate propuse ca rafinamente. Fiecare captează o slăbiciune specifică a Poisson de bază cu costul unei complexități suplimentare. Majoritatea modelelor de fotbal de producție folosesc unul dintre aceste rafinamente în loc de Poisson brut.