Poisson-eloszlás és gól-modellezés a fociban
Ha valaha néztél egy meccs-előzetes műsort, ahol a házigazda azt mondja "ennek a meccsnek 2,3 várható-gól vonala van, ami 61% Over 2,5 esélyt jelent", Poisson-aritmetikát figyeltél munka közben. Ha láttál egy valószínűség-hármast (hazai győzelem 58%, döntetlen 25%, vendég győzelem 17%), ami a semmiből jött, a számítás, ami létrehozta, szinte biztosan egy Poisson-szimuláció volt.
A Poisson a statisztikai motor a legtöbb foci-gólmodell alatt. 50 éve ott van, csendben generálva a valószínűségi számokat, amelyeket később divatosabb szókinccsel írnak le. Hogyan működik annak megértése demisztifikál sokat abból, amit az "MI foci-előrejelzés" valójában csinál a motorháztető alatt.
Ez a cikk végigvezet a Poisson-on egyszerű nyelven, megmutatja, hogyan alkalmazzák kifejezetten a fociban, hol működik, hol nem, és milyen modern finomítások adnak hozzá.
Mi a Poisson valójában
A Poisson-eloszlás leírja annak valószínűségét, hogy bizonyos számú esemény történik egy rögzített időablakban, adott átlagos arány mellett.
Formálisan: ha az események egy konstans átlagos λ (lambda) arányban történnek időegységenként, és egymástól függetlenül történnek, akkor pontosan k esemény bekövetkezésének valószínűsége abban az ablakban:
P(k) = (λ^k × e^(-λ)) / k!
Nem kell szeretned a matematikát. A gyakorlati jelentés:
- λ = 1 azt jelenti, az esemény átlagosan egyszer történik ablakonként. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 azt jelenti, kétszer ablakonként. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 azt jelenti, háromszor ablakonként. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Az eloszlás megragadja, hogy az átlag egy dolog, de a konkrét kimenetek az átlag körül csoportosulnak ismert valószínűséggel. Amikor λ = 2, 2-t vársz, de a 0 és a 3 és a 4 mind érdemben jelentős százalékban történik.
Miért illeszkedik a Poisson a foci-gólszerzéshez
Három ok, amiért a feltételezés nagyjából tartja magát a fociban.
A gólok ritkák. A legtöbb meccsen 0-tól 5-ig terjedő gólszám van. A Poisson tisztán kezeli a 0-tól 5-ig terjedő tartományt; nagyon magas számoknál bukik meg, de a foci ritkán teszteli ezt.
A gólok nagyjából független időpontokban történnek. Miután lehántod a játékállapot-hatásokat (amit majd megbeszélünk), a gólok egy meccsen belül nagyjából konstans arányban történnek. Egy gól a 10. percben nem változtat egy gól valószínűségén a 40. percben olyan élesen, mint gondolnád.
Az arány csapatminőségből származtatható. Ha az A csapat átlagos gólszerzési aránya 1,5 gól/meccs, és a B csapat védekezési aránya 1,2 gólt enged be meccsenként, akkor az A csapat várható góljai ezen a meccsen valamilyen súlyozott keverék (1,5 × 1,2 / bajnoksági átlag, hazai-előny skálázással). A Poisson veszi ezt a λ-t és teljes eloszlást termel.
Kombinálj ezeket és kapsz egy működő modellt: minden meccsre származtass várható arányokat mindkét oldalra, alkalmazz Poisson-t mindegyikre, hogy gólszám-eloszlásokat termelj, kombináld ezeket egy kimeneti mátrixba (hazai győzelem / döntetlen / vendég győzelem / Over 2,5 / BTTS / stb.).
Hogyan épít fel a Poisson egy valószínűség-hármast
Egy A csapat (várható gólok 1,8) és B csapat (várható gólok 1,2) közötti meccsre a szimuláció:
- λ=1,8-as Poisson-nal A csapatra számold ki P(A csapat 0-t lő), P(1), P(2), P(3), P(4), P(5+).
- λ=1,2-es Poisson-nal B csapatra számold ki ugyanezt B csapatra.
- Függetlenséget feltételezve (az első Poisson-feltételezés), szorozd: P(A csapat N-et lő és B csapat M-et lő) = P(A=N) × P(B=M).
- Összegezd N > M-re hazai győzelmek, N = M-re döntetlenek, N < M-re vendég győzelmek esetén.
- Normalizálj, ha kell.
Az eredmény: valószínűség-hármas a meccsre, teljesen két várható-gól számból származtatva. Tisztességes illeszkedés a legtöbb meccshez.
Ezt csinálják az "xG-vezérelt előrejelzési modellek" a legegyszerűbb formájukban: két szám be, egy valószínűségi eloszlás ki, a Poisson mint motor.
Hol bukik meg a Poisson
Négy valódi hibamód, amit a modern modellezés próbál korrigálni.
Játékállapot-függés. Egy 0-1-es hátrányt üldöző csapat az utolsó 20 percben máshogy játszik. A gólarányuk a meccs előtti várakozás fölé emelkedik; az ellenfelük aránya hasonló marad, de a védekezési hibák kapott helyzeteket triggerelnek. A független, konstans-arányú Poisson alulbecsüli a fordítás-gyakoriságot és túlbecsüli a stabil-állapotú dominanciát.
Döntetlen-felfújás. Alacsony pontozású meccseken (λ 1,5 alatt oldalanként) a Poisson egyszerre túlbecsüli az 1-1-et és a 0-0-t, alulbecsülve a döntetleneket összesen. Dixon és Coles 1997-ben javasoltak egy korrekciót, amely beállítja a kimeneti mátrix alacsony-pontszámú celláit. A legtöbb gyártási modell Dixon-Coles-t vagy hasonlót használ.
Csapatok közötti korreláció. Az egyik csapat góljai nem teljesen függetlenek a másikétól. Egy oldal, ami korán kap, gyakran csökken minőségben, ahogy a meccs folytatódik. A kétváltozós Poisson-modellek kis korrelációs paramétert adnak hozzá. Enélkül a közös kimeneteket túl függetlenül kezelik.
Szélsőséges eredmények. A Poisson-eloszlások jobb farka (5-0, 6-0, 7-0) vékony a nyers Poisson-ban, de a gyakorlatban gyakrabban figyelhető meg eltérések esetén. A modern modellek farok-korrekciókat alkalmaznak vagy negatív binomiális eloszlásokat használnak, amelyeknek ugyanaz az átlaga mint a Poisson-nak, de több variancia megengedett.
A használható szabály: a nyers Poisson hasznos alapvonal, de a gyártási modellek mindig finomításokat adnak hozzá. A finomítások nem változtatják meg az értelmezést (valószínűség-hármasok, Over/Under, BTTS), de szorítják a számokat a valósághoz.
Poisson a kimeneteli valószínűségeken túl
A Poisson-matematika több későbbi mérőszámot tesz lehetővé:
Várt pontok (xPts). Minden meccsre szimuláld a kimeneti eloszlást Poisson-on át, számold ki a várt pontokat minden oldalra. Összegezd egy szezonra, és van xPts-od.
Várható lőtt/kapott gólok egy ablakon át. Egy csapat xG-történetét Poisson-nal kombinálva valószínűségi eloszlást termel a szezonbeli gólszámaikról.
Ázsiai handicap fair sorok. Az xG ázsiai handicap odds-okká fordítása Poisson-szimulációt használ a gólkülönbség-eloszláshoz.
Over/Under és BTTS valószínűségek. Mind levezethető a Poisson-szimuláció által épített kimeneti mátrixból.
Lényegében, ha van csapatonkénti xG-d (vagy várható gólszerzési arányod), a Poisson megadja a meccs teljes valószínűségi felületét, nem csak a győzelem/döntetlen/vereség hármast.
Hogyan kezeli a Tactiq a Poisson-stílusú gól-modellezést
A Tactiq elemzése szimuláció-alapú valószínűség-becslést használ a folyamatának részeként, hogy a meccskártyán megjelenő valószínűség-hármasokat termelje. A konkrét megközelítés, az alap Poisson-ra alkalmazott finomítások, és ahogy a szimuláció kezeli a játékállapot- és ellenfél-minőségi interakciókat, a terméken belül marad.
A felhasználó számára a hatás az, hogy a meccskártyán lévő három valószínűség egy várható-gól becslésekből és csapaterősség-jelekből megalapozott szimulált kimeneti eloszlást tükröz, nem pedig kézi heurisztikákat. A magabiztosság-jelző azt tükrözi, mennyire érzékeny az eloszlás kis változásokra a bemeneti jelekben erre a konkrét meccsre.
Amit a felhasználó lát a meccskártyán:
- Valószínűség-hármasok a kimenetelhez, szimuláción keresztül termelve.
- Várható gólok minden oldalra friss trenddel.
- Egy írott elemzés, amely megnevezi a kimenetelt egyszerű nyelven: "A hazai oldal szerény előnnyel lép pályára várható gólokban, ami nagyjából 52-25-23 valószínűségi felosztásra fordítódik."
- Sehol nincs külső piaci adat. Nincsenek átirányítások harmadik-fél platformokra. Nincs virtuális pénz. Csak statisztikai elemzés.
A lényeg
A Poisson a statisztikai igavonó a legtöbb foci-gólmodell alatt. Eléggé egyszerű ahhoz, hogy gyorsan számolható legyen, eléggé jó ahhoz, hogy a legtöbb meccshez illeszkedjen, és az alap, amelyre kifinomultabb finomítások (Dixon-Coles, kétváltozós, negatív binomiális) épülnek.
A Poisson megértése demisztifikálja a valószínűség-hármasokat, amiket minden elemzési panelen látsz. Nem varázslat; szimulációk várható-gól bemenetekből. Ami elválasztja a jó modelleket a rosszaktól, azok a finomítások, amelyek korrigálják a Poisson ismert gyengeségeit.
A Tactiq szimuláció-alapú valószínűség-becslést használ a valós-meccs komplexitás kezelésére alkalmazott finomításokkal. Az elemzés kalibrált valószínűség-hármasokat mutat minden meccskártyán. Több mint 1.200 verseny, 32 nyelvű lokalizáció, ingyenes szint napi nyolc elemzéssel, kártya nélkül.
Ha követted a sorozatot, a mérőszám-szótár most magában foglalja hogyan jósol az MI foci meccseket, xG, xA, npxG, PPDA, Pálya-billenés, progresszív akciók, SCA/GCA, xPts, Elo-értékek és Brier-pontszám kalibráció. A Poisson a valószínűségi motor, ami összeköti a legtöbb előző mérőszámot, amikor egy előrejelzést elő kell állítani.