Poissonovo rozdelenie a modelovanie gólov vo futbale

Od Tactiq AI · 2026-05-07 · 9 min čítania · AI a Futbal

Ak ste niekedy sledovali zápasový náhľad, kde moderátor hovorí "tento zápas má hranicu očakávaných gólov 2,3, čo implikuje 61% šancu na Viac ako 2,5", sledovali ste Poissonovu aritmetiku v akcii. Ak ste videli trojicu pravdepodobností (výhra domácich 58%, remíza 25%, výhra hostí 17%), ktorá akoby vyšla odnikadiaľ, výpočet, ktorý ju produkoval, bola takmer určite Poissonova simulácia.

Poisson je štatistický motor pod väčšinou futbalových gólových modelov. Je tam už 50 rokov, ticho generujúci čísla pravdepodobnosti, ktoré sú neskôr opísané módnejším slovníkom. Pochopenie toho, ako funguje, demystifikuje veľa toho, čo "AI futbalová predikcia" v skutočnosti robí pod kapotou.

Tento článok prejde Poissonom v bežnom jazyku, ukáže, ako sa aplikuje konkrétne na futbal, kde funguje, kde nie, a aké moderné vylepšenia naňho pridávajú.

Čo Poisson skutočne je

Poissonovo rozdelenie opisuje pravdepodobnosť určitého počtu udalostí dejúcich sa v pevnom časovom okne pri danej priemernej miere.

Formálne: ak sa udalosti dejú s konštantnou priemernou mierou λ (lambda) na časovú jednotku a dejú sa nezávisle od seba, potom pravdepodobnosť presne k udalostí v tom okne je:

P(k) = (λ^k × e^(-λ)) / k!

Nemusíte milovať matematiku. Praktický význam:

  • λ = 1 znamená, že udalosť priemerne nastane raz za okno. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 znamená dvakrát za okno. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 znamená trikrát za okno. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Rozdelenie zachytáva, že priemer je jedna vec, ale konkrétne výsledky sa zhlukujú okolo priemeru s známou pravdepodobnosťou. Keď λ = 2, očakávate 2, ale 0 a 3 a 4 všetky nastanú vo významných percentách prípadov.

Prečo Poisson sedí pri strieľaní gólov vo futbale

Tri dôvody, prečo predpoklad zhruba platí pre futbal.

Góly sú vzácne. Väčšina zápasov vidí 0-5 gólov. Poisson čisto spracováva rozsah 0-5; zlyháva pri veľmi vysokých počtoch, ale futbal to zriedka testuje.

Góly sa dejú v zhruba nezávislých časoch. Akonáhle odstránite efekty stavu hry (o ktorých budeme diskutovať), góly v rámci zápasu sa dejú zhruba konštantnou mierou. Gól v 10. minúte nemení pravdepodobnosť gólu v 40. minúte tak ostro, ako by ste si mysleli.

Mieru možno odvodiť z kvality tímu. Ak je priemerná skórovacia miera tímu A 1,5 gólu na zápas a obranná miera tímu B inkasuje 1,2 gólu na zápas, očakávané góly pre tím A v tomto zápase sú nejakou váženou zmesou (1,5 × 1,2 / ligový priemer, so škálovaním domácou výhodou). Poisson vezme λ a vyprodukuje plné rozdelenie.

Skombinujte tieto a dostanete použiteľný model: pre každý zápas odvodíte očakávané miery pre obe strany, aplikujete Poissona na každú, aby ste vyprodukovali rozdelenia počtu gólov, kombinujete ich do výsledkovej matice (výhry domácich / remíza / výhry hostí / Viac ako 2,5 / BTTS / atď.).

Ako Poisson stavia trojicu pravdepodobností

Pre zápas medzi tímom A (očakávané góly 1,8) a tímom B (očakávané góly 1,2), simulácia:

  1. Použitím Poissona s λ=1,8 pre tím A, vypočítajte P(tím A skóruje 0), P(1), P(2), P(3), P(4), P(5+).
  2. Použitím Poissona s λ=1,2 pre tím B, vypočítajte to isté pre tím B.
  3. Predpokladajúc nezávislosť (prvý Poissonov predpoklad), násobte: P(tím A skóruje N a tím B skóruje M) = P(A=N) × P(B=M).
  4. Sčítajte cez N > M pre výhry domácich, N = M pre remízy, N < M pre výhry hostí.
  5. Normalizujte v prípade potreby.

Výsledok: trojica pravdepodobností pre zápas, odvodená úplne z dvoch čísel očakávaných gólov. Slušný fit pre väčšinu zápasov.

Toto sú "predikčné modely riadené xG" zvyčajne v ich najjednoduchšej forme: dve čísla dnu, rozdelenie pravdepodobnosti von, Poisson ako motor.

Kde Poisson zlyháva

Štyri skutočné módy zlyhania, ktoré moderné modelovanie skúša korigovať.

Závislosť od stavu hry. Tím dobiehajúci stratu 0-1 v posledných 20 minútach hrá inak. Ich gólová miera stúpa nad predzápasové očakávanie; miera ich súpera zostáva podobná, ale obranné chyby spúšťajú inkasované šance. Nezávislý Poisson s konštantnou mierou podpredpovedá frekvenciu obratu a nadpredpovedá ustálenú dominanciu.

Inflácia remíz. Pri nízkoskórovaných zápasoch (λ pod 1,5 na stranu) Poisson nadpredpovedá 1-1 a 0-0 zároveň, podpredpovedajúc remízy celkovo. Dixon a Coles navrhli korekciu v 1997, ktorá upravuje bunky nízkeho skóre vo výsledkovej matici. Väčšina produkčných modelov používa Dixon-Coles alebo podobné.

Korelácia medzi tímami. Góly jedného tímu nie sú úplne nezávislé od druhého. Strana, ktorá inkasuje skoro, často klesá v kvalite, ako zápas pokračuje. Bivariátne Poissonove modely pridávajú malý korelačný parameter. Bez neho sa spoločné výsledky berú príliš nezávisle.

Extrémne výsledky. Pravý chvost Poissonových rozdelení (5-0, 6-0, 7-0) je tenký v surovom Poissonovi, ale pozorovaný častejšie v praxi pri nepomerných zápasoch. Moderné modely aplikujú korekcie chvostov alebo používajú negatívne binomické rozdelenia, ktoré majú ten istý priemer ako Poisson, ale dovoľujú väčší rozptyl.

Použiteľné pravidlo: surový Poisson je užitočný základ, ale produkčné modely vždy pridávajú vylepšenia. Vylepšenia nemenia interpretáciu (trojice pravdepodobností, Viac/Menej, BTTS), ale tlačia čísla bližšie k realite.

Poisson nad rámec pravdepodobností výsledkov

Poissonova matematika umožňuje viacero následných metrík:

Očakávané body (xPts). Pre každý zápas simulujte rozdelenie výsledkov cez Poissona, vypočítajte očakávané body pre každú stranu. Spočítajte cez sezónu, máte xPts.

Očakávané góly za/proti cez okno. xG história tímu kombinovaná s Poissonom produkuje rozdelenie pravdepodobnosti ich sezónnych celkových gólov.

Spravodlivé hodnoty ázijského handicapu. Preklad xG do ázijských handicapových kurzov používa Poissonovu simuláciu pre rozdelenie rozdielu gólov.

Pravdepodobnosti Viac/Menej a BTTS. Všetky odvoditeľné z výsledkovej matice, ktorú Poissonova simulácia stavia.

V skutočnosti, akonáhle máte xG na tím (alebo očakávanú skórovaciu mieru), Poisson vám dáva celý povrch pravdepodobnosti zápasu, nie len trojicu výhra/remíza/prehra.

Ako Tactiq zaobchádza s modelovaním gólov v štýle Poissona

Analýza Tactiq používa odhad pravdepodobnosti založený na simulácii ako súčasť svojej pipeline na produkciu trojíc pravdepodobností zobrazených na karte zápasu. Konkrétny prístup, vylepšenia aplikované nad základným Poissonom, a ako simulácia spracováva interakcie stav hry-kvalita súpera, zostáva vnútri produktu.

Pre používateľa je efekt taký, že tri pravdepodobnosti na karte zápasu odrážajú simulované rozdelenie výsledkov založené na odhadoch očakávaných gólov a signáloch sily tímu, namiesto ručne kódovaných heuristík. Indikátor istoty odráža, ako citlivé je rozdelenie na malé zmeny vo vstupných signáloch pre tento konkrétny zápas.

Čo používateľ vidí na karte zápasu:

  • Trojicu pravdepodobností pre výsledok, vyprodukovanú cez simuláciu.
  • Očakávané góly pre každú stranu s nedávnym trendom.
  • Písomnú analýzu, ktorá pomenováva výsledok v bežnom jazyku: "Domáca strana vstupuje so skromnou výhodou v očakávaných góloch, čo sa premieta do zhruba 52-25-23 rozdelenia pravdepodobnosti."
  • Žiadne externé trhové dáta nikde. Žiadne presmerovania na platformy tretích strán. Žiadna virtuálna mena. Iba štatistická analýza.

Záver

Poisson je štatistický pracovný kôň pod väčšinou futbalového modelovania gólov. Je dosť jednoduchý na rýchly výpočet, dosť dobrý na fit väčšiny zápasov, a základ, na ktorom stavajú sofistikovanejšie vylepšenia (Dixon-Coles, bivariátny, negatívny binomický).

Pochopenie Poissona demystifikuje trojice pravdepodobností, ktoré vidíte na každom analytickom dashboarde. Nie sú to mágia; sú to simulácie zo vstupov očakávaných gólov. Čo oddeľuje dobré modely od zlých, sú vylepšenia, ktoré korigujú známe slabosti Poissona.

Tactiq používa odhad pravdepodobnosti založený na simulácii s vylepšeniami aplikovanými na spracovanie skutočnej zložitosti zápasov. Analýza zobrazuje kalibrované trojice pravdepodobností na každej karte zápasu. 1.200 a viac súťaží, lokalizácia do 32 jazykov, bezplatná úroveň ôsmich analýz denne, bez kreditnej karty.

Ak ste sledovali sériu, slovník metrík teraz pokrýva ako AI predikuje futbalové zápasy, xG, xA, npxG, PPDA, Field Tilt, progresívne akcie, SCA/GCA, xPts, Elo ratingy a kalibráciu Brier skóre. Poisson je pravdepodobnostný motor, ktorý spája väčšinu predchádzajúcich metrík dohromady, keď treba vyprodukovať predikciu.

Časté otázky

Čo je Poissonovo rozdelenie v jednej vete?
Poisson opisuje, ako často sa udeje vzácna udalosť za pevný čas pri danej priemernej miere. Vo futbale je 'vzácnou udalosťou' gól, 'pevným časom' je 90 minút a 'miera' je odvodená z kvality tímu, xG alebo kontextu zápasu. Rozdelenie vám hovorí pravdepodobnosť 0 gólov, 1 gólu, 2 gólov a tak ďalej.
Prečo je Poisson predvolený pre futbalové góly?
Tri dôvody. Góly sú relatívne vzácne (priemerne okolo 2,5 na zápas v top ligách). Dejú sa zhruba v náhodných časoch v rámci zápasu s malým zhlukovaním, akonáhle korigujete za stav hry. A Poissonova matematika je dosť jednoduchá na rýchly výpočet, takže je praktická pre simulovanie tisícov možných výsledkov zápasov. Kombinácia z neho robí pracovného koňa pre futbalové modelovanie.
Aké sú vstupy do Poissonovho gólového modelu?
Dve miery: jedna pre každý tím. Najbežnejší prístup odvodzuje miery zo sily tímu (útočná miera mínus obranná miera súpera, s domácou výhodou zapečenou). Moderné varianty kŕmia hodnoty xG na zápas namiesto mier založených na výhrach, produkujúce reagujúcejšie a presnejšie rozdelenia.
Kde Poisson zlyháva?
Tri hlavné módy zlyhania. Stav neskorej hry: tím dobiehajúci stratu hrá inak ako ten, ktorý bráni vedenie, takže gólová miera nie je konštantná počas 90 minút. Korelácia medzi tímami: ak strana inkasuje neskorý gól, často inkasuje ďalší v tej istej fáze, čo Poisson považuje za nezávislé. Veľmi nízko alebo veľmi vysoko skórované zápasy: Poissonove chvosty podreprezentujú extrémne výsledky.
Používa Tactiq Poissona priamo v analýze?
Odhad pravdepodobnosti založený na simulácii je jedna z viacerých techník, ktoré prispievajú k trojiciam pravdepodobností zobrazeným na karte zápasu. Konkrétny prístup k simulácii, ako sú miery odvodené, a ako model spracováva známe slabosti Poissona zostáva vnútri produktu. Pre používateľa je efekt taký, že tri pravdepodobnosti na obrazovke odrážajú simulované rozdelenie výsledkov, nie ručne kódované pravidlo.
Existujú lepšie alternatívy k Poissonovi?
Negatívne binomické, bivariátne Poisson, Dixon-Coles (ktoré pridáva koreláciu pre nízkoskórované zápasy) a Skellamove rozdelenia boli všetky navrhnuté ako vylepšenia. Každé zachytáva špecifickú slabosť základného Poissona za cenu ďalšej zložitosti. Väčšina produkčných futbalových modelov používa jedno z týchto vylepšení namiesto surového Poissona.