Poissonova distribucija i modeliranje golova u nogometu
Ako ste ikad gledali emisiju s pregledima utakmica gdje voditelj kaže "ova utakmica ima 2,3 očekivana gola, što implicira 61% šanse za Više od 2,5", gledali ste Poissonovu aritmetiku na djelu. Ako ste vidjeli trojku vjerojatnosti (domaća pobjeda 58%, neriješeno 25%, gostujuća pobjeda 17%) koja kao da je došla niotkud, izračun koji ju je proizveo gotovo sigurno je bila Poissonova simulacija.
Poisson je statistički motor ispod većine nogometnih modela golova. Tu je 50 godina, tiho generirajući brojeve vjerojatnosti koji kasnije bivaju opisani modernijim rječnikom. Razumijevanje kako funkcionira demistificira mnogo onoga što "AI nogometno predviđanje" zapravo radi ispod haube.
Ovaj članak vodi kroz Poisson na jednostavnom jeziku, prikazuje kako se primjenjuje na nogomet specifično, gdje radi, gdje ne i koja moderna profinjenja dodaju iznad njega.
Što je Poisson zapravo
Poissonova distribucija opisuje vjerojatnost nekog broja događaja koji se zbivaju u fiksnom vremenskom prozoru, s obzirom na prosječnu stopu.
Formalno: ako se događaji zbivaju po konstantnoj prosječnoj stopi λ (lambda) po jedinici vremena i događaju se neovisno jedan o drugom, tada je vjerojatnost točno k događaja koji se zbivaju u tom prozoru:
P(k) = (λ^k × e^(-λ)) / k!
Ne morate voljeti matematiku. Praktično značenje:
- λ = 1 znači da se događaj prosječno zbiva jednom po prozoru. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 znači dvaput po prozoru. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 znači triput po prozoru. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Distribucija hvata da je prosjek jedna stvar, ali specifični ishodi grupiraju se oko tog prosjeka s poznatom vjerojatnošću. Kad je λ = 2, očekujete 2, ali 0 i 3 i 4 svi se događaju u značajnim postotcima vremena.
Zašto Poisson odgovara nogometnom postizanju golova
Tri razloga zašto pretpostavka grubo drži za nogomet.
Golovi su rijetki. Većina utakmica vidi 0-5 golova. Poisson čisto rješava raspon 0-5; raspada se na vrlo visokim brojevima, ali nogomet to rijetko testira.
Golovi se događaju u približno neovisnim trenutcima. Kad oduzmete efekte stanja igre (o kojima ćemo razgovarati), golovi unutar utakmice događaju se po približno konstantnoj stopi. Gol u 10. minuti ne mijenja vjerojatnost gola u 40. minuti tako oštro kao što biste mogli pomisliti.
Stopa se može izvesti iz kvalitete momčadi. Ako je prosječna stopa postizanja Momčadi A 1,5 golova/utakmici, a obrambena stopa Momčadi B prima 1,2 golova/utakmici, očekivani golovi za Momčad A u ovoj utakmici su neki vagani spoj (1,5 × 1,2 / ligaški prosjek, sa skaliranjem domaće prednosti). Poisson uzima taj λ i proizvodi punu distribuciju.
Spojite ovo i dobivate radni model: za svaku utakmicu izvedite očekivane stope za obje strane, primijenite Poisson na svaku da proizvedete distribucije broja golova, kombinirajte ih u matricu ishoda (domaća pobjeda / neriješeno / gostujuća pobjeda / Više od 2,5 / BTTS / itd.).
Kako Poisson gradi trojku vjerojatnosti
Za utakmicu između Momčadi A (očekivani golovi 1,8) i Momčadi B (očekivani golovi 1,2), simulacija:
- Koristeći Poisson s λ=1,8 za Momčad A, izračunajte P(Momčad A postigne 0), P(1), P(2), P(3), P(4), P(5+).
- Koristeći Poisson s λ=1,2 za Momčad B, izračunajte isto za Momčad B.
- Pretpostavljajući neovisnost (prva Poissonova pretpostavka), pomnožite: P(Momčad A postigne N i Momčad B postigne M) = P(A=N) × P(B=M).
- Zbrojite preko N > M za domaće pobjede, N = M za neriješene, N < M za gostujuće pobjede.
- Normalizirajte ako je potrebno.
Rezultat: trojka vjerojatnosti za utakmicu, izvedena u potpunosti iz dva broja očekivanih golova. Pristojno odgovara većini utakmica.
To je ono što "modeli predviđanja vođeni xG-om" obično jesu u svom najjednostavnijem obliku: dva broja unutra, distribucija vjerojatnosti vani, Poisson kao motor.
Gdje Poisson pada
Četiri stvarna načina otkaza koja moderno modeliranje pokušava ispraviti.
Ovisnost o stanju igre. Momčad koja juri zaostatak 0-1 u zadnjih 20 minuta igra drugačije. Njihova stopa golova raste iznad predutakmičkog očekivanja; stopa protivnika ostaje slična, ali obrambene pogreške pokreću primljene prilike. Neovisni Poisson s konstantnom stopom podcjenjuje frekvenciju preokreta i precjenjuje stabilnu dominaciju.
Inflacija neriješenih. U utakmicama s malo golova (λ ispod 1,5 po strani), Poisson istovremeno precjenjuje 1-1 i 0-0, podcjenjujući neriješene rezultate ukupno. Dixon i Coles predložili su 1997. ispravak koji prilagođava ćelije matrice ishoda s niskim rezultatima. Većina produkcijskih modela koristi Dixon-Coles ili slično.
Korelacija između momčadi. Golovi jedne momčadi nisu potpuno neovisni o golovima druge. Strana koja primi rano često pada u kvaliteti dok utakmica napreduje. Bivarijantni Poisson modeli dodaju mali parametar korelacije. Bez njega, zajednički ishodi tretiraju se previše neovisno.
Ekstremni rezultati. Desni rep Poissonovih distribucija (5-0, 6-0, 7-0) tanak je u sirovom Poissonu, ali se u praksi češće opaža u neujednačenim utakmicama. Moderni modeli primjenjuju ispravke repova ili koriste negativne binomne distribucije, koje imaju isti prosjek kao Poisson, ali dopuštaju više varijance.
Korisno pravilo: sirovi Poisson je korisna osnovica, ali produkcijski modeli uvijek dodaju profinjenja. Profinjenja ne mijenjaju interpretaciju (trojke vjerojatnosti, Više/Manje, BTTS), ali stežu brojeve prema stvarnosti.
Poisson izvan vjerojatnosti ishoda
Poissonova matematika omogućuje nekoliko nizvodnih mjera:
Očekivani bodovi (xPts). Za svaku utakmicu simulirajte distribuciju ishoda preko Poissona, izračunajte očekivane bodove za svaku stranu. Zbrojite preko sezone i imate xPts.
Očekivani golovi za/protiv kroz prozor. xG povijest momčadi u kombinaciji s Poissonom proizvodi distribuciju vjerojatnosti njezinih sezonskih ukupnih golova.
Pravedne linije azijskog hendikepa. Prevođenje xG-a u kvote azijskog hendikepa koristi Poissonovu simulaciju za distribuciju gol-razlike.
Više/Manje i BTTS vjerojatnosti. Sve se može izvesti iz matrice ishoda koju gradi Poissonova simulacija.
U stvari, kad imate xG po momčadi (ili očekivanu stopu postizanja), Poisson vam daje cijelu vjerojatnosnu površinu utakmice, ne samo trojku pobjeda/neriješeno/poraz.
Kako Tactiq rješava modeliranje golova u Poisson stilu
Tactiqova analiza koristi procjenu vjerojatnosti temeljenu na simulaciji kao dio pipelinea za proizvodnju trojki vjerojatnosti prikazanih na kartici utakmice. Specifičan pristup, profinjenja primijenjena preko osnovnog Poissona i kako simulacija rješava interakcije stanja igre i kvalitete protivnika ostaje unutar proizvoda.
Za korisnika, efekt je da tri vjerojatnosti na kartici utakmice odražavaju simuliranu distribuciju ishoda utemeljenu na procjenama očekivanih golova i signalima snage momčadi, a ne ručno kodirane heuristike. Indikator pouzdanja odražava koliko je distribucija osjetljiva na male promjene ulaznih signala za tu specifičnu utakmicu.
Što korisnik vidi na kartici utakmice:
- Trojke vjerojatnosti za ishod, proizvedene kroz simulaciju.
- Očekivani golovi za svaku stranu s nedavnim trendom.
- Pisana analiza koja imenuje ishod jednostavnim jezikom: "Domaća strana ulazi sa skromnom prednošću u očekivanim golovima, što se pretvara u otprilike 52-25-23 raspodjelu vjerojatnosti."
- Bez vanjskih tržišnih podataka bilo gdje. Bez preusmjeravanja na platforme trećih strana. Bez virtualne valute. Samo statistička analiza.
Zaključak
Poisson je statistički radni konj ispod većine nogometnog modeliranja golova. Dovoljno je jednostavan za brzo izračunavanje, dovoljno dobar da odgovara većini utakmica i temelj na kojem se grade sofisticiranija profinjenja (Dixon-Coles, bivarijantni, negativni binomni).
Razumijevanje Poissona demistificira trojke vjerojatnosti koje vidite na svakoj analitičkoj nadzornoj ploči. Nisu magija; simulacije su iz ulaza očekivanih golova. Ono što razdvaja dobre modele od loših su profinjenja koja ispravljaju poznate slabosti Poissona.
Tactiq koristi procjenu vjerojatnosti temeljenu na simulaciji s primijenjenim profinjenjima za rješavanje složenosti stvarnih utakmica. Analiza prikazuje kalibrirane trojke vjerojatnosti na svakoj kartici utakmice. Više od 1.200 natjecanja, lokalizacija na 32 jezika, besplatna razina od osam analiza dnevno, bez kartice.
Ako pratite seriju, rječnik mjerila sad obuhvaća kako AI predviđa nogometne utakmice, xG, xA, npxG, PPDA, Field Tilt, progresivne akcije, SCA/GCA, xPts, Elo rejtinge i Brier kalibraciju. Poisson je vjerojatnosni motor koji veže većinu prethodnih mjerila kad treba proizvesti predviđanje.