Poisson-verdeling en doelpuntmodellering in voetbal
Als je ooit een wedstrijdvooruitblik hebt bekeken waarin de host zegt "deze wedstrijd heeft een verwacht doelpuntenlijn van 2,3, wat een kans van 61 procent op Boven 2,5 impliceert", dan keek je naar Poisson-rekenkunde in actie. Als je een waarschijnlijkheidsdrietal (thuiszege 58 procent, gelijk 25 procent, uitzege 17 procent) hebt gezien dat uit het niets leek te komen, was de berekening die het produceerde vrijwel zeker een Poisson-simulatie.
Poisson is de statistische motor onder de meeste voetbaldoelpuntmodellen. Hij is er al 50 jaar, geruisloos genererend de waarschijnlijkheidsgetallen die later met modieuzer vocabulaire beschreven worden. Begrijpen hoe het werkt ontmaskert veel van wat "AI-voetbalvoorspelling" eigenlijk onder de motorkap doet.
Dit artikel loopt door Poisson in heldere taal, toont hoe het specifiek op voetbal toegepast wordt, waar het werkt, waar niet, en wat moderne verfijningen erbovenop voegen.
Wat Poisson eigenlijk is
Een Poisson-verdeling beschrijft de waarschijnlijkheid van een bepaald aantal gebeurtenissen in een vast tijdvenster, gegeven een gemiddelde frequentie.
Formeel: als gebeurtenissen optreden met een constante gemiddelde frequentie λ (lambda) per tijdseenheid, en ze gebeuren onafhankelijk van elkaar, dan is de waarschijnlijkheid van precies k gebeurtenissen in dat venster:
P(k) = (λ^k × e^(-λ)) / k!
Je hoeft de wiskunde niet te liefhebben. De praktische betekenis:
- λ = 1 betekent dat de gebeurtenis gemiddeld eenmaal per venster optreedt. P(0) ≈ 37 procent, P(1) ≈ 37 procent, P(2) ≈ 18 procent, P(3) ≈ 6 procent, P(4+) ≈ 2 procent.
- λ = 2 betekent tweemaal per venster. P(0) ≈ 14 procent, P(1) ≈ 27 procent, P(2) ≈ 27 procent, P(3) ≈ 18 procent, P(4) ≈ 9 procent, P(5+) ≈ 5 procent.
- λ = 3 betekent driemaal per venster. P(0) ≈ 5 procent, P(1) ≈ 15 procent, P(2) ≈ 22 procent, P(3) ≈ 22 procent, P(4) ≈ 17 procent, P(5+) ≈ 19 procent.
De verdeling vangt dat het gemiddelde één ding is, maar specifieke uitkomsten clusteren rond dat gemiddelde met bekende waarschijnlijkheid. Wanneer λ = 2, verwacht je 2, maar 0 en 3 en 4 gebeuren allemaal in betekenisvolle percentages.
Waarom Poisson past bij voetbaldoelpunten
Drie redenen waarom de aanname ruwweg standhoudt voor voetbal.
Doelpunten zijn zeldzaam. De meeste wedstrijden zien 0-5 doelpunten. Poisson hanteert de 0-5 reeks netjes; het valt uiteen bij heel hoge tellingen, maar voetbal stelt dat zelden op de proef.
Doelpunten gebeuren op ruwweg onafhankelijke tijdstippen. Zodra je wedstrijdsituatie-effecten wegstript (waar we het over zullen hebben), gebeuren doelpunten binnen een wedstrijd op een ruwweg constante frequentie. Een doelpunt in de 10e minuut verandert de waarschijnlijkheid van een doelpunt in de 40e minuut niet zo scherp als je zou denken.
De frequentie kan worden afgeleid uit ploegkwaliteit. Als de gemiddelde scoringsfrequentie van Ploeg A 1,5 doelpunten per wedstrijd is en de defensieve frequentie van Ploeg B 1,2 doelpunten per wedstrijd toelaat, zijn de verwachte doelpunten voor Ploeg A in deze wedstrijd een gewogen mengsel (1,5 × 1,2 / competitiegemiddelde, met thuisvoordeel-schaling). Poisson neemt die λ en produceert een volledige verdeling.
Combineer deze en je krijgt een werkbaar model: voor elke wedstrijd verwachte frequenties voor beide kanten afleiden, Poisson op elk toepassen om doelpunttellingsverdelingen te produceren, deze combineren tot een uitkomstmatrix (thuiszeges / gelijk / uitzeges / Boven 2,5 / BTTS / enz.).
Hoe Poisson een waarschijnlijkheidsdrietal bouwt
Voor een wedstrijd tussen Ploeg A (verwachte doelpunten 1,8) en Ploeg B (verwachte doelpunten 1,2), de simulatie:
- Met Poisson met λ=1,8 voor Ploeg A, bereken P(Ploeg A scoort 0), P(1), P(2), P(3), P(4), P(5+).
- Met Poisson met λ=1,2 voor Ploeg B, bereken hetzelfde voor Ploeg B.
- Aannemende onafhankelijkheid (de eerste Poisson-aanname), vermenigvuldig: P(Ploeg A scoort N en Ploeg B scoort M) = P(A=N) × P(B=M).
- Som over N > M voor thuiszeges, N = M voor gelijkspel, N < M voor uitzeges.
- Normaliseer indien nodig.
Het resultaat: waarschijnlijkheidsdrietal voor de wedstrijd, volledig afgeleid van twee verwachte-doelpuntengetallen. Een behoorlijke pasvorm voor de meeste wedstrijden.
Dit is wat "xG-gedreven voorspellingsmodellen" gewoonlijk in hun eenvoudigste vorm zijn: twee getallen erin, een waarschijnlijkheidsverdeling eruit, Poisson als motor.
Waar Poisson uiteenvalt
Vier echte faalmodi die moderne modellering probeert te corrigeren.
Wedstrijdsituatie-afhankelijkheid. Een ploeg die een 0-1 achterstand achtervolgt in de laatste 20 minuten speelt anders. Hun doelpuntfrequentie stijgt boven de voor-de-wedstrijd verwachting; de frequentie van hun tegenstander blijft vergelijkbaar maar defensieve fouten triggeren toegelaten kansen. Onafhankelijke, constante-frequentie Poisson voorspelt comebackfrequentie te laag en stabiele dominantie te hoog.
Gelijkspelinflatie. In wedstrijden met weinig doelpunten (λ onder 1,5 per kant) voorspelt Poisson 1-1 en 0-0 simultaan te hoog, met een gelijkspeltotaal dat over het geheel onderschat wordt. Dixon en Coles stelden in 1997 een correctie voor die de cellen met lage scores van de uitkomstmatrix aanpast. De meeste productiemodellen gebruiken Dixon-Coles of vergelijkbaar.
Correlatie tussen ploegen. De doelpunten van één ploeg zijn niet volledig onafhankelijk van die van de andere. Een kant die vroeg incasseert daalt vaak in kwaliteit naarmate de wedstrijd vordert. Bivariate Poisson-modellen voegen een kleine correlatieparameter toe. Zonder dit worden gezamenlijke uitkomsten te onafhankelijk behandeld.
Extreme uitslagen. De rechterstaart van Poisson-verdelingen (5-0, 6-0, 7-0) is dun in ruwe Poisson maar in de praktijk vaker waargenomen bij ongelijke confrontaties. Moderne modellen passen staartcorrecties toe of gebruiken negatieve binomiale verdelingen, die hetzelfde gemiddelde als Poisson hebben maar meer variantie toelaten.
De bruikbare regel: ruwe Poisson is een nuttige basislijn maar productiemodellen voegen altijd verfijningen toe. De verfijningen veranderen de interpretatie niet (waarschijnlijkheidsdrietallen, Boven/Onder, BTTS) maar ze trekken de getallen strakker tegen de werkelijkheid.
Poisson voorbij uitkomstwaarschijnlijkheden
Poisson-wiskunde maakt verschillende afgeleide metrieken mogelijk:
Verwachte punten (xPts). Voor elke wedstrijd, simuleer de uitkomstverdeling via Poisson, bereken de verwachte punten voor elke kant. Sommeer over een seizoen, je hebt xPts.
Verwachte doelpunten voor/tegen over een venster. De xG-historie van een ploeg gecombineerd met Poisson produceert een waarschijnlijkheidsverdeling van hun seizoenstotaal aan doelpunten.
Aziatische handicap eerlijke lijnen. xG vertalen naar Aziatische handicap-quoteringen gebruikt Poisson-simulatie voor de doelpuntverschilverdeling.
Boven/Onder en BTTS-waarschijnlijkheden. Allemaal afleidbaar uit de uitkomstmatrix die de Poisson-simulatie bouwt.
In feite, zodra je per-ploeg xG (of verwachte scoringsfrequentie) hebt, geeft Poisson je het volledige waarschijnlijkheidsoppervlak van de wedstrijd, niet alleen het winst/gelijk/verlies-drietal.
Hoe Tactiq Poisson-stijl doelpuntmodellering hanteert
De analyse van Tactiq gebruikt op simulatie gebaseerde waarschijnlijkheidsschatting als deel van haar pijplijn voor het produceren van de waarschijnlijkheidsdrietallen op de wedstrijdkaart. De specifieke aanpak, de verfijningen toegepast over basis-Poisson, en hoe de simulatie omgaat met wedstrijdsituatie- en tegenstanderkwaliteit-interacties blijven binnen het product.
Voor de gebruiker is het effect dat de drie waarschijnlijkheden op de wedstrijdkaart een gesimuleerde uitkomstverdeling weergeven gegrond in verwachte-doelpuntenschattingen en ploegsterktesignalen, in plaats van handgecodeerde heuristieken. De vertrouwensindicator weerspiegelt hoe gevoelig de verdeling is voor kleine veranderingen in de invoersignalen voor die specifieke wedstrijd.
Wat de gebruiker op de wedstrijdkaart ziet:
- Waarschijnlijkheidsdrietallen voor de uitkomst, geproduceerd via simulatie.
- Verwachte doelpunten voor elke kant met een recente trend.
- Een geschreven analyse die de uitkomst in heldere taal benoemt: "Thuisploeg gaat erin met een bescheiden voorsprong in verwachte doelpunten, wat zich vertaalt naar een ruwweg 52-25-23 waarschijnlijkheidsverdeling."
- Geen externe marktdata. Geen doorverwijzingen naar derdenplatformen. Geen virtuele valuta. Alleen statistische analyse.
De kern
Poisson is het statistische werkpaard onder de meeste voetbaldoelpuntmodellering. Hij is eenvoudig genoeg om snel te berekenen, goed genoeg om bij de meeste wedstrijden te passen, en de fundering waarop meer geavanceerde verfijningen (Dixon-Coles, bivariate, negatieve binomiaal) bouwen.
Poisson begrijpen ontmaskert de waarschijnlijkheidsdrietallen die je op elk analyticsdashboard ziet. Het is geen magie; het zijn simulaties van verwachte-doelpunteninvoeren. Wat goede modellen scheidt van slechte zijn de verfijningen die voor Poisson's bekende zwaktes corrigeren.
Tactiq gebruikt op simulatie gebaseerde waarschijnlijkheidsschatting met verfijningen toegepast om echte wedstrijdcomplexiteit te hanteren. De analyse haalt gekalibreerde waarschijnlijkheidsdrietallen op elke wedstrijdkaart naar boven. Meer dan 1.200 competities, lokalisatie in 32 talen, gratis laag van acht analyses per dag, geen kaart vereist.
Als je de reeks gevolgd hebt, dekt het metriekenvocabulaire nu hoe AI voetbalwedstrijden voorspelt, xG, xA, npxG, PPDA, Field Tilt, progressieve acties, SCA/GCA, xPts, Elo-ratings en Brier-score-kalibratie. Poisson is de waarschijnlijkheidsmotor die de meeste vorige metrieken aan elkaar bindt wanneer een voorspelling geproduceerd moet worden.