Brier-score uitgelegd: hoe voetbalvoorspellingen worden beoordeeld

Veelgestelde vragen

Wat is een Brier-score in één zin?
De Brier-score meet hoe ver de waarschijnlijkheidsschattingen van een voorspeller afliggen van de werkelijkheid, gemiddeld over al hun voorspellingen. Lager is beter. Een perfecte voorspeller scoort 0; een muntwerper scoort rond de 0,25 op driewegvoetbaluitkomsten.
Hoe wordt ze eigenlijk berekend?
Voor elke wedstrijd neem je de waarschijnlijkheid die de voorspeller toekent aan elke uitkomst (thuis, gelijk, uit) en het werkelijke resultaat (1 voor de uitkomst die plaatsvond, 0 voor de andere). Bereken (voorspelling minus werkelijkheid) in het kwadraat voor elke uitkomst, tel ze op, deel door het aantal uitkomsten. Gemiddeld dat over alle wedstrijden. Hoe lager het resulterende getal, hoe nauwer de waarschijnlijkheden van de voorspeller bij de werkelijkheid aansluiten.
Waarom is kalibratie belangrijker dan nauwkeurigheid?
Een 'nauwkeurige' voorspeller heeft misschien de bovenste keuze in 60 procent van de gevallen goed. Maar wat je echt wilt is een voorspeller wiens 70-procentkeuzes in 70 procent van de gevallen kloppen en wiens 45-procentkeuzes in 45 procent kloppen. Een voorspeller die over alles '90 procent' zegt en in 60 procent van de gevallen gelijk heeft is luid. Een gekalibreerde voorspeller laat het vertrouwen samenvallen met de werkelijkheid.
Publiceert Tactiq haar Brier-score?
Tactiq voert intern kalibratiecontrole uit op haar analyse-uitvoer om te bevestigen dat de vertrouwensindicatoren overeenkomen met werkelijke uitkomsten in de verwachte verhouding. De specifieke methodologie en de actuele Brier-scorewaarden blijven binnen het product. Voor de gebruiker komt het effect tot uiting in een vertrouwensindicator op elke analyse die echt weergeeft hoe onzeker de lezing is.
Wat is een goede Brier-score voor voetbal?
Voor driewegmatchuitkomsten scoort een naïeve muntwerp-benchmark ongeveer 0,25 Brier. Een bookmakermarkt scoort rond de 0,195. Een goed gebouwd voetbalmodel scoort in de 0,19 tot 0,21 reeks. Alles onder 0,19 op een grote steekproef is elite. Alles boven 0,22 presteert ondermaats. Dit zijn richtcijfers; exacte drempels hangen af van competitiemix en steekproefgrootte.
Kan ik mijn eigen Brier-score op voorspellingen berekenen?
Ja. Je hebt een lijst van voorspelde waarschijnlijkheden (thuis/gelijk/uit per wedstrijd) en het werkelijke resultaat nodig. Pas de formule toe, middel over wedstrijden, vergelijk met de bovenstaande benchmarks. Als je dit regelmatig tegen elke tool of tipgever doet, krijg je een eerlijk cijfer dat niet leunt op marketingbeweringen.