Scorul Brier explicat: cum sunt evaluate prognozele de fotbal
Majoritatea aplicațiilor de predicție fotbalistică promovează acuratețea. "70% precizie" sună impresionant. "80% dintre alegerile noastre principale au ieșit" sună și mai impresionant. Afirmațiile despre acuratețe domină spațiul. Sunt și aproape lipsite de sens.
Modul corect de a evalua un prognozator nu este acuratețea. Este calibrarea. Un prognozator ale cărui alegeri de probabilitate de 70% au dreptate în 70% din cazuri (nu 90%, nu 50%) își face treaba. Un prognozator ale cărui alegeri de 70% au dreptate în 85% din cazuri este sub-încrezător (probabil valoros), dar nu calibrat. Un prognozator ale cărui alegeri de 70% au dreptate în 55% din cazuri este zgomotos (probabil inutil).
Scorul Brier este metrica care evaluează calibrarea. Este standard în cercetarea academică a prognozei de 75 de ani și este modul în care orice prognozator de fotbal demn de ascultat este evaluat onest.
Acest articol parcurge ce măsoară de fapt Brier, cum să-l calculezi singur, care sunt punctele de referință și de ce calibrarea este semnalul pe care ar trebui să-l ceri de la orice instrument de predicție.
Ce măsoară de fapt Brier
Brier este un scor de eroare la pătrat între prognoză și realitate. Cu cât mai mic, cu atât mai bine calibrat.
Pentru rezultatele meciurilor cu trei căi (victorie gazdă, egal, victorie oaspete), fiecare meci produce trei numere de prognoză care însumează 1,0. Rezultatul real produce trei numere de 0 sau 1 (1 pentru rezultatul care s-a întâmplat, 0 pentru celelalte).
Formula per meci: Brier = Σ (prognoză - real)^2 / 3
Deci o prognoză de [0,60, 0,25, 0,15] pentru gazdă/egal/oaspete pentru un meci care s-a terminat cu victoria gazdei:
- Gazdă: (0,60 - 1,00)^2 = 0,16
- Egal: (0,25 - 0,00)^2 = 0,0625
- Oaspete: (0,15 - 0,00)^2 = 0,0225
- Sumă: 0,245
- Împărțit la 3: 0,0817
O prognoză care a spus [0,95, 0,03, 0,02] la același meci (gazda a câștigat):
- Sumă: 0,0025 + 0,0009 + 0,0004 = 0,0038
- Împărțit la 3: ≈ 0,0013
Prognoza încrezătoare corectă obține un scor mult mai bun. Dar prognoza încrezătoare greșită este pedepsită aspru:
- [0,95, 0,03, 0,02] pentru un meci care s-a terminat egal:
- Gazdă: (0,95 - 0)^2 = 0,9025
- Egal: (0,03 - 1)^2 = 0,9409
- Oaspete: (0,02 - 0)^2 = 0,0004
- Sumă: 1,8438
- Împărțit la 3: ≈ 0,6146, un dezastru
Încrederea este recompensată când este justificată și pedepsită când nu este. Mediată pe sute de meciuri, Brier separă automat prognozatorii calibrați de cei zgomotoși.
De ce calibrarea contează mai mult decât acuratețea
Să luăm doi prognozatori.
Prognozator A spune mereu 95% gazdă, 3% egal, 2% oaspete la fiecare meci de acasă al unei echipe din top șase. Are dreptate în aproximativ 60% din cazuri.
Prognozator B spune 62% gazdă, 24% egal, 14% oaspete pentru aceleași meciuri. Are dreptate în 62% din cazuri.
Care este mai bun? Din punct de vedere al acurateței, A este în față (60% vs 62% este apropiat). Din punct de vedere al calibrării, B este enorm de înainte. Alegerile de 95% ale lui A merg greșit în 40% din cazuri, ceea ce este teribil. Alegerile de 62% ale lui B merg corect în 62% din cazuri, ceea ce este onest.
Scorurile Brier îți spun care dintre ei citește semnalul de bază corect. Brier-ul lui A va fi groaznic deoarece probabilitățile de 95% se ridică la pătrat când sunt greșite. Brier-ul lui B va fi excelent deoarece probabilitățile se potrivesc cu realitatea.
Acest lucru contează în trei moduri practice:
Calibrarea riscului. Dacă folosești o predicție pentru a lua orice decizie ulterioară (chiar și un casual "care meci este cel mai interesant de urmărit"), să știi cât de fiabilă este probabilitatea contează. Un 95% de la un prognozator prost valorează mai puțin decât un 62% de la unul bun.
Compararea între prognozatori. Nu poți compara doi prognozatori pe acuratețea brută. Cineva care alege doar favoriții va părea mai "precis" decât cineva care include outsideri în prognozele sale. Brier funcționează indiferent de distribuția probabilităților.
Onestitate. Prognozatorii calibrați sunt mai puțin tentați să exagereze. Un prognozator care știe că va fi punctat după Brier nu se laudă. Un prognozator care știe că va fi punctat doar după acuratețe are stimulent să aleagă doar favoriții și să pompeze linia acurateței.
Puncte de referință Brier pentru fotbal
Puncte de referință brute pe Brier pentru rezultatele meciurilor cu trei căi (gazdă / egal / oaspete):
- Bază mereu egal (spune că fiecare meci este 33/33/33): aproximativ 0,25
- Bază probabilitate aleatorie: aproximativ 0,25
- Model de bază bazat pe formă (doar victorii-înfrângeri): aproximativ 0,225
- Model public decent folosind xG + formă: 0,195 până la 0,215
- Linie de închidere a caselor de pariuri: în jur de 0,195
- Model de elită cu date de eveniment + calibrare atentă: 0,185 până la 0,195
Scorurile sub 0,185 sunt rare; scorurile peste 0,22 sunt sub așteptări. Cea mai mare parte a muncii analitice serioase trăiește în intervalul 0,19 până la 0,21, aproape de dar de obicei fără a depăși piețele caselor de pariuri (care au presiune de preț și bani inteligenți ca mecanism de calibrare).
Cum gândește Tactiq Brier și calibrarea
Tactiq rulează urmărirea internă a calibrării pe rezultatele analizei pentru a confirma că indicatorii de încredere de pe cardurile de meci corespund frecvențelor reale ale rezultatelor la rata așteptată. Un indicator de încredere care spune "încredere ridicată" ar trebui să se mapeze pe meciuri în care probabilitatea de top se desfășoară cu adevărat la o rată ridicată. Un indicator de încredere care spune "strâns" ar trebui să se mapeze pe meciuri în care rezultatele sunt cu adevărat variabile.
Valorile Brier specifice, tablourile de bord ale calibrării și cadența de re-acordare rămân în interiorul produsului. Ceea ce ajunge la utilizator este o analiză calificată de încredere unde indicatorul de încredere a fost calibrat în raport cu rezultatele reale, în loc să fie inventat ca semnal de marketing. Metodologia publicată este copiată și miscalibrată în câteva săptămâni.
Ce vede utilizatorul pe cardul de meci:
- Triplete de probabilitate pentru rezultat, cu un indicator de încredere vizibil care se mapează pe o bandă de calibrare reală.
- Goluri așteptate pentru fiecare echipă.
- O analiză scrisă care explică citirea într-un limbaj clar.
- Niciun fel de date externe de piață. Niciun redirect către platforme terțe. Nicio monedă virtuală. Doar analiză statistică.
Indicatorul de încredere este mânerul orientat către utilizator pentru calibrare. "Încredere ridicată" înseamnă că semnalul este puternic; "strâns" înseamnă că rezultatele au fost cu adevărat variabile.
Concluzia
Scorul Brier este modul în care prognozatorii sunt evaluați cu adevărat. Un instrument care promovează acuratețea fără a arăta calibrarea îți cere să ai încredere în tiparul prognozatorului zgomotos. Un instrument care este dispus să fie evaluat pe calibrare, care afișează indicatori de încredere care reflectă cu adevărat variabilitatea rezultatelor, este cel care va rezista în timp.
Poți calcula Brier singur pentru predicțiile oricărui prognozator, dacă publică probabilitățile alături de rezultate. Formula este simplă, punctele de referință sunt bine cunoscute, iar nota onestă durează câteva minute de muncă cu foaia de calcul.
Tactiq construiește calibrarea în indicatorul de încredere orientat către utilizator și o validează intern. Analiza citește fiecare meci cu o încredere care se potrivește cu incertitudinea de bază, mai degrabă decât afirmații zgomotoase care nu supraviețuiesc examinării eșantionului. Peste 1.200 de competiții, localizare în 32 de limbi, nivel gratuit de opt analize pe zi, fără card de credit necesar.
Dacă ai urmărit seria, vocabularul metricilor acoperă acum cum prezice AI meciurile de fotbal, xG, xA, npxG, PPDA, Field Tilt, acțiunile progresive, SCA/GCA, xPts și ratingurile Elo. Brier li se alătură ca metrica meta care evaluează onestitatea fiecărei alte metrici.