Brierjeva ocena razložena: kako se nogometne napovedi ocenjujejo
Večina nogometnih napovednih aplikacij oglašuje natančnost. "70% natančno" zveni impresivno. "80% naših prvih izborov je prišlo skozi" zveni še bolj impresivno. Trditve o natančnosti prevladujejo na področju. So tudi skoraj brez pomena.
Pravi način ocenjevanja napovedovalca ni natančnost. Je kalibracija. Napovedovalec, čigar 70% verjetnostni izbori imajo prav 70% časa (ne 90%, ne 50%), opravlja delo. Napovedovalec, čigar 70% izbori imajo prav 85% časa, je premalo samozavesten (verjetno koristen), vendar ne kalibriran. Napovedovalec, čigar 70% izbori imajo prav 55% časa, je glasen (verjetno neuporaben).
Brierjeva ocena je metrika, ki ocenjuje kalibracijo. V akademskem napovednem raziskovanju je standard že 75 let in tako vsak nogometni napovedovalec, vreden poslušanja, dobi pošteno oceno.
Ta članek obravnava, kaj Brier dejansko meri, kako ga sami izračunate, kakšna so merila in zakaj je kalibracija signal, ki ga morate zahtevati od katerega koli napovednega orodja.
Kaj Brier dejansko meri
Brier je ocena kvadratne napake med napovedjo in resničnostjo. Nižje je bolje kalibrirano.
Za tristranske nogometne izide (domača zmaga, neodločeno, gostujoča zmaga) vsaka tekma proizvede tri napovedne številke, ki se seštejejo v 1,0. Dejanski rezultat proizvede tri 0,ali,1 številke (1 za izid, ki se je zgodil, 0 za ostale).
Formula na tekmo: Brier = Σ (napoved , dejanski)^2 / 3
Torej napoved [0,60, 0,25, 0,15] za domači/neodločeno/gosti pri tekmi, ki se je končala z domačo zmago:
- Domači: (0,60 , 1,00)^2 = 0,16
- Neodločeno: (0,25 , 0,00)^2 = 0,0625
- Gosti: (0,15 , 0,00)^2 = 0,0225
- Vsota: 0,245
- Deljeno s 3: 0,0817
Napoved, ki je rekla [0,95, 0,03, 0,02] na isti tekmi (domači so res zmagali):
- Vsota: 0,0025 + 0,0009 + 0,0004 = 0,0038
- Deljeno s 3: ≈ 0,0013
Samozavestna pravilna napoved je dosegla veliko boljši rezultat. Toda samozavestna napačna napoved je hudo kaznovana:
- [0,95, 0,03, 0,02] pri tekmi, ki se je končala z neodločenim:
- Domači: (0,95 , 0)^2 = 0,9025
- Neodločeno: (0,03 , 1)^2 = 0,9409
- Gosti: (0,02 , 0)^2 = 0,0004
- Vsota: 1,8438
- Deljeno s 3: ≈ 0,6146, katastrofa
Zaupanje je nagrajeno, ko je upravičeno, in kaznovano, ko ni. Povprečno čez stotine tekem Brier samodejno loči kalibrirane napovedovalce od glasnih.
Zakaj je kalibracija pomembnejša od natančnosti
Razmislite o dveh napovedovalcih.
Napovedovalec A vedno reče 95% domači, 3% neodločeno, 2% gosti pri vsaki domači tekmi vrhunske ekipe. Ima prav okoli 60% časa.
Napovedovalec B reče 62% domači, 24% neodločeno, 14% gosti pri istih tekmah. Ima prav 62% časa.
Kateri je boljši? Glede natančnosti je A spredaj (60% proti 62% je blizu). Glede kalibracije je B daleč spredaj. A-jev 95% izbor gre narobe 40% časa, kar je grozno. B-jev 62% izbor gre prav 62% časa, kar je pošteno.
Brierjeva ocena vam pove, kateri od njiju pravilno bere podloga signal. A-jev Brier bo strašen, ker se 95% verjetnosti kvadratno povečajo, ko so napačne. B-jev Brier bo odličen, ker se verjetnosti ujemajo z resničnostjo.
To je pomembno na tri praktične načine:
Kalibracija tveganja. Če uporabite napoved za kakršno koli odločitev navzdol (tudi za priložnostno "katera tekma je najbolj zanimiva za gledanje"), je vedeti, kako zanesljiva je verjetnost dejansko, pomembno. 95% slabega napovedovalca je vredno manj kot 62% dobrega.
Primerjava med napovedovalci. Dveh napovedovalcev ne morete primerjati po surovi natančnosti. Nekdo, ki izbira samo favorite, bo videti bolj "natančno" kot nekdo, ki v napovedi vključuje tudi šibkejše. Brier deluje ne glede na porazdelitev verjetnosti.
Poštenost. Kalibrirani napovedovalci so manj v skušnjavi pretiravati. Napovedovalec, ki ve, da bo ocenjen po Brierju, se ne hvali. Napovedovalec, ki ve, da bo ocenjen samo po natančnosti, ima spodbudo, da kliče samo favorite in črpa črto natančnosti.
Brier merila za nogomet
Groba merila Brierja za tristranske nogometne izide (domači / neodločeno / gosti):
- Vedno-neodločeno izhodišče (pravi, da je vsaka tekma 33/33/33): približno 0,25
- Naključno verjetnostno izhodišče: približno 0,25
- Osnovni model na podlagi forme (samo zmage,porazi): približno 0,225
- Spodoben javni model z xG + formo: 0,195 do 0,215
- Trg stavnice ob zaključku: okoli 0,195
- Elitni model s podatki o dogodkih + skrbno kalibracijo: 0,185 do 0,195
Ocene pod 0,185 so redke; ocene nad 0,22 so podpovprečne. Večina resnega analitičnega dela živi v razponu 0,19 do 0,21, blizu, vendar običajno ne preseže trgov stavnic (ki imajo cenovni pritisk in pametni denar kot svoj kalibracijski mehanizem).
Kako Tactiq razmišlja o Brierju in kalibraciji
Tactiq izvaja notranje sledenje kalibracije čez svoj izhod analize, da potrdi, da indikatorji zaupanja na karticah tekem ustrezajo dejanskim frekvencam izidov pri pričakovani stopnji. Indikator zaupanja, ki pravi "visoko zaupanje", se mora preslikati na tekme, kjer se najvišja verjetnost resnično uresničuje pri visoki stopnji. Indikator zaupanja, ki pravi "tesno", se mora preslikati na tekme, kjer so izidi resnično spremenljivi.
Specifične vrednosti Brierja, kalibracijske nadzorne plošče in tempo ponovnega nastavljanja ostanejo znotraj produkta. Kar doseže uporabnika, je z zaupanjem opremljena analiza, kjer je bil indikator zaupanja kalibriran proti dejanskim izidom in ne izumljen kot trženjski signal. Objavljena metodologija se kopira in slabo kalibrira v nekaj tednih.
Kar uporabnik vidi na kartici tekme:
- Verjetnostne trojice za izid, z vidnim indikatorjem zaupanja, ki se preslika v pravo kalibracijsko pas.
- Pričakovani goli za vsako stran.
- Pisana analiza, ki pregled razlaga v preprostem jeziku.
- Brez zunanjih tržnih podatkov kjerkoli. Brez preusmeritev na platforme tretjih oseb. Brez navidezne valute. Samo statistična analiza.
Indikator zaupanja je uporabniku obrnjena ročica kalibracije. "Visoko zaupanje" pomeni, da je signal močan; "tesno" pomeni, da so izidi resnično spremenljivi.
Zaključek
Brierjeva ocena je tako, kako se napovedovalci dejansko ocenjujejo. Orodje, ki oglašuje natančnost brez prikazovanja kalibracije, vas prosi, da zaupate vzorcu glasnega napovedovalca. Orodje, ki je pripravljeno biti ocenjeno po kalibraciji in izpostavlja indikatorje zaupanja, ki resnično odražajo spremenljivost izidov, je tisto, ki bo zdržalo skozi čas.
Brier lahko sami izračunate na napovedih katerega koli napovedovalca, če objavlja verjetnosti skupaj z rezultati. Formula je preprosta, merila so dobro znana in poštena ocena traja nekaj minut dela v preglednici.
Tactiq vgrajuje kalibracijo v uporabniku obrnjen indikator zaupanja in jo notranje validira. Analiza bere vsako tekmo z zaupanjem, ki se ujema s podlogo negotovostjo, namesto z glasnimi trditvami, ki ne preživijo pregleda vzorca. Več kot 1.200 tekmovanj, lokalizacija v 32 jezikov, brezplačna raven z osmimi analizami na dan, brez zahtevane kreditne kartice.
Če ste sledili seriji, besednjak metrik zdaj pokriva kako AI napoveduje nogometne tekme, xG, xA, npxG, PPDA, Field Tilt, progresivne akcije, SCA/GCA, xPts in Elo ocene. Brier se jim pridruži kot meta metrika, ki ocenjuje poštenost vsake druge metrike.