Elo-rating i fotball: Hvordan lagstyrke kvantifiseres
Hvis du noen gang har klikket inn på en kampvisning og sett noe som "Lag A rating 1720, Lag B rating 1548", så du på en Elo-rating. Hvis du har sett en graf over en klubbs styrke gjennom et tiår, med linjer som stiger og faller gjennom kriser og gylne epoker, var det nesten sikkert Elo.
Elo er det nærmeste fotballen kommer en universell lagstyrkemetrikk. Opprinnelig designet for å rate sjakkspillere, er det tilpasset fotball, basketball, tennis, eSports og mer. Versjonen i fotball er enklere enn sjakkversjonen, men prinsippene er de samme. Og som enhver enkelttallsmetrikk blir den feiltolket ofte nok til at det er verdt å forstå hvordan den faktisk fungerer.
Denne artikkelen går gjennom hva Elo fanger om lagstyrke, hvordan den beregnes, hvorfor den ble standarden på tvers av analysedashbord, og fellene som fanger fans som behandler ratingen som et orakel snarere enn et sammendrag.
Hva Elo-rating er, i ett avsnitt
Hvert lag har en rating, vanligvis i området 1200 til 2100 i fotballens klubbtilpasning. Etter hver kamp oppdateres begge lagenes ratinger basert på hvordan de presterte i forhold til forventning. Hvis et lag med rating 1700 slår et lag med rating 1500, var det sterkere laget forventet å vinne, så ratingen endres knapt. Hvis det rated-1500-laget vinner i stedet, hopper ratingen deres opp og rated-1700-lagets faller, fordi resultatet motsa forventningen. Uavgjort mot forventning? Ratingforskjellen absorberer overraskelsen proporsjonalt.
Over hundrevis av kamper stabiliserer ratingen seg rundt hvert lags sanne styrke. Klatre i ratingen ved å slå sterke lag; gli ned ved å tape mot svake. Tallene betyr noe konkret: et 100-poengs ratinggap tilsvarer omtrent en 64-36 favoritt, et 200-poengs gap omtrent 76-24, et 400-poengs gap omtrent 91-9.
Hvordan Elo egentlig beregnes
Matematikken, strippet for kompleksitet:
- Forventet resultat for lag A mot lag B:
E_A = 1 / (1 + 10^((R_B - R_A) / 400))
Der R_A og R_B er lagenes nåværende ratinger. Nevneren 400 er en konvensjon fra sjakk; fotball-Elo-varianter bruker noen ganger andre skalarer, men 400 er standard.
- Oppdatering etter kamp:
ny R_A = gammel R_A + K × (faktisk resultat - E_A)
"Faktisk resultat" er 1 for seier, 0,5 for uavgjort, 0 for tap fra As perspektiv. K er en konstant. Sjakk bruker K=16 til 32 avhengig av erfaringsnivå. Fotball-Elo bruker ofte K=20 til 50, der høyere verdier gir mer responsive ratinger.
Så etter en kamp:
- Favoritten vinner: liten positiv endring for favoritten, liten negativ for underdog.
- Favoritten spiller uavgjort (overraskelse): liten negativ for favoritten, liten positiv for underdog.
- Favoritten taper (stor overraskelse): betydelig negativ for favoritten, betydelig positiv for underdog.
- Underdog vinner: samme som over fra motsatt retning.
To fotballspesifikke forfininger som de fleste offentlige Elo-systemer legger til:
Målforskjellsvekting. En 3-0-seier teller mer enn en 1-0-seier. De fleste offentlige Elo-varianter multipliserer K med en faktor basert på målforskjell (K × √Målforskjell eller lignende). Uten dette behandler systemet hvert resultat som binært og taper informasjon.
Hjemmefordel. Hjemmelag får en liten ratingbonus (eller bortelaget får en straff) før forventningene beregnes. ClubElo bruker omtrent 100 poeng.
Disse forfiningene produserer en fotballtilpasset Elo som sporer lagstyrke meningsfullt over en sesong.
Hvorfor Elo ble standarden
Elo festet seg i fotball av en blanding av pragmatiske og taktiske grunner.
Inndataene er universelt tilgjengelige. Kampresultater og motstanderratinger er alt du trenger. Du trenger ikke hendelsesdata, sporingsdata eller xG for å beregne Elo. Historiske ratinger kan bygges fra hvilken som helst epoke så langt tilbake som kampresultater eksisterer.
Den fanger motstanderens styrke. Et lag med 22 seire kan se elite ut. Et lag med 22 seire mot lag i nedre halvdel og ingen seire mot topp seks er ikke elite. Elo belønner det første mønsteret mindre enn naive poengtabeller fordi seirene var mot svakere ratinger.
Matematikken er enkel nok til å revidere. Ingen svartboks. Du kan beregne ethvert lags rating selv gitt kamphistorikken. Den reviderbarheten betyr noe i analyse, fordi den lar deg teste og justere K-verdien, målforskjellsvektingen og hjemmebonusen uten et data-science-team.
Den produserer ett enkelt tall. For alle feilene ved enkelttallssammendrag kommuniserer de godt. "Lag A rating 1720 mot Lag B 1548" er forståelig på en måte som "Lag A npxG-differensial +15,2 over 28 kamper" ikke er for en avslappet fan.
Sammenligning på tvers av ligaer (med kalibrering). Klubb-Elo kan justeres for ligastyrke ved hjelp av en parallell "liga-Elo" som rater konkurranser mot hverandre. Dette tillater sammenligning på tvers av ligaer, noe naive seiersprosent-sammenligninger ikke kan.
Hvor Elo villeder
Fire reelle begrensninger å forstå før du stoler på en ratingkolonne.
Form-etterslep. Elo oppdateres gradvis. Et lag på en het rekke av fem seire hopper ikke opp i ratingen; det klatrer jevnt. Et lag i krise stuper ikke; det driver nedover. Kortsiktig form er undervektet ved design. Noen analytikere bruker "rullerende form" sammen med Elo for å kombinere nyere-form-følsomhet med sesongtotal stabilitet.
Motstanderkvalitet antas flat innen en kamp. Elo antar at det rated-1700-laget spiller på rated-1700-styrke i hele kampen. I virkeligheten betyr troppsrotasjon, tretthet, skader midt i kampen og taktiske beslutninger at styrken svinger. Elo behandler hver kamp som en ren "rating mot rating"-duell, noe som er en forenkling den virkelige kampen aldri er.
Internasjonal overføring av klubbrating. En klubbasert Elo-rating overføres ikke rent til landslagsturneringsprestasjoner. AFCON, EM, VM, dette er kamper der spillernes klubb-Elo-ratinger stort sett er irrelevante fordi landslag blander spillere på tvers av klubbkontekster. Å bruke klubb-Elo til å forutsi internasjonale turneringskamper er en kategorifeil.
Førsesongregresjon. Et opprykkslags rating fra forrige sesongs lavere divisjon overdriver deres nåværende styrke på det høyere nivået. Mange Elo-systemer bruker en "regresjon" mellom sesonger, der hvert lags rating reduseres mot gjennomsnittet for å ta høyde for troppsutskiftning. Den eksakte regresjonsmengden er en skjønnsvurdering, og forskjellige leverandører bruker forskjellige verdier.
K-verdi-følsomhet. Elos respons avhenger sterkt av K. Et system med K for liten blir uresponsivt overfor reelle styrkeendringer. Et system med K for stor svinger vilt på enkeltkamps-varians. Den "riktige" K-en for fotball er empirisk justert, og forskjellige leverandører produserer forskjellige K-verdier.
Den nyttige regelen: Elo er et godt grunnlinje-lagstyrkesammendrag, ikke en presis rangering. Den er mest nyttig som et utgangspunkt som andre signaler (nyere form, xG-differensial, troppkontekst) forfiner.
Hvordan Tactiq bruker lagstyrkesignaler i analysen
Tactiqs analyse integrerer et lagstyrkesignal utledet fra kamphistorikk som ett av flere inndata. Signalet bidrar til grunnlinjen for sannsynligheten for hvert kamputfall, sammen med nyere form, xG-differensial, innbyrdes oppgjørshistorikk og troppkontekst. Den spesifikke måten lagstyrkesignalene kombineres med resten av det analysen leser, forblir innen produktet.
Det brukeren ser på kampkortet:
- Sannsynlighetstripler for utfallet, kvalifisert av en tillitsindikator som reflekterer hvor stabile de underliggende signalene er for denne spesifikke kampen.
- Forventede mål for hver side med en nyere trend.
- En skriftlig analyse som navngir kampmønsteret på klart språk: "Hjemmelaget kommer inn som det sterkere laget på nyere form og kamphistorikk, men nylig sjanseskaping har henget etter bortelagets."
- Ingen eksterne markedsdata noe sted. Ingen omdirigeringer til tredjepartsplattformer. Ingen virtuell valuta. Kun statistisk analyse.
Analysen viser ikke et rått Elo-tall; den viser den taktiske lesningen som det underliggende lagstyrkebildet impliserer.
Konklusjonen
Elo-ratinger komprimerer lagstyrke til ett tall som oppdateres etter hver kamp basert på resultat og motstanderkvalitet. Matematikken er enkel; resultatet er tolkbart; metrikken reiser på tvers av epoker og ligaer.
Det er ikke en forutsigelse, det er et sammendrag. Nyere form, skader, taktiske endringer, troppsrotasjon, ingen av disse vises direkte i Elo. Å bruke Elo som et supplement til rikere analyse fungerer godt. Å bruke det som eneste inndata går glipp av teksturen som avgjør de fleste moderne kamper.
Tactiq er bygd for å lese lagstyrkesignaler sammen med den rikere konteksten. Analysen viser en tillitskvalifisert lesning av kampen på klart språk og blander aldri det statistiske signalet med eksterne markedsdata. Over 1 200 konkurranser, lokalisering til 32 språk, gratisnivå med åtte analyser per dag, uten kort.
Hvis du har fulgt serien, spenner metrikkvokabularet nå over hvordan AI forutsier fotballkamper, xG, xA, npxG, PPDA, Field Tilt, progressive aksjoner, SCA/GCA og xPts. Elo blir med i samlingen som lagstyrkegrunnlaget de andre metrikkene legger seg over.