Elo-ratings i fodbold: hvordan holdstyrke kvantificeres

Af Tactiq AI · 2026-05-05 · 9 min læsning · AI og Fodbold

Hvis du nogensinde har klikket dig ind på et fodboldkamp-preview og set noget i stil med "Hold A rating 1720, Hold B rating 1548", så kiggede du på en Elo-rating. Hvis du har set en graf over en klubs styrke gennem et årti med linjer, der stiger og falder gennem kriser og guldaldre, var det næsten helt sikkert Elo.

Elo er det tætteste fodbold kommer på en universel holdstyrke-metrik. Oprindeligt designet til at rate skakspillere, er den blevet tilpasset til fodbold, basketball, tennis, eSport og mere. Versionen i fodbold er enklere end skakvarianten, men principperne er de samme. Og som enhver enkelt-tals-metrik bliver den ofte misforstået, så det er værd at forstå, hvordan den faktisk virker.

Denne artikel gennemgår, hvad Elo fanger om holdstyrke, hvordan den beregnes, hvorfor den blev standarden på tværs af analytics-dashboards, og fælderne der fanger fans, der behandler ratingen som et orakel snarere end et sammendrag.

Hvad Elo-ratings er, i ét afsnit

Hvert hold har en rating, typisk i intervallet 1200 til 2100 i fodboldens klubadaption. Efter hver kamp opdateres begge holds ratings baseret på, hvordan de præsterede i forhold til forventningen. Hvis et rated-1700 hold slår et rated-1500 hold, blev den stærkere side forventet at vinde, så deres rating ændres knap. Hvis det rated-1500 hold vinder i stedet, springer deres rating op, og det rated-1700 holds falder, fordi resultatet modsagde forventningen. Uafgjort mod forventning? Ratingforskellen absorberer overraskelsen proportionalt.

Over hundredvis af kampe stabiliserer ratingen sig omkring hvert holds sande styrke. Klatr op i ratings ved at slå stærke sider; glid ned ved at tabe til svage. Tallene betyder noget konkret: en 100-point ratingforskel svarer groft til en 64-36 favorit, en 200-point forskel til omkring 76-24, en 400-point forskel til omkring 91-9.

Hvordan Elo faktisk beregnes

Matematikken, befriet for kompleksitet:

Forventet resultat for hold A vs hold B: E_A = 1 / (1 + 10^((R_B - R_A) / 400))

Hvor R_A og R_B er holdenes aktuelle ratings. Nævneren 400 er en konvention fra skak; fodbold-Elo-varianter bruger nogle gange andre skalarer, men 400 er standard.

Opdatering efter kamp: ny R_A = gammel R_A + K × (faktisk resultat - E_A)

"Faktisk resultat" er 1 for sejr, 0,5 for uafgjort, 0 for nederlag set fra A's perspektiv. K er en konstant. Skak bruger K=16 til 32 afhængigt af erfaringsniveau. Fodbold-Elo bruger ofte K=20 til 50, hvor de højere værdier giver mere responsive ratings.

Så efter en kamp:

Favoritten vinder: lille positiv ændring for favorit, lille negativ for outsider.
Favoritten spiller uafgjort (overraskelse): lille negativ for favorit, lille positiv for outsider.
Favoritten taber (stor overraskelse): betydelig negativ for favorit, betydelig positiv for outsider.
Outsideren vinder: samme som ovenfor fra den anden retning.

To fodboldspecifikke forfining, som de fleste offentlige Elo-systemer tilføjer:

Målforskelsvægtning. En 3-0-sejr tæller mere end en 1-0-sejr. De fleste offentlige Elo-varianter ganger K med en faktor baseret på målmargen (K × √MålForskel eller lignende). Uden dette behandler systemet hvert resultat som binært og mister information.

Hjemmebanefordel. Hjemmehold får en lille rating-bonus (eller udeholdet får en straf), før forventninger beregnes. ClubElo bruger omtrent 100 point.

Disse forfining producerer fodbold-tilpasset Elo, der sporer holdstyrke meningsfuldt over en sæson.

Hvorfor Elo blev standarden

Elo satte sig fast i fodbold af en blanding af pragmatiske og taktiske grunde.

Inputtene er universelt tilgængelige. Kampresultater og modstander-ratings er alt, du behøver. Du behøver ikke begivenhedsdata, sporingsdata eller xG for at beregne Elo. Historiske ratings kan bygges fra enhver æra så langt tilbage, som kampresultater eksisterer.

Den fanger modstanderstyrke. Et hold med 22 sejre kan se elite ud. Et hold med 22 sejre mod bundhold og ingen sejre mod top-seks er ikke elite. Elo belønner det første mønster mindre end naive pointtabeller, fordi sejrene var mod svagere ratings.

Matematikken er enkel nok til at revidere. Ingen sort boks. Du kan selv genberegne ethvert holds rating givet kamphistorikken. Den reviderbarhed betyder noget i analytics, fordi den lader dig teste og tune K-værdien, målforskelsvægtningen og hjemmebanebonussen uden et data-science-team.

Den producerer et enkelt tal. På trods af alle fejl ved enkelt-tals-sammendrag kommunikerer de godt. "Hold A rating 1720 vs Hold B 1548" er forståeligt på en måde, "Hold A npxG-differens +15,2 over 28 kampe" ikke er for en almindelig fan.

Krydsligasammenligning (med kalibrering). Klub-Elo kan justeres for ligastyrke ved hjælp af et parallelt "liga-Elo", der rater turneringer mod hinanden. Det tillader krydsligasammenligning, hvilket naive sejrsprocent-sammenligninger ikke kan.

Hvor Elo vildleder

Fire reelle begrænsninger at forstå, før du stoler på en rating-kolonne.

Form-forsinkelse. Elo opdaterer gradvist. Et hold på en hot streak af fem sejre springer ikke op i ratings; det stiger støt. Et hold i krise styrter ikke; det driver ned. Kortsigtet form er undervægtet ved design. Nogle analytikere bruger "rolling form" sammen med Elo for at kombinere nyere-form-følsomhed med sæson-total-stabilitet.

Modstanderkvalitet antaget flad inden for en kamp. Elo antager, at det rated-1700 hold spiller på rated-1700 styrke i hele kampen. I virkeligheden betyder rotation, træthed, midt-i-kamp-skader og taktiske beslutninger, at styrken svinger. Elo behandler hver kamp som en ren "rating vs rating"-duel, hvilket er en forenkling, den virkelige kamp aldrig er.

International overførsel af klubrating. En klubbaseret Elo-rating overføres ikke rent til national-team-turneringspræstation. AFCON, EM, VM, det er opgør, hvor spillernes klub-Elo-ratings stort set er irrelevante, fordi landshold blander spillere på tværs af klubkontekster. At bruge klub-Elo til at forudsige internationale turneringskampe er en kategorifejl.

Førsæson-regression. Et oprykket holds rating fra sidste sæsons lavere niveau overvurderer deres aktuelle styrke i den højere divisions. Mange Elo-systemer anvender en "regression" mellem sæsoner og reducerer hvert holds rating mod gennemsnittet for at tage højde for spillerudskiftninger. Det nøjagtige regressionsbeløb er en skønssag, og forskellige udbydere bruger forskellige værdier.

K-værdi-følsomhed. Elo's responsivitet afhænger stærkt af K. Et system med for lille K bliver ureagerende på reelle styrkeændringer. Et system med for stor K svinger vildt på enkelt-kamps-varians. Det "rigtige" K for fodbold er empirisk tunet, og forskellige udbydere producerer forskellige K-værdier.

Den brugbare regel: Elo er et godt baseline-holdstyrkesammendrag, ikke en præcis rangering. Den er mest nyttig som et udgangspunkt, som andre signaler (nyere form, xG-differens, trupkontekst) forfiner.

Hvordan Tactiq bruger holdstyrkesignaler i analysen

Tactiqs analyse indarbejder et holdstyrkesignal afledt af kamphistorik som et af flere input. Signalet bidrager til baseline-sandsynligheden for hvert kampudfald sammen med nyere form, xG-differens, indbyrdes historik og trupkontekst. Den specifikke måde, holdstyrkesignaler kombineres med resten af det, analysen læser, forbliver inden for produktet.

Hvad brugeren ser på kampkortet:

Sandsynlighedstripletter for udfaldet, kvalificeret af en tillidsindikator, der reflekterer hvor stabile de underliggende signaler er for netop dette opgør.
Forventede mål for hver side med en nyere trend.
En skreven analyse, der navngiver opgørets mønster i klart sprog: "Hjemmesiden går ind som den stærkere side på nyere form og kamphistorik, men den nyere chanceskabelse har haltet bag besøgende sides."
Ingen eksterne markedsdata nogen steder. Ingen omdirigeringer til tredjepartsplatforme. Ingen virtuel valuta. Kun statistisk analyse.

Analysen viser ikke et råt Elo-tal frem; den viser den taktiske læsning, som det underliggende holdstyrke-billede indebærer.

Konklusionen

Elo-ratings komprimerer holdstyrke til et enkelt tal, der opdateres efter hver kamp baseret på resultat og modstanderkvalitet. Matematikken er enkel; outputtet er fortolkbart; metrikken rejser på tværs af æraer og ligaer.

Det er ikke en forudsigelse, det er et sammendrag. Nyere form, skader, taktiske ændringer, trup-rotation, intet af det dukker op i Elo direkte. At bruge Elo som supplement til rigere analyse fungerer godt. At bruge den som eneste input misser den tekstur, der afgør de fleste moderne kampe.

Tactiq er bygget til at læse holdstyrkesignaler sammen med den rigere kontekst. Analysen viser en konfidenskvalificeret læsning af opgøret i klart sprog og blander aldrig det statistiske signal med eksterne markedsdata. Over 1.200 turneringer, 32-sprogs lokalisering, gratisniveau med otte analyser per dag, intet kreditkort krævet.

Hvis du har fulgt serien, dækker metrikvokabularet nu hvordan AI forudsiger fodboldkampe, xG, xA, npxG, PPDA, Field Tilt, progressive aktioner, SCA/GCA og xPts. Elo slutter sig til samlingen som holdstyrke-baseline, som de andre metrikker lægges oven på.

Ofte stillede spørgsmål

Hvad er en Elo-rating i fodbold?

En Elo-rating er et enkelt tal, der repræsenterer et holds styrke, opdateret efter hver kamp baseret på resultatet og modstanderens kvalitet. Stærkere hold har højere ratings. Når et stærkere hold slår et svagere, ændres begge ratings med små beløb. Når et svagere hold slår et stærkere, svinger ratings meget mere. Systemet blev opfundet af Arpad Elo til skak i 1960 og er blevet tilpasset de fleste konkurrenceprægede sportsgrene.

Hvordan beregnes Elo faktisk?

Efter hver kamp opdateres hvert holds rating ved en formel: ny rating = gammel rating + K × (faktisk resultat - forventet resultat). 'Forventet resultat' beregnes ud fra ratingforskellen (større forskelle betyder, at favoritten forventes at vinde oftere). 'K' er en justeringskonstant, der styrer, hvor meget en enkelt kamp ændrer ratings. Lille K = stabile ratings. Stor K = responsive ratings.

Hvorfor blev Elo så populær i fodbold?

Tre grunde. Matematikken er enkel nok til at implementere uden et data-science-team. Ratingen fanger modstandernes styrke, hvilket naive sejrsprocenter ikke gør. Og inputtene (kampresultat, modstander-rating) er universelt tilgængelige for ethvert opgør årtier tilbage, hvilket gør det muligt at bygge historiske ratings fra bunden.

Er Elo det samme som en power ranking?

Beslægtet, men ikke identisk. Power rankings er redaktørkurerede lister (skribenter beslutter, hvem der står over hvem). Elo er en mekanisk uddata fra tidligere resultater, ingen menneskelig vurdering nødvendig. De to er ofte enige om de bedste hold, men afviger for under- eller overvurderede hold, og Elo's uenighed med mediekonsensus er ofte det mere interessante signal.

Bruger Tactiq holdstyrke-ratings i analysen?

Analysen indarbejder et holdstyrkesignal afledt af kamphistorik sammen med flere andre input, herunder chanceskabelse, trupkontekst og indbyrdes opgør. Den specifikke metode, hvormed holdstyrke indgår i analysen, forbliver inden for produktet. For en fan viser effekten sig som en konfidenskvalificeret læsning af, om et opgør er jævnbyrdigt eller skævt.

Hvor kommer offentlige Elo-data fra?

Den bedst kendte offentlige kilde er ClubElo.com, som udgiver dagligt opdaterede Elo-ratings for hvert hold i de store europæiske ligaer tilbage til 1960'erne, vedligeholdt af Christian Wolf. FiveThirtyEight publicerede historisk Soccer Power Index (SPI), en mere sofistikeret variant. De fleste analytics-dashboards, der bruger Elo, henter fra en af disse eller bygger deres egen kalibrering.