Elo-Bewertungen im Fußball: Wie Mannschaftsstärke quantifiziert wird

Von Tactiq AI · 2026-05-05 · 9 Min. Lesezeit · KI & Fußball

Wenn Sie je auf eine Fußball-Spielvorschau geklickt und etwas wie "Mannschaft A Bewertung 1720, Mannschaft B Bewertung 1548" gesehen haben, schauten Sie auf eine Elo-Bewertung. Wenn Sie eine Grafik der Stärke eines Vereins über ein Jahrzehnt gesehen haben, mit Linien, die durch Krisen und goldene Ären steigen und fallen, war das fast sicher Elo.

Elo ist das, was dem Fußball am nächsten an einer universellen Mannschaftsstärke-Kennzahl kommt. Ursprünglich für Schachspieler entworfen, wurde es für Fußball, Basketball, Tennis, eSports und mehr adaptiert. Die Fußball-Version ist einfacher als die Schach-Version, aber die Prinzipien sind dieselben. Und wie jede Einzelzahl-Kennzahl wird sie oft genug missgelesen, dass es sich lohnt zu verstehen, wie sie wirklich funktioniert.

Dieser Artikel zeigt, was Elo über Mannschaftsstärke erfasst, wie es berechnet wird, warum es zum Standard in Analyse-Dashboards wurde, und welche Fallen Fans schnappen, die die Bewertung als Orakel statt als Zusammenfassung behandeln.

Was Elo-Bewertungen sind, in einem Absatz

Jede Mannschaft hat eine Bewertung, typischerweise im Bereich 1200 bis 2100 in der Vereinsadaption des Fußballs. Nach jedem Spiel aktualisieren sich beide Bewertungen basierend darauf, wie sie relativ zur Erwartung performten. Wenn eine 1700-bewertete Mannschaft eine 1500-bewertete schlägt, war die stärkere Seite erwartungsgemäß Sieger, ihre Bewertung ändert sich kaum. Wenn stattdessen die 1500-bewertete Seite gewinnt, springt ihre Bewertung hoch und die der 1700-bewerteten fällt, weil das Ergebnis der Erwartung widersprach. Unentschieden gegen die Erwartung? Die Bewertungsdifferenz absorbiert die Überraschung proportional.

Über hunderte von Spielen stabilisiert sich die Bewertung um die wahre Stärke jeder Mannschaft. Klettern Sie in den Bewertungen, indem Sie starke Seiten schlagen; rutschen Sie ab, indem Sie gegen schwache verlieren. Die Zahlen bedeuten etwas Konkretes: eine 100-Punkte-Bewertungslücke entspricht etwa einem 64-36-Favoritenverhältnis, eine 200-Punkte-Lücke etwa 76-24, eine 400-Punkte-Lücke etwa 91-9.

Wie Elo tatsächlich berechnet wird

Die Mathematik, ohne Komplexität:

Erwartetes Ergebnis für Mannschaft A vs. Mannschaft B: E_A = 1 / (1 + 10^((R_B - R_A) / 400))

Wobei R_A und R_B die aktuellen Bewertungen der Mannschaften sind. Der 400er-Nenner ist eine Konvention aus dem Schach; Fußball-Elo-Varianten nutzen manchmal andere Skalare, aber 400 ist Standard.

Update nach Spiel: neue R_A = alte R_A + K × (tatsächliches Ergebnis - E_A)

"Tatsächliches Ergebnis" ist 1 für Sieg, 0,5 für Unentschieden, 0 für Niederlage aus A's Sicht. K ist eine Konstante. Schach nutzt K=16 bis 32 je nach Erfahrungsstand. Fußball-Elo nutzt oft K=20 bis 50, wobei höhere Werte reaktionsfreudigere Bewertungen ergeben.

Also nach einem Spiel:

Favorit gewinnt: kleine positive Änderung für Favoriten, kleine negative für Außenseiter.
Favorit Unentschieden (Überraschung): kleine negative für Favoriten, kleine positive für Außenseiter.
Favorit verliert (große Überraschung): signifikante negative für Favoriten, signifikante positive für Außenseiter.
Außenseiter gewinnt: dasselbe wie oben aus der anderen Richtung.

Zwei fußballspezifische Verfeinerungen, die die meisten öffentlichen Elo-Systeme hinzufügen:

Tordifferenz-Gewichtung. Ein 3-0-Sieg zählt mehr als ein 1-0-Sieg. Die meisten öffentlichen Elo-Varianten multiplizieren K mit einem Faktor basierend auf der Tor-Marge (K × √Tordifferenz oder ähnlich). Ohne dies behandelt das System jedes Ergebnis als binär und verliert Information.

Heimvorteil. Heimmannschaften erhalten einen kleinen Bewertungsbonus (oder die Auswärtsmannschaft eine Strafe), bevor Erwartungen berechnet werden. ClubElo nutzt etwa 100 Punkte.

Diese Verfeinerungen produzieren fußball-adaptiertes Elo, das Mannschaftsstärke über eine Saison sinnvoll verfolgt.

Warum Elo zum Standard wurde

Elo blieb im Fußball aus einer Mischung pragmatischer und taktischer Gründe.

Die Eingaben sind universell verfügbar. Spielergebnisse und Gegnerbewertungen sind alles, was man braucht. Sie brauchen keine Event-Daten, Tracking-Daten oder xG, um Elo zu berechnen. Historische Bewertungen können aus jeder Ära gebaut werden, soweit Spielergebnisse zurückreichen.

Es erfasst Gegnerstärke. Eine Mannschaft mit 22 Siegen mag elite wirken. Eine Mannschaft mit 22 Siegen gegen Tabellenuntere und keinen Siegen gegen Top-Sechs ist nicht elite. Elo belohnt das erste Muster weniger als naive Punktetabellen, weil die Siege gegen schwächere Bewertungen waren.

Die Mathematik ist einfach genug zum Auditieren. Keine Black Box. Sie können die Bewertung jeder Mannschaft selbst neu berechnen, gegeben die Spielhistorie. Diese Auditierbarkeit zählt in der Analyse, weil sie es erlaubt, den K-Wert, die Tordifferenz-Gewichtung und den Heimbonus zu testen und zu tunen, ohne ein Datenwissenschafts-Team.

Es produziert eine einzelne Zahl. Trotz aller Schwächen von Einzelzahl-Zusammenfassungen kommunizieren sie gut. "Mannschaft A Bewertung 1720 vs. Mannschaft B 1548" ist auf eine Weise verständlich, wie es "Mannschaft A npxG-Differential +15,2 über 28 Spiele" für einen Gelegenheits-Fan nicht ist.

Liga-übergreifender Vergleich (mit Kalibrierung). Vereins-Elo kann für Liga-Stärke angepasst werden, mittels eines parallelen "Liga-Elo", das Wettbewerbe gegeneinander bewertet. Das erlaubt liga-übergreifende Vergleiche, die naive Siegquoten-Vergleiche nicht können.

Wo Elo in die Irre führt

Vier echte Grenzen, die zu verstehen sind, bevor Sie einer Bewertungsspalte vertrauen.

Form-Verzögerung. Elo aktualisiert sich graduell. Eine Mannschaft auf einer heißen Serie von fünf Siegen springt nicht in den Bewertungen hoch; sie klettert stetig. Eine Mannschaft in der Krise stürzt nicht ab; sie driftet nach unten. Kurzzeit-Form wird absichtlich unterbewertet. Manche Analysten nutzen "rolling form" neben Elo, um aktuelle Form-Sensibilität mit Saison-Stabilität zu kombinieren.

Gegnerqualität wird innerhalb eines Spiels als flach angenommen. Elo nimmt an, dass die 1700-bewertete Mannschaft 90 Minuten lang auf 1700-Stärke spielt. In Wirklichkeit bedeuten Kaderrotation, Müdigkeit, Verletzung mitten im Spiel und taktische Entscheidungen, dass die Stärke schwankt. Elo behandelt jedes Spiel als sauberes "Bewertung-vs.-Bewertung"-Duell, was eine Vereinfachung ist, die das echte Spiel nie ist.

Internationaler Transfer der Vereinsbewertung. Eine vereinsbasierte Elo-Bewertung überträgt sich nicht sauber auf die Turnierleistung von Nationalmannschaften. AFCON, EM, WM, das sind Spiele, in denen Vereins-Elo der Spieler weitgehend irrelevant ist, weil Nationalmannschaften Spieler über Vereinskontexte mischen. Vereins-Elo zur Vorhersage internationaler Turnierspiele zu nutzen, ist ein Kategorienfehler.

Vor-Saison-Regression. Die Bewertung einer aufgestiegenen Mannschaft aus der unteren Liga überschätzt ihre aktuelle Stärke in der höheren Liga. Viele Elo-Systeme wenden eine "Regression" zwischen Saisons an und reduzieren die Bewertung jeder Mannschaft Richtung Mittelwert, um Kaderwechsel zu berücksichtigen. Der genaue Regressionsbetrag ist eine Ermessensentscheidung, und verschiedene Anbieter nutzen unterschiedliche Werte.

K-Wert-Sensibilität. Elos Reaktionsfähigkeit hängt stark von K ab. Ein System mit zu kleinem K wird unempfindlich für echte Stärkeänderungen. Ein System mit zu großem K schwingt wild bei Einzelspiel-Varianz. Das "richtige" K für Fußball ist empirisch getunt, und verschiedene Anbieter produzieren unterschiedliche K-Werte.

Die nützliche Regel: Elo ist eine gute Baseline-Mannschaftsstärke-Zusammenfassung, kein präzises Ranking. Es ist am nützlichsten als Ausgangspunkt, den andere Signale (jüngste Form, xG-Differential, Kaderkontext) verfeinern.

Wie Tactiq Mannschaftsstärke-Signale in der Analyse nutzt

Tactiqs Analyse bezieht ein aus der Spielhistorie abgeleitetes Mannschaftsstärke-Signal als eine von mehreren Eingaben ein. Das Signal trägt zur Baseline-Wahrscheinlichkeit jedes Spielausgangs bei, neben jüngster Form, xG-Differential, Direktvergleichshistorie und Kaderkontext. Wie genau Mannschaftsstärke-Signale mit dem Rest dessen kombinieren, was die Analyse liest, bleibt im Produkt.

Was die Nutzerin oder der Nutzer auf der Spielkarte sieht:

Wahrscheinlichkeits-Triaden für den Ausgang, qualifiziert durch eine Konfidenzanzeige, die widerspiegelt, wie stabil die zugrunde liegenden Signale für diese spezifische Begegnung sind.
Erwartete Tore für jede Seite mit aktuellem Trend.
Ein geschriebener Analysetext, der das Begegnungs-Muster benennt: "Die Heimseite tritt auf jüngster Form und Spielhistorie als stärkere Seite an, doch die jüngste Chancen-Erzeugung lag hinter der Auswärtsseite zurück."
Keine externen Marktdaten irgendwo. Keine Weiterleitungen zu Drittplattformen. Keine virtuelle Währung. Ausschließlich statistische Analyse.

Die Analyse zeigt keine rohe Elo-Zahl; sie zeigt den taktischen Befund, den das zugrunde liegende Mannschaftsstärke-Bild impliziert.

Das Fazit

Elo-Bewertungen komprimieren Mannschaftsstärke in eine einzelne Zahl, die sich nach jedem Spiel basierend auf Ergebnis und Gegnerqualität aktualisiert. Die Mathematik ist einfach; der Output ist interpretierbar; die Kennzahl reist über Ären und Ligen.

Es ist keine Vorhersage, es ist eine Zusammenfassung. Jüngste Form, Verletzungen, taktische Wechsel, Kaderrotation, nichts davon zeigt sich direkt in Elo. Elo als Ergänzung zu reicherer Analyse zu nutzen, funktioniert gut. Es als alleinige Eingabe zu nutzen, verfehlt die Textur, die die meisten modernen Spiele entscheidet.

Tactiq ist gebaut, Mannschaftsstärke-Signale neben dem reicheren Kontext zu lesen. Die Analyse zeigt einen konfidenzqualifizierten Befund der Begegnung in klarer Sprache und vermischt das statistische Signal nie mit externen Marktdaten. Über 1.200 Wettbewerbe, Lokalisierung in 32 Sprachen, kostenlose Stufe mit acht Analysen pro Tag, ohne Karteneingabe.

Wenn Sie der Reihe gefolgt sind, umspannt das Vokabular jetzt wie KI Fußballspiele vorhersagt, xG, xA, npxG, PPDA, Field Tilt, progressive Aktionen, SCA/GCA und xPts. Elo schließt sich der Sammlung als Mannschaftsstärke-Baseline an, auf die diese anderen Kennzahlen aufbauen.

Häufig gestellte Fragen

Was ist eine Elo-Bewertung im Fußball?

Eine Elo-Bewertung ist eine einzelne Zahl, die die Stärke einer Mannschaft repräsentiert, aktualisiert nach jedem Spiel basierend auf Ergebnis und Gegnerqualität. Stärkere Mannschaften haben höhere Bewertungen. Wenn eine stärkere Mannschaft eine schwächere schlägt, ändern sich beide Bewertungen um kleine Beträge. Wenn eine schwächere Mannschaft eine stärkere schlägt, schwingen die Bewertungen viel stärker. Das System wurde 1960 von Arpad Elo für Schach erfunden und wurde für die meisten Wettbewerbssportarten adaptiert.

Wie wird Elo tatsächlich berechnet?

Nach jedem Spiel aktualisiert sich die Bewertung jeder Mannschaft nach einer Formel: neue Bewertung = alte Bewertung + K × (tatsächliches Ergebnis - erwartetes Ergebnis). 'Erwartetes Ergebnis' wird aus der Bewertungslücke berechnet (größere Lücken bedeuten, der Favorit gewinnt erwartungsgemäß öfter). 'K' ist eine Tuning-Konstante, die kontrolliert, wie stark ein einzelnes Spiel die Bewertungen ändert. Kleines K = stabile Bewertungen. Großes K = reaktionsfreudige Bewertungen.

Warum wurde Elo im Fußball so populär?

Drei Gründe. Die Mathematik ist einfach genug, um sie ohne Datenwissenschafts-Team zu implementieren. Die Bewertung erfasst Gegnerstärke, was naive Siegquoten-Statistiken nicht tun. Und die Eingaben (Spielergebnis, Gegnerbewertung) sind universell für jede Begegnung jahrzehntelang verfügbar, was historische Bewertungen von Grund auf möglich macht.

Ist Elo dasselbe wie ein Power-Ranking?

Verwandt, aber nicht identisch. Power-Rankings sind redaktionell kuratierte Listen (Autoren entscheiden, wer über wem steht). Elo ist ein mechanischer Output vergangener Ergebnisse, ohne menschliches Urteil. Die beiden stimmen oft für Spitzenmannschaften überein, divergieren aber für unter- oder überbewertete Mannschaften, und Elos Widerspruch zum Medienkonsens ist oft das interessantere Signal.

Verwendet Tactiq Mannschaftsstärke-Bewertungen in seiner Analyse?

Die Analyse bezieht ein aus der Spielhistorie abgeleitetes Mannschaftsstärke-Signal neben mehreren anderen Eingaben ein, einschließlich Chancen-Erzeugung, Kaderkontext und Direktvergleich. Die spezifische Methode, wie Mannschaftsstärke in die Analyse eingeht, bleibt im Produkt. Für eine Leserin oder einen Leser zeigt sich der Effekt als konfidenzqualifizierter Befund, ob eine Begegnung gut gepaart oder einseitig ist.

Woher kommen öffentliche Elo-Daten?

Die bekannteste öffentliche Quelle ist ClubElo.com, die täglich aktualisierte Elo-Bewertungen für jede Mannschaft in großen europäischen Ligen bis in die 1960er veröffentlicht, gepflegt von Christian Wolf. FiveThirtyEight veröffentlichte historisch den Soccer Power Index (SPI), eine raffiniertere Variante. Die meisten Analyse-Dashboards mit Elo ziehen aus einer dieser Quellen oder bauen ihre eigene Kalibrierung.