Rankingi Elo w piłce nożnej: jak kwantyfikuje się siłę drużyny
Jeśli kiedyś kliknęliście w zapowiedź meczu i zobaczyliście coś takiego jak "Drużyna A ranking 1720, Drużyna B ranking 1548", patrzyliście na ranking Elo. Jeśli widzieliście wykres siły klubu w ciągu dekady, z liniami wznoszącymi się i opadającymi przez kryzysy i złote ery, to było prawie na pewno Elo.
Elo to najbliższe, co piłka nożna ma do uniwersalnej metryki siły drużyny. Pierwotnie zaprojektowany do oceny szachistów, został zaadaptowany dla piłki nożnej, koszykówki, tenisa, e-sportu i więcej. Wersja w piłce nożnej jest prostsza niż szachowa, ale zasady są takie same. I jak każda metryka jednoliczbowa, jest błędnie czytana wystarczająco często, że zrozumienie, jak naprawdę działa, jest warte zrobienia.
Ten artykuł opisuje, co Elo wychwytuje o sile drużyny, jak jest obliczane, dlaczego stało się domyślne we wszystkich dashboardach analitycznych i pułapki, które łapią kibiców traktujących ranking jako wyrocznię, a nie podsumowanie.
Czym są rankingi Elo, w jednym akapicie
Każda drużyna ma ranking, zwykle w zakresie 1200 do 2100 w klubowej adaptacji piłki nożnej. Po każdym meczu rankingi obu drużyn aktualizują się na podstawie tego, jak grały względem oczekiwań. Jeśli drużyna z rankingiem 1700 pokonuje drużynę z rankingiem 1500, silniejsza strona miała wygrać, więc jej ranking ledwo się zmienia. Jeśli zamiast tego wygrywa strona z rankingiem 1500, jej ranking skacze w górę, a strony z rankingiem 1700 spada, bo wynik zaprzeczył oczekiwaniom. Remis wbrew oczekiwaniu? Różnica rankingowa pochłania niespodziankę proporcjonalnie.
W ciągu setek meczów ranking stabilizuje się wokół prawdziwej siły każdej drużyny. Wspinaj się w rankingach, pokonując silne strony; zsuwaj się, przegrywając ze słabymi. Liczby znaczą coś konkretnego: 100-punktowa luka rankingowa odpowiada w przybliżeniu faworytowi 64-36, 200-punktowa luka w przybliżeniu 76-24, 400-punktowa luka w przybliżeniu 91-9.
Jak naprawdę oblicza się Elo
Matematyka pozbawiona złożoności:
- Oczekiwany wynik dla drużyny A vs drużyna B:
E_A = 1 / (1 + 10^((R_B - R_A) / 400))
Gdzie R_A i R_B to obecne rankingi drużyn. Mianownik 400 to konwencja z szachów; warianty Elo dla piłki czasem używają innych skalarów, ale 400 jest standardem.
- Aktualizacja po meczu:
nowe R_A = stare R_A + K × (rzeczywisty wynik - E_A)
"Rzeczywisty wynik" to 1 za zwycięstwo, 0,5 za remis, 0 za porażkę z perspektywy A. K to stała. Szachy używają K=16 do 32 w zależności od poziomu doświadczenia. Elo dla piłki często używa K=20 do 50, z wyższymi wartościami dającymi bardziej responsywne rankingi.
Więc po meczu:
- Faworyt wygrywa: mała pozytywna zmiana dla faworyta, mała negatywna dla underdoga.
- Faworyt remisuje (niespodzianka): mała negatywna dla faworyta, mała pozytywna dla underdoga.
- Faworyt przegrywa (duża niespodzianka): znacząca negatywna dla faworyta, znacząca pozytywna dla underdoga.
- Underdog wygrywa: tak samo jak wyżej z drugiego kierunku.
Dwa specyficzne dla piłki udoskonalenia, które większość publicznych systemów Elo dodaje:
Ważenie różnicą bramek. Zwycięstwo 3-0 liczy się więcej niż 1-0. Większość publicznych wariantów Elo mnoży K przez czynnik oparty na marginesie bramek (K × √RóżnicaBramek lub podobnie). Bez tego system traktuje każdy wynik jako binarny, tracąc informację.
Atut własnego boiska. Drużyny gospodarze dostają mały bonus rankingowy (lub drużyna gości karę) przed obliczeniem oczekiwań. ClubElo używa około 100 punktów.
Te udoskonalenia produkują Elo zaadaptowane do piłki, które śledzi siłę drużyny znacząco przez sezon.
Dlaczego Elo stało się domyślne
Elo utknęło w piłce nożnej z mieszanki pragmatycznych i taktycznych powodów.
Wejścia są powszechnie dostępne. Wyniki meczów i rankingi rywali to wszystko, czego potrzeba. Nie potrzebujesz danych zdarzeniowych, danych śledzących ani xG, by obliczyć Elo. Historyczne rankingi można zbudować z dowolnej epoki tak daleko wstecz, jak istnieją wyniki spotkań.
Wychwytuje siłę rywala. Drużyna z 22 zwycięstwami może wyglądać elitarnie. Drużyna z 22 zwycięstwami wobec stron z dolnej tabeli i bez zwycięstw wobec szóstki z góry nie jest elitarna. Elo nagradza pierwszy wzorzec mniej niż naiwne tabele punktowe, bo zwycięstwa były wobec słabszych rankingów.
Matematyka jest wystarczająco prosta do audytu. Brak czarnej skrzynki. Możesz sam ponownie obliczyć ranking dowolnej drużyny mając historię meczów. Ta audytowalność ma znaczenie w analityce, bo pozwala testować i stroić wartość K, ważenie różnicą bramek i bonus za boisko własne bez zespołu data science.
Produkuje pojedynczą liczbę. Mimo wszystkich wad podsumowań jednoliczbowych, dobrze się komunikują. "Drużyna A ranking 1720 vs Drużyna B 1548" jest zrozumiałe w sposób, w jaki "Drużyna A różnica npxG +15,2 w 28 meczach" nie jest dla casualowego kibica.
Porównanie międzyligowe (z kalibracją). Klubowe Elo można dostosować do siły ligi za pomocą równoległego "Elo ligowego", które ocenia rozgrywki względem siebie. To umożliwia porównanie międzyligowe, czego naiwne porównania procentu zwycięstw nie potrafią.
Gdzie Elo wprowadza w błąd
Cztery realne ograniczenia do zrozumienia, zanim zaufasz kolumnie rankingowej.
Opóźnienie formy. Elo aktualizuje się stopniowo. Drużyna na gorącej serii pięciu zwycięstw nie skacze w rankingach; wspina się stabilnie. Drużyna w kryzysie nie spada na łeb na szyję; dryfuje w dół. Krótkoterminowa forma jest niedoważona z założenia. Niektórzy analitycy używają "formy przesuwnej" obok Elo, by połączyć wrażliwość na niedawną formę ze stabilnością sumy sezonu.
Jakość rywala zakładana płaska w meczu. Elo zakłada, że drużyna z rankingiem 1700 gra z siłą 1700 przez cały mecz. W rzeczywistości rotacja składu, zmęczenie, kontuzja w trakcie meczu i decyzje taktyczne oznaczają, że siła się waha. Elo traktuje każdy mecz jako czysty pojedynek "ranking vs ranking", co jest uproszczeniem, którym realny mecz nigdy nie jest.
Międzynarodowy transfer rankingu klubu. Klubowy ranking Elo nie przechodzi czysto na wydajność reprezentacji w turniejach. AFCON, Euro, Mistrzostwa Świata, to spotkania, gdzie klubowe rankingi Elo zawodników są w dużej mierze nieistotne, bo reprezentacje mieszają zawodników z różnych kontekstów klubowych. Używanie klubowego Elo do przewidywania międzynarodowych meczów turniejowych to błąd kategorii.
Regresja przedsezonowa. Ranking awansowanej drużyny z niższego szczebla zeszłego sezonu przewartościowuje jej obecną siłę na wyższym szczeblu. Wiele systemów Elo stosuje "regresję" między sezonami, redukując ranking każdej drużyny w stronę średniej, by uwzględnić rotację składu. Dokładna kwota regresji to kwestia osądu, a różni dostawcy używają różnych wartości.
Wrażliwość wartości K. Responsywność Elo silnie zależy od K. System z K za małym staje się nieresponsywny na realne zmiany siły. System z K za dużym waha się dziko na wariancji jednego meczu. "Właściwe" K dla piłki nożnej jest empirycznie strojone, a różni dostawcy produkują różne wartości K.
Użyteczna reguła: Elo to dobre bazowe podsumowanie siły drużyny, nie precyzyjny ranking. Jest najużyteczniejsze jako punkt startowy, który inne sygnały (niedawna forma, różnica xG, kontekst kadrowy) udoskonalają.
Jak Tactiq używa sygnałów siły drużyny w analizie
Analiza Tactiq zawiera sygnał siły drużyny wyprowadzony z historii meczów jako jedno z kilku wejść. Sygnał przyczynia się do bazowego prawdopodobieństwa każdego wyniku meczu, obok niedawnej formy, różnicy xG, historii spotkań bezpośrednich i kontekstu kadrowego. Konkretny sposób, w jaki sygnały siły drużyny łączą się z resztą tego, co analiza odczytuje, pozostaje w produkcie.
Co użytkownik widzi na karcie meczu:
- Trójki prawdopodobieństw dla wyniku, kwalifikowane wskaźnikiem pewności odzwierciedlającym, jak stabilne są bazowe sygnały dla tego konkretnego spotkania.
- Oczekiwane gole dla każdej strony z niedawnym trendem.
- Pisana analiza, która nazywa wzorzec spotkania zwykłym językiem: "Strona gospodarzy wchodzi jako silniejsza strona w niedawnej formie i historii meczowej, ale niedawna kreacja szans pozostała w tyle za stroną gości."
- Brak danych z rynku zewnętrznego gdziekolwiek. Brak przekierowań do platform stron trzecich. Brak waluty wirtualnej. Tylko analiza statystyczna.
Analiza nie wyświetla surowej liczby Elo; pokazuje taktyczny odczyt, który implikuje bazowy obraz siły drużyny.
Wnioski
Rankingi Elo kompresują siłę drużyny w pojedynczą liczbę, która aktualizuje się po każdym meczu na podstawie wyniku i jakości rywala. Matematyka jest prosta; wyjście jest interpretowalne; metryka podróżuje przez epoki i ligi.
To nie predykcja, to podsumowanie. Niedawna forma, kontuzje, zmiany taktyczne, rotacja składu, żaden z nich nie pokazuje się w Elo bezpośrednio. Używanie Elo jako uzupełnienia bogatszej analizy działa dobrze. Używanie go jako jedynego wejścia gubi fakturę, która decyduje o większości nowoczesnych meczów.
Tactiq jest zbudowany, by odczytywać sygnały siły drużyny obok bogatszego kontekstu. Analiza pokazuje świadomą predykcję spotkania z kwalifikowaną pewnością zwykłym językiem i nigdy nie miesza statystycznego sygnału z danymi z rynku zewnętrznego. Ponad 1.200 rozgrywek, lokalizacja w 32 językach, darmowy poziom z ośmioma analizami dziennie, bez karty.
Jeśli śledziliście serię, słownictwo metryczne obejmuje teraz jak AI przewiduje mecze piłkarskie, xG, xA, npxG, PPDA, Field Tilt, akcje progresywne, SCA/GCA oraz xPts. Elo dołącza do kolekcji jako baza siły drużyny, na której te inne metryki nakładają się.