Рейтинги Эло в футболе: как количественно оценивается сила команды
Если вы когда-либо заходили в превью футбольного матча и видели что-то вроде «рейтинг команды A 1720, рейтинг команды B 1548», вы смотрели на рейтинг Эло. Если вы видели график силы клуба за десятилетие с линиями, поднимающимися и падающими через кризисы и золотые эры, это почти наверняка было Эло.
Эло, это самое близкое, что у футбола есть к универсальной метрике силы команды. Изначально разработанная для оценки шахматистов, она была адаптирована для футбола, баскетбола, тенниса, киберспорта и других. Версия в футболе проще шахматной, но принципы те же. И как любая метрика одного числа, её достаточно часто читают неправильно, чтобы стоило понять, как она реально работает.
Эта статья объясняет, что Эло схватывает о силе команды, как оно вычисляется, почему стало стандартом по аналитическим дашбордам, и какие ловушки ловят болельщиков, относящихся к рейтингу как к оракулу, а не сводке.
Что такое рейтинги Эло, в одном абзаце
У каждой команды есть рейтинг, обычно в диапазоне 1200-2100 в футбольной клубной адаптации. После каждого матча рейтинги обеих команд обновляются на основе того, как они выступили относительно ожидания. Если команда с рейтингом 1700 побеждает команду с рейтингом 1500, более сильная сторона ожидаемо побеждала, поэтому их рейтинг едва меняется. Если вместо этого побеждает сторона с 1500, их рейтинг подскакивает, а у стороны 1700 падает, потому что результат противоречит ожиданию. Ничья против ожидания? Разница рейтингов поглощает сюрприз пропорционально.
За сотни матчей рейтинг стабилизируется вокруг истинной силы каждой команды. Поднимайтесь по рейтингам, побеждая сильные стороны; скатывайтесь, проигрывая слабым. Числа значат конкретное: разрыв в 100 пунктов рейтинга соответствует примерно 64-36 фавориту, разрыв в 200 пунктов примерно 76-24, разрыв в 400 пунктов примерно 91-9.
Как Эло реально вычисляется
Математика без сложности:
- Ожидаемый результат для команды A против команды B:
E_A = 1 / (1 + 10^((R_B, R_A) / 400))
Где R_A и R_B, это текущие рейтинги команд. Знаменатель 400, это конвенция из шахмат; футбольные варианты Эло иногда используют другие масштабы, но 400 стандарт.
- Обновление после матча:
новый R_A = старый R_A + K × (фактический результат, E_A)
«Фактический результат», это 1 за победу, 0,5 за ничью, 0 за поражение с точки зрения A. K, это константа. Шахматы используют K=16-32 в зависимости от уровня опыта. Футбольное Эло часто использует K=20-50, причём более высокие значения дают более отзывчивые рейтинги.
Итак, после матча:
- Фаворит побеждает: малое положительное изменение для фаворита, малое отрицательное для аутсайдера.
- Фаворит сводит вничью (сюрприз): малое отрицательное для фаворита, малое положительное для аутсайдера.
- Фаворит проигрывает (большой сюрприз): значительное отрицательное для фаворита, значительное положительное для аутсайдера.
- Аутсайдер побеждает: то же самое с другой стороны.
Два специфичных для футбола уточнения, которые большинство публичных систем Эло добавляют:
Взвешивание разницей мячей. Победа 3-0 считается больше, чем 1-0. Большинство публичных вариантов Эло умножают K на коэффициент, основанный на разнице мячей (K × √GoalDiff или подобное). Без этого система трактует каждый результат как бинарный, теряя информацию.
Преимущество хозяев. Команды-хозяева получают малый бонус к рейтингу (или гости получают штраф) перед расчётом ожиданий. ClubElo использует примерно 100 пунктов.
Эти уточнения производят футбольно-адаптированное Эло, которое значимо отслеживает силу команды за сезон.
Почему Эло стало стандартом
Эло закрепилось в футболе по сочетанию прагматических и тактических причин.
Входы универсально доступны. Результаты матчей и рейтинги соперников, это всё, что нужно. Не нужно ни событийных данных, ни трекинговых данных, ни xG, чтобы вычислить Эло. Исторические рейтинги можно построить из любой эпохи, до которой доходят результаты матчей.
Оно схватывает силу соперника. Команда с 22 победами может выглядеть элитной. Команда с 22 победами против сторон нижней половины таблицы и без побед против топ-шести не элитна. Эло вознаграждает первый паттерн меньше, чем наивные таблицы очков, потому что победы были против более слабых рейтингов.
Математика достаточно проста для аудита. Никаких чёрных ящиков. Можно пересчитать рейтинг любой команды самому, имея историю матчей. Эта возможность аудита важна в аналитике, потому что позволяет тестировать и настраивать значение K, взвешивание разницей мячей и бонус хозяев без команды специалистов по данным.
Производит одно число. Несмотря на все недостатки одночисловых сводок, они хорошо коммуницируют. «Рейтинг команды A 1720 против команды B 1548» понятен так, как «дифференциал npxG команды A +15,2 за 28 матчей» нет для случайного болельщика.
Межлиговое сравнение (с калибровкой). Клубное Эло можно скорректировать на силу лиги, используя параллельное «лиговое Эло», оценивающее соревнования друг против друга. Это позволяет межлиговое сравнение, чего наивные сравнения процента побед не могут делать.
Где Эло вводит в заблуждение
Четыре реальных ограничения, которые надо понять, прежде чем доверять колонке рейтинга.
Запаздывание формы. Эло обновляется постепенно. Команда на горячей серии из пяти побед не прыгает вверх по рейтингам; она поднимается стабильно. Команда в кризисе не падает камнем; она дрейфует вниз. Краткосрочная форма недооценивается по дизайну. Некоторые аналитики используют «скользящую форму» наряду с Эло, чтобы сочетать чувствительность к недавней форме со стабильностью полного сезона.
Качество соперника предполагается ровным внутри матча. Эло предполагает, что команда с рейтингом 1700 играет на силе 1700 весь матч. В реальности ротация состава, усталость, травмы по ходу матча и тактические решения означают, что сила колеблется. Эло трактует каждый матч как чистую дуэль «рейтинг против рейтинга», что является упрощением, которым реальный матч никогда не бывает.
Международный перенос клубного рейтинга. Клубный рейтинг Эло не переносится чисто на турнирную производительность сборной. Кубок Африки, Евро, Чемпионат мира, это матчи, где клубные рейтинги Эло игроков в основном неактуальны, потому что сборные смешивают игроков из разных клубных контекстов. Использовать клубное Эло для прогноза международных турнирных матчей, это категориальная ошибка.
Предсезонная регрессия. Рейтинг повышенной команды из лиги нижнего ранга прошлого сезона завышает её текущую силу на более высоком уровне. Многие системы Эло применяют «регрессию» между сезонами, снижая рейтинг каждой команды к среднему, чтобы учесть текучесть состава. Точная величина регрессии, это вопрос суждения, и разные провайдеры используют разные значения.
Чувствительность к значению K. Отзывчивость Эло сильно зависит от K. Система с слишком малым K становится неотзывчивой к реальным изменениям силы. Система с слишком большим K дико колеблется на разбросе одного матча. «Правильное» K для футбола эмпирически настроено, и разные провайдеры производят разные значения K.
Полезное правило: Эло, это хорошая базовая сводка силы команды, не точный рейтинг. Оно наиболее полезно как отправная точка, которую другие сигналы (недавняя форма, дифференциал xG, контекст состава) уточняют.
Как Tactiq использует сигналы силы команды в анализе
Анализ Tactiq включает сигнал силы команды, выведенный из истории матчей, как один из нескольких входов. Сигнал входит в базовую вероятность каждого исхода матча, наряду с недавней формой, дифференциалом xG, историей личных встреч и контекстом состава. Конкретный способ сочетания сигналов силы команды с остальным, что читает анализ, остаётся внутри продукта.
Что пользователь видит на карточке матча:
- Тройки вероятностей исхода, уточнённые индикатором уверенности, отражающим, насколько стабильны базовые сигналы для этого конкретного матча.
- Ожидаемые голы для каждой стороны с недавним трендом.
- Письменный анализ, называющий паттерн противостояния простым языком: «Хозяева входят как более сильная сторона по недавней форме и истории матчей, но недавнее создание шансов у них отстаёт от гостей».
- Никаких внешних рыночных данных. Никаких перенаправлений на сторонние платформы. Никакой виртуальной валюты. Только статистический анализ.
Анализ не показывает сырое число Эло; он показывает тактическое чтение, которое подразумевает базовая картина силы команды.
Итог
Рейтинги Эло сжимают силу команды в одно число, обновляемое после каждого матча на основе результата и качества соперника. Математика проста; результат интерпретируем; метрика путешествует через эпохи и лиги.
Это не прогноз, это сводка. Недавняя форма, травмы, тактические изменения, ротация состава, ничто из этого не проявляется в Эло напрямую. Использовать Эло как дополнение к более богатому анализу работает хорошо. Использовать его как единственный вход упускает текстуру, решающую большинство современных матчей.
Tactiq построен так, чтобы читать сигналы силы команды наряду с более богатым контекстом. Анализ показывает чтение противостояния с указанием уверенности простым языком и никогда не смешивает статистический сигнал с внешними рыночными данными. Tactiq это независимый статистический анализ, не связанный с внешними рынками. Более 1200 соревнований, локализация на 32 языка, бесплатный тариф из восьми анализов в день, без необходимости карты.
Если вы следите за серией, словарь метрик теперь охватывает как ИИ анализирует футбольные матчи, xG, xA, npxG, PPDA, Field Tilt, прогрессивные действия, SCA/GCA и xPts. Эло присоединяется к коллекции как базовый уровень силы команды, поверх которого надстраиваются другие метрики.