Оценка Брайера: как оцениваются футбольные прогнозы
Большинство приложений футбольного прогноза рекламируют точность. «70% точности» звучит впечатляюще. «80% наших топ-выборов прошли» звучит ещё более впечатляюще. Заявления о точности доминируют в этом пространстве. Они также почти бессмысленны.
Правильный способ оценить прогнозиста, это не точность. Это калибровка. Прогнозист, чьи выборы с вероятностью 70% правы в 70% случаев (не в 90%, не в 50%), делает свою работу. Прогнозист, чьи 70% выборы правы в 85% случаев, недостаточно уверен (вероятно ценен), но не калиброван. Прогнозист, чьи 70% выборы правы в 55% случаев, громкий (вероятно бесполезен).
Оценка Брайера, это метрика, оценивающая калибровку. Она была стандартом в академических исследованиях прогнозирования 75 лет, и так любого футбольного прогнозиста, заслуживающего внимания, оценивают честно.
Эта статья объясняет, что Брайер реально измеряет, как вычислить его самостоятельно, какие бенчмарки и почему калибровка, это сигнал, который вы должны требовать от любого инструмента прогноза.
Что Брайер реально измеряет
Брайер, это оценка квадратичной ошибки между прогнозом и реальностью. Чем ниже, тем лучше калибровано.
Для трёхсторонних футбольных исходов (победа хозяев, ничья, победа гостей) каждый матч производит три прогнозных числа, в сумме дающие 1,0. Фактический результат производит три числа 0 или 1 (1 для исхода, который произошёл, 0 для остальных).
Формула за матч: Brier = Σ (прогноз, факт)^2 / 3
Итак, прогноз [0,60, 0,25, 0,15] для хозяев/ничьей/гостей на матч, закончившийся победой хозяев:
- Хозяева: (0,60, 1,00)^2 = 0,16
- Ничья: (0,25, 0,00)^2 = 0,0625
- Гости: (0,15, 0,00)^2 = 0,0225
- Сумма: 0,245
- Делим на 3: 0,0817
Прогноз, говоривший [0,95, 0,03, 0,02] на этот же матч (хозяева победили):
- Сумма: 0,0025 + 0,0009 + 0,0004 = 0,0038
- Делим на 3: ≈ 0,0013
Уверенный правильный прогноз набирает намного лучше. Но уверенный неправильный прогноз получает сильное наказание:
- [0,95, 0,03, 0,02] на матче, закончившемся ничьей:
- Хозяева: (0,95, 0)^2 = 0,9025
- Ничья: (0,03, 1)^2 = 0,9409
- Гости: (0,02, 0)^2 = 0,0004
- Сумма: 1,8438
- Делим на 3: ≈ 0,6146, катастрофа
Уверенность вознаграждается, когда обоснована, и наказывается, когда нет. Усреднённый по сотням матчей, Брайер автоматически отделяет калиброванных прогнозистов от громких.
Почему калибровка важнее точности
Рассмотрим двух прогнозистов.
Прогнозист A всегда говорит 95% хозяева, 3% ничья, 2% гости на каждом домашнем матче стороны топ-шести. Прав примерно в 60% случаев.
Прогнозист B говорит 62% хозяева, 24% ничья, 14% гости на тех же матчах. Прав в 62%.
Кто лучше? По точности A впереди (60% против 62% близко). По калибровке B значительно впереди. 95% выборы A ошибаются в 40% случаев, что ужасно. 62% выборы B правы в 62% случаев, что честно.
Оценки Брайера говорят, кто из них правильно читает базовый сигнал. У A Брайер будет ужасным, потому что вероятности 95% возводятся в квадрат, когда они ошибочны. У B Брайер будет отличным, потому что вероятности соответствуют реальности.
Это важно тремя практическими способами:
Калибровка риска. Если вы используете прогноз для принятия любого решения вниз по течению (даже случайное «какой матч интереснее всего смотреть»), знание того, насколько надёжна вероятность, имеет значение. 95% от плохого прогнозиста стоят меньше, чем 62% от хорошего.
Сравнение между прогнозистами. Нельзя сравнивать двух прогнозистов по сырой точности. Тот, кто выбирает только фаворитов, будет выглядеть «точнее», чем тот, кто включает аутсайдеров в прогнозы. Брайер работает независимо от распределения вероятностей.
Честность. Калиброванные прогнозисты меньше склонны к преувеличениям. Прогнозист, знающий, что его оценят по Брайеру, не хвастается. Прогнозист, знающий, что его оценят только по точности, имеет стимул выбирать только фаворитов и накачивать линию точности.
Бенчмарки Брайера для футбола
Приблизительные бенчмарки Брайера для трёхсторонних футбольных исходов (хозяева / ничья / гости):
- Базовый «всегда ничья» (говорит, что каждый матч 33/33/33): около 0,25
- Случайный вероятностный базовый: около 0,25
- Базовая модель на форме (только победы-поражения): около 0,225
- Приличная публичная модель, использующая xG + форму: 0,195-0,215
- Закрывающая линия букмекера: около 0,195
- Элитная модель с событийными данными + тщательной калибровкой: 0,185-0,195
Оценки ниже 0,185 редки; оценки выше 0,22 недотягивают. Большинство серьёзной аналитической работы живёт в диапазоне 0,19-0,21, близко к, но обычно не превосходя букмекерские рынки (которые имеют ценовое давление и острые деньги как механизм калибровки).
Как Tactiq думает о Брайере и калибровке
Tactiq ведёт внутреннее отслеживание калибровки по выходу анализа, чтобы подтвердить, что индикаторы уверенности на карточках матчей соответствуют частотам реальных исходов с ожидаемой частотой. Индикатор уверенности, говорящий «высокая уверенность», должен картироваться на матчи, где топ-вероятность действительно реализуется с высокой частотой. Индикатор уверенности, говорящий «тесно», должен картироваться на матчи, где исходы действительно изменчивы.
Конкретные значения Брайера, дашборды калибровки и периодичность повторной настройки остаются внутри продукта. До пользователя доходит анализ с указанием уверенности, где индикатор уверенности был калиброван против фактических исходов, а не выдуман как маркетинговый сигнал. Опубликованная методология копируется и неправильно калибруется в течение недель.
Что пользователь видит на карточке матча:
- Тройки вероятностей исхода с видимым индикатором уверенности, картирующимся на настоящую полосу калибровки.
- Ожидаемые голы для каждой стороны.
- Письменный анализ, объясняющий чтение простым языком.
- Никаких внешних рыночных данных. Никаких перенаправлений на сторонние платформы. Никакой виртуальной валюты. Только статистический анализ.
Индикатор уверенности, это пользовательская опора на калибровку. «Высокая уверенность» означает, что сигнал силён; «тесно» означает, что исходы были действительно изменчивы.
Итог
Оценка Брайера, это то, как прогнозисты реально оцениваются. Инструмент, рекламирующий точность без показа калибровки, просит вас доверять паттерну громкого прогнозиста. Инструмент, готовый быть оценённым по калибровке, показывающий индикаторы уверенности, действительно отражающие изменчивость исходов, это тот, который выдержит со временем.
Можно вычислить Брайер самому на прогнозах любого прогнозиста, если он публикует вероятности рядом с результатами. Формула проста, бенчмарки хорошо известны, и честная оценка занимает несколько минут работы в таблице.
Tactiq встраивает калибровку в обращённый к пользователю индикатор уверенности и валидирует её внутренне. Анализ читает каждый матч с уверенностью, соответствующей базовой неопределённости, а не громкими заявлениями, не выдерживающими проверки выборкой. Tactiq это независимый статистический анализ, не связанный с внешними рынками. Более 1200 соревнований, локализация на 32 языка, бесплатный тариф из восьми анализов в день, без необходимости карты.
Если вы следите за серией, словарь метрик теперь охватывает как ИИ анализирует футбольные матчи, xG, xA, npxG, PPDA, Field Tilt, прогрессивные действия, SCA/GCA, xPts и рейтинги Эло. Брайер присоединяется к ним как мета-метрика, оценивающая честность всех остальных метрик.