Оцінка Brier пояснена: як оцінюються футбольні прогнози
Більшість футбольних аналітичних додатків продають точність. «70% точності» звучить вражаюче. «80% наших топ-виборів пройшли» звучить ще вражаюче. Заяви про точність домінують у просторі. Вони також майже безглузді.
Правильний спосіб оцінити прогнозиста, це не точність. Це калібрування. Прогнозист, чиї 70%-ймовірнісні вибори правильні 70% часу (не 90%, не 50%), виконує роботу. Прогнозист, чиї 70%-вибори правильні 85% часу, недостатньо впевнений (ймовірно, цінний), але не калібрований. Прогнозист, чиї 70%-вибори правильні 55% часу, голосний (ймовірно, безкорисний).
Оцінка Brier, це метрика, яка оцінює калібрування. Вона є стандартом в академічному дослідженні прогнозування 75 років, і саме так будь-який футбольний прогнозист, вартий слухання, оцінюється чесно.
Ця стаття проходить через те, що насправді вимірює Brier, як обчислити її самостійно, які бенчмарки, і чому калібрування, це сигнал, який ви повинні вимагати від будь-якого інструменту аналізу.
Що насправді вимірює Brier
Brier, це оцінка квадратичної помилки між прогнозом і реальністю. Чим нижче, тим краще калібровано.
Для трьох-варіантних футбольних результатів (перемога господарів, нічия, перемога гостей) кожен матч виробляє три прогнозних числа, що в сумі дорівнюють 1,0. Фактичний результат виробляє три числа 0-чи-1 (1 для результату, що стався, 0 для інших).
Формула за матч: Brier = Σ (прогноз - фактичний)^2 / 3
Тож прогноз [0,60, 0,25, 0,15] для господарі/нічия/гості на матч, що закінчився перемогою господарів:
- Господарі: (0,60 - 1,00)^2 = 0,16
- Нічия: (0,25 - 0,00)^2 = 0,0625
- Гості: (0,15 - 0,00)^2 = 0,0225
- Сума: 0,245
- Поділити на 3: 0,0817
Прогноз, що сказав [0,95, 0,03, 0,02] на той самий матч (господарі виграли):
- Сума: 0,0025 + 0,0009 + 0,0004 = 0,0038
- Поділити на 3: ≈ 0,0013
Впевнений правильний прогноз оцінюється набагато краще. Але впевнений неправильний прогноз карається жорстко:
- [0,95, 0,03, 0,02] на матч, що закінчився внічию:
- Господарі: (0,95 - 0)^2 = 0,9025
- Нічия: (0,03 - 1)^2 = 0,9409
- Гості: (0,02 - 0)^2 = 0,0004
- Сума: 1,8438
- Поділити на 3: ≈ 0,6146, катастрофа
Впевненість винагороджується, коли виправдана, і карається, коли ні. Усереднено по сотнях матчів, Brier автоматично відокремлює каліброваних прогнозистів від голосних.
Чому калібрування важливіше, ніж точність
Розгляньте двох прогнозистів.
Прогнозист A завжди каже 95% господарі, 3% нічия, 2% гості на кожен домашній матч топ-шістки. Правий приблизно в 60% з них.
Прогнозист B каже 62% господарі, 24% нічия, 14% гості на ті самі матчі. Правий у 62% з них.
Хто кращий? За точністю, A попереду (60% проти 62% близько). За калібруванням, B значно попереду. 95%-вибори A йдуть неправильно 40% часу, що жахливо. 62%-вибори B правильні 62% часу, що чесно.
Оцінки Brier розповідають вам, хто з них правильно читає базовий сигнал. Brier A буде жахливою, бо ймовірності 95% зводяться у квадрат, коли вони неправильні. Brier B буде відмінною, бо ймовірності відповідають реальності.
Це має значення трьома практичними способами:
Калібрування ризику. Якщо ви використовуєте аналіз для прийняття будь-якого рішення нижче за течією (навіть випадкового «який матч найцікавіше дивитися»), знання, наскільки надійна ймовірність насправді, має значення. 95% від поганого прогнозиста коштують менше, ніж 62% від хорошого.
Порівняння між прогнозистами. Не можна порівнювати двох прогнозистів за голою точністю. Хтось, хто вибирає тільки фаворитів, виглядатиме більш «точним», ніж той, хто включає аутсайдерів у свої прогнози. Brier працює незалежно від розподілу ймовірностей.
Чесність. Калібровані прогнозисти менш схильні переоцінювати. Прогнозист, який знає, що його оцінять за Brier, не вихваляється. Прогнозист, який знає, що його оцінять лише за точністю, має стимул вибирати лише фаворитів і накачувати лінію точності.
Бенчмарки Brier для футболу
Приблизні бенчмарки на Brier для трьох-варіантних футбольних результатів (господарі / нічия / гості):
- Завжди-нічия базова лінія (каже, кожен матч, це 33/33/33): близько 0,25
- Випадкова базова лінія ймовірності: близько 0,25
- Базова модель на формі (тільки перемоги-поразки): близько 0,225
- Гідна публічна модель з xG + формою: 0,195-0,215
- Закриваючі лінії букмекерів: близько 0,195
- Елітна модель з даними подій + ретельним калібруванням: 0,185-0,195
Оцінки нижче 0,185 рідкі; оцінки вище 0,22 не дотягують. Більшість серйозних аналітичних робіт живе в діапазоні 0,19-0,21, близько до, але зазвичай не б'ючи закриваючі лінії букмекерів (які мають ціновий тиск і гострі гроші як свій механізм калібрування).
Як Tactiq думає про Brier і калібрування
Tactiq проводить внутрішнє відстеження калібрування по виходу аналізу, щоб підтвердити, що індикатори впевненості на матчевих картках відповідають частотам реальних результатів з очікуваною швидкістю. Індикатор впевненості, що каже «висока впевненість», має відображати матчі, де топ-ймовірність справді розгортається з високою частотою. Індикатор впевненості, що каже «тісно», має відображати матчі, де результати справді змінні.
Конкретні значення Brier, панелі калібрування й каденс пере-налаштування залишаються в межах продукту. Те, що досягає користувача, це аналіз з оцінкою впевненості, де індикатор впевненості було калібровано проти фактичних результатів, а не вигадано як маркетинговий сигнал. Опубліковані методології копіюються й неправильно калібруються за тижні.
Що користувач бачить на матчевій картці:
- Трійки ймовірностей результату з видимим індикатором впевненості, що відображає справжню смугу калібрування.
- Очікувані голи для кожної сторони.
- Письмовий аналіз, що пояснює читання зрозумілою мовою.
- Жодних зовнішніх ринкових даних. Жодних перенаправлень на сторонні платформи. Жодної віртуальної валюти. Лише статистичний аналіз.
Індикатор впевненості, це користувацька ручка на калібрування. «Висока впевненість» означає, що сигнал сильний; «тісно» означає, що результати справді змінні.
Висновок
Оцінка Brier, це те, як прогнозисти насправді оцінюються. Інструмент, що рекламує точність без показу калібрування, просить вас довіряти закономірності голосного прогнозиста. Інструмент, готовий бути оціненим за калібруванням, що показує індикатори впевненості, які щиро відображають варіабельність результатів, це той, що тримається в часі.
Можна обчислити Brier самостійно на аналізах будь-якого прогнозиста, якщо він публікує ймовірності поряд із результатами. Формула проста, бенчмарки добре відомі, і чесна оцінка займає кілька хвилин роботи з електронною таблицею.
Tactiq будує калібрування в користувацький індикатор впевненості й валідує його внутрішньо. Аналіз читає кожен матч з впевненістю, що відповідає базовій невпевненості, замість голосних заяв, які не виживають перевірки вибірки. 1200+ змагань, локалізація 32 мовами, безкоштовний рівень з восьми аналізів на день, без потреби кредитної картки.
Якщо ви стежили за серією, словник метрик тепер охоплює як ШІ аналізує футбольні матчі, xG, xA, npxG, PPDA, Field Tilt, прогресивні дії, SCA/GCA, xPts та рейтинги Elo. Brier приєднується до них як мета-метрика, що оцінює чесність кожної іншої метрики.