Распределение Пуассона и моделирование голов в футболе

Часто задаваемые вопросы

Что такое распределение Пуассона в одном предложении?
Пуассон описывает, как часто происходит редкое событие в фиксированный период при заданной средней частоте. В футболе «редкое событие», это гол, «фиксированный период», это 90 минут, а «частота» выводится из качества команды, xG или контекста матча. Распределение говорит вероятность 0 голов, 1 гола, 2 голов и так далее.
Почему Пуассон, это стандарт для футбольных голов?
Три причины. Голы относительно редки (в среднем около 2,5 за матч в топ-лигах). Они происходят в примерно случайные моменты внутри матча с малой кластеризацией, как только корректируется состояние игры. И математика Пуассона достаточно проста для быстрого вычисления, что делает практичным симулировать тысячи возможных исходов матча. Сочетание делает его рабочей лошадкой футбольного моделирования.
Какие входы у пуассоновской модели голов?
Две частоты: по одной на каждую команду. Самый распространённый подход выводит частоты из силы команды (атакующая частота минус защитная частота соперника, с встроенным преимуществом хозяев). Современные варианты подают значения xG за матч вместо частот по победам, производя более отзывчивые и точные распределения.
Где Пуассон ломается?
Три основных режима провала. Состояние поздней игры: команда, догоняющая дефицит, играет иначе, чем защищающая преимущество, поэтому частота голов не постоянна за 90 минут. Корреляция между командами: если сторона пропускает поздний гол, она часто пропускает другой в той же фазе, что Пуассон трактует как независимое. Очень низко- или высокозабивные матчи: хвосты Пуассона недопредставляют экстремальные исходы.
Использует ли Tactiq Пуассон напрямую в анализе?
Симуляционная оценка вероятности, это одна из нескольких техник, входящих в тройки вероятностей, показываемые на карточке матча. Конкретный подход к симуляции, как выводятся частоты и как модель обрабатывает известные слабости Пуассона, остаётся внутри продукта. Для пользователя эффект в том, что три вероятности на экране отражают симулированное распределение исходов, а не вручную закодированное правило.
Есть ли альтернативы Пуассону получше?
Отрицательное биномиальное, бивариантный Пуассон, Диксон-Коулз (добавляющее корреляцию для низкоконтробильных матчей) и распределения Скеллама все предлагались как уточнения. Каждое схватывает конкретную слабость базового Пуассона ценой дополнительной сложности. Большинство продакшн-моделей футбола используют одно из этих уточнений, а не сырой Пуассон.