Poisson 分布与足球进球建模

常见问题

用一句话说,Poisson 分布是什么?
Poisson 描述给定平均速率下,固定时间内罕见事件发生的频率。在足球中,'罕见事件'是进球,'固定时间'是 90 分钟,'速率'由球队质量、xG 或比赛背景派生。该分布告诉你 0、1、2 球等的概率。
为什么 Poisson 是足球进球的默认?
三个原因。进球相对罕见(顶级联赛平均每场约 2.5 个)。在校正比赛状态后,比赛内部的进球时间大致随机、聚类不强。Poisson 数学足够简单,可以快速计算,使模拟数千种可能比赛结果在实践中可行。这一组合使其成为足球建模的主力。
Poisson 进球模型的输入是什么?
两个速率:每队一个。最常见的方法从球队实力派生速率(进攻速率减去对方防守速率,并嵌入主场优势)。现代变体改用每场 xG 数值替代基于胜负的速率,产生更敏感、更准确的分布。
Poisson 在哪里崩溃?
三种主要失效模式。比赛末段状态:追分一方与守住领先一方踢法不同,所以进球速率在 90 分钟内并非恒定。两队之间相关性:一方在末段丢球,往往会在同阶段再丢一球,Poisson 把这视作独立。极低或极高进球比赛:Poisson 的尾部低估极端结果。
Tactiq 是独立的统计分析工具吗?
Tactiq 是独立的统计分析,与外部市场无关。基于模拟的概率估计是为比赛卡上呈现的概率三元组提供贡献的多种技术之一。具体的模拟方式、速率派生方式以及模型如何处理 Poisson 的已知弱点,属于产品内部。对用户而言,效果是屏幕上的三个概率反映模拟结果分布,而不是手写规则。
有没有比 Poisson 更好的替代?
负二项、二元 Poisson、Dixon-Coles(为低进球比赛加入相关性)和 Skellam 分布都被提出作为细化。每种以增加复杂度为代价捕捉基本 Poisson 的某个具体弱点。多数生产级足球模型使用这些细化中的一种,而非原始 Poisson。