ポアソン分布とサッカーにおけるゴールモデリング

よくある質問

ポアソン分布を一文で言うと何ですか?
ポアソン分布は、平均発生率が与えられたとき、まれな事象が一定期間に何回起きるかを記述します。サッカーでは、「まれな事象」はゴール、「一定期間」は90分、「発生率」はチームの質、xG、または試合の文脈から導かれます。分布は0ゴール、1ゴール、2ゴール、と続く確率を教えてくれます。
なぜポアソンがサッカーのゴールに対する標準なのですか?
3つの理由があります。ゴールは比較的まれです(トップリーグで平均1試合あたり約2.5)。試合状態を補正すれば、試合中ほぼランダムな時刻に起き、クラスタリングはほとんどありません。そしてポアソンの数学はすばやく計算できるほど単純で、何千もの可能な試合結果をシミュレートするのに実用的です。この組み合わせがサッカーモデリングの主力にしています。
ポアソンのゴールモデルへの入力は何ですか?
2つの発生率:各チームに1つずつ。最も一般的なアプローチは、チームの強さ(攻撃率から相手の守備率を引き、ホームアドバンテージを織り込む)から発生率を導きます。現代の派生形は勝利ベースの発生率の代わりにxG毎試合値を入力し、より反応性が高く正確な分布を生み出します。
ポアソンはどこで崩れますか?
主な失敗モードは3つ。試合終盤の状態:ビハインドを追うチームはリードを守るチームと違うプレーをするので、ゴール率は90分通して一定ではありません。チーム間の相関:あるチームが終盤に失点すると、同じ局面でもう1点失うことが多く、ポアソンはこれを独立として扱います。非常に低得点または非常に高得点の試合:ポアソンの裾は極端な結果を過小評価します。
Tactiqは分析でポアソンを直接使っていますか?
シミュレーションベースの確率推定は、試合カードに表示される確率の三つ組に貢献するいくつかの技法の1つです。具体的なシミュレーション手法、発生率の導出方法、モデルがポアソンの既知の弱点をどう扱うかは、製品内に留めます。ユーザーにとっての効果は、画面上の3つの確率がシミュレートされた結果分布を反映している、ということです。手書きルールではありません。
ポアソンより良い代替はありますか?
負の二項分布、二変量ポアソン、Dixon-Coles(低得点試合に相関を加える)、Skellam分布などが洗練として提案されてきました。それぞれが基本ポアソンの特定の弱点を捉えますが、複雑さが増します。ほとんどの実用サッカーモデルは生のポアソンではなく、これらの洗練のいずれかを使います。