卜瓦松分布與足球進球建模

常見問題

用一句話解釋卜瓦松分布是什麼?
卜瓦松描述在固定時段內,給定平均率時,一個稀有事件發生的次數。在足球裡,「稀有事件」是進球,「固定時段」是 90 分鐘,「平均率」由球隊實力、xG 或比賽情境推導出來。這個分布告訴你 0 球、1 球、2 球等等的機率。
為何卜瓦松成為足球進球建模的預設?
三個原因。進球相對稀少(頂級聯賽平均約每場 2.5 球)。在修正比賽狀態之後,進球在比賽中大致以接近隨機的時點發生,幾乎沒有顯著聚集。而卜瓦松的數學足夠簡單可以快速計算,使模擬數千種可能的比賽結果在實務上可行。三者結合,使它成為足球建模的主力工具。
卜瓦松進球模型的輸入是什麼?
兩個率:每隊一個。最常見的做法是從球隊實力推導出率(攻擊率減去對手防守率,已內建主場優勢)。現代變體改餵入每場 xG 數值,產生反應更快也更精確的分布。
卜瓦松在哪裡失效?
三種主要失敗模式。後段比賽狀態:落後追分的球隊與護住領先的球隊踢法不同,因此進球率在 90 分鐘內並非恆定。兩隊之間的相關性:一隊若於後段失球,常會在同一階段再失一球,但卜瓦松把這視為獨立。極低或極高得分的比賽:卜瓦松的尾端對極端結果代表不足。
Tactiq 在分析中直接使用卜瓦松嗎?
基於模擬的機率估計是促成比賽卡上機率三元組的多種技術之一。具體的模擬方式、率的推導,以及模型如何處理卜瓦松已知的弱點,這些細節留在產品內部。對使用者而言,效果是螢幕上的三個機率反映的是模擬出的結果分布,而不是手工編寫的規則。
有沒有比卜瓦松更好的替代?
負二項分布、二維卜瓦松、Dixon-Coles(為低得分比賽加入相關性)以及 Skellam 分布都被提出作為改良。每個都針對基本卜瓦松的某個弱點,代價是更高的複雜度。多數量產的足球模型使用其中一種改良版,而不是原始卜瓦松。