卜瓦松分布與足球進球建模

Tactiq AI · 2026-05-07 · 閱讀 9 分鐘 · 人工智慧與足球

如果你看過賽前節目,主持人說「這場比賽預期進球線是 2.3,意味著大於 2.5 球的機率是 61%」,你看到的就是卜瓦松算術在運作。如果你看到一組像是憑空出現的機率三元組(主勝 58%、平局 25%、客勝 17%),產出它的計算幾乎一定是卜瓦松模擬。

卜瓦松是大多數足球進球模型背後的統計引擎。它已經在那裡 50 年,安靜地產出後來被以更時髦詞彙描述的機率數字。理解它如何運作,能解開許多「AI 足球預測」實際在底層做的事。

本文用白話走過卜瓦松、展示它如何具體應用於足球、它在哪裡有效、在哪裡無效,以及現代改良在它之上加了什麼。

卜瓦松到底是什麼

卜瓦松分布描述在給定平均率下,固定時間視窗內發生若干次事件的機率。

正式表達:若事件以恆定平均率 λ(lambda)每單位時間發生,且彼此獨立,則在該視窗內恰好發生 k 次事件的機率為:

P(k) = (λ^k × e^(-λ)) / k!

你不需要愛上這數學。實務意涵:

  • λ = 1 表示事件每視窗平均一次。P(0) ≈ 37%、P(1) ≈ 37%、P(2) ≈ 18%、P(3) ≈ 6%、P(4+) ≈ 2%。
  • λ = 2 表示每視窗兩次。P(0) ≈ 14%、P(1) ≈ 27%、P(2) ≈ 27%、P(3) ≈ 18%、P(4) ≈ 9%、P(5+) ≈ 5%。
  • λ = 3 表示每視窗三次。P(0) ≈ 5%、P(1) ≈ 15%、P(2) ≈ 22%、P(3) ≈ 22%、P(4) ≈ 17%、P(5+) ≈ 19%。

這個分布捕捉了平均是一回事,但具體結果以已知機率聚集在那個平均周圍。當 λ = 2,你預期 2,但 0、3、4 都各以有意義的百分比發生。

卜瓦松為何適合足球進球

三個原因讓這個假設在足球裡大致成立。

進球稀少。 大多數比賽 0 至 5 球。卜瓦松處理 0 至 5 範圍乾淨俐落;它在很高計數時會失效,但足球很少測試到那個範圍。

進球以大致獨立的時點發生。 一旦剝除比賽狀態效應(待會討論),比賽內進球以大致恆定的率發生。第 10 分鐘的進球並不會像你想像中那樣,急遽改變第 40 分鐘進球的機率。

率可由球隊實力推導出。 若 A 隊平均得分率為每場 1.5 球,而 B 隊防守率每場失 1.2 球,則 A 隊在這場對局的預期進球是某種加權混合(1.5 × 1.2 / 聯賽平均,並乘上主場優勢縮放)。卜瓦松接過那個 λ 並產出完整分布。

把這些組合起來,你得到一個可用模型:對每場比賽,推導兩隊的預期率,對每隊套用卜瓦松產出進球計數分布,將兩者結合成結果矩陣(主勝/平/客勝/大於 2.5/BTTS 等)。

卜瓦松如何構建機率三元組

對 A 隊(預期進球 1.8)對 B 隊(預期進球 1.2)的對局,模擬流程是:

  1. 對 A 隊套用 λ=1.8 的卜瓦松,計算 P(A 進 0)、P(1)、P(2)、P(3)、P(4)、P(5+)。
  2. 對 B 隊套用 λ=1.2 的卜瓦松,做同樣計算。
  3. 假設獨立性(卜瓦松第一個假設),相乘:P(A 進 N 球且 B 進 M 球) = P(A=N) × P(B=M)。
  4. 將 N > M 加總得主勝、N = M 得平局、N < M 得客勝。
  5. 必要時做歸一化。

結果:完全由兩個預期進球數字推導出整場比賽的機率三元組。對大多數比賽是不錯的擬合。

這就是「以 xG 驅動的預測模型」最簡單的樣貌:兩個數字進、一個機率分布出,卜瓦松當引擎。

卜瓦松在哪裡失效

四種真正的失敗模式,現代建模試圖修正。

比賽狀態相依性。 落後 0-1 在最後 20 分鐘追分的球隊踢法不同。他們的進球率高於賽前預期;對手的率保持類似但防守失誤觸發失球機會。獨立、恆定率的卜瓦松低估逆轉頻率,並高估穩態壓制。

平局膨脹。 在低得分比賽(每隊 λ 低於 1.5),卜瓦松同時高估 1-1 與 0-0,但整體上低估平局。Dixon 與 Coles 在 1997 年提出修正,調整結果矩陣的低分格。多數量產模型使用 Dixon-Coles 或類似方案。

兩隊間的相關性。 一隊的進球並不完全獨立於另一隊。較早失球的一方常隨比賽繼續而品質下降。二維卜瓦松模型加入小的相關性參數。沒有它,聯合結果會被當作太獨立。

極端比分。 卜瓦松分布的右尾(5-0、6-0、7-0)在原始卜瓦松中很薄,但在實際大比分對局中觀察到較常出現。現代模型套用尾端修正或使用負二項分布,後者與卜瓦松同均值但允許更大方差。

可用法則:原始卜瓦松是有用的基線,但量產模型總會加上改良。改良不改變解讀(機率三元組、大/小球、BTTS),但會讓數字對齊現實。

卜瓦松在結果機率之外的應用

卜瓦松數學能驅動多個下游指標:

預期積分(xPts)。 對每場比賽以卜瓦松模擬結果分布,計算各方的預期積分。整季加總,你得到 xPts。

視窗內預期進失球。 一隊的 xG 歷史結合卜瓦松,產生其賽季總進球的機率分布。

亞洲讓盤公平線。 把 xG 翻成亞洲讓盤賠率,使用卜瓦松模擬球差分布。

大/小球與 BTTS 機率。 全部可從卜瓦松模擬構建的結果矩陣推導。

實際上,一旦你有每隊 xG(或預期得分率),卜瓦松給你整場比賽的整片機率面,不只是勝/平/負三元組。

Tactiq 如何處理卜瓦松式的進球建模

Tactiq 的分析在管線中採用基於模擬的機率估計,作為在比賽卡上呈現機率三元組的一部分。具體做法、在基本卜瓦松之上套用的改良,以及模擬如何處理比賽狀態與對手品質互動,這些留在產品內部。

對使用者而言,效果是比賽卡上的三個機率反映的是建立在預期進球估計與球隊實力訊號之上的模擬結果分布,而不是手工編寫的啟發法。置信度指示反映分布對該特定對局輸入訊號小變動的敏感度。

使用者在比賽卡上看到的:

  • 透過模擬產出的結果機率三元組。
  • 兩隊預期進球以及近期趨勢。
  • 用白話命名結果的書面分析:「主隊在預期進球上有溫和優勢,轉化為大約 52-25-23 的機率分布。」
  • 任何地方都沒有外部市場資料。沒有重新導向到第三方平台。沒有虛擬貨幣。僅統計分析。

帶走的重點

卜瓦松是大多數足球進球建模的統計主力。它足夠簡單可快速計算、足夠好以擬合多數比賽,並且是更精細改良(Dixon-Coles、二維、負二項)建立其上的基礎。

理解卜瓦松能解開你在每個分析儀表板上看到的機率三元組。它們不是魔法;它們是來自預期進球輸入的模擬。把好模型與壞模型分開的,是修正卜瓦松已知弱點的那些改良。

Tactiq 採用基於模擬的機率估計,並套用改良以處理真實比賽的複雜性。分析在每張比賽卡上呈現經校準的機率三元組。涵蓋超過 1,200 個賽事、32 種語言本地化、免費檔每天 8 次分析、無需信用卡。

如果你一直跟著本系列讀,指標詞彙現在涵蓋 AI 如何預測足球比賽xGxAnpxGPPDA場地傾斜漸進動作SCA/GCAxPtsElo 評分Brier 分數校準。卜瓦松是把以上多數指標連結起來、產出預測時的那個機率引擎。

常見問題

用一句話解釋卜瓦松分布是什麼?
卜瓦松描述在固定時段內,給定平均率時,一個稀有事件發生的次數。在足球裡,「稀有事件」是進球,「固定時段」是 90 分鐘,「平均率」由球隊實力、xG 或比賽情境推導出來。這個分布告訴你 0 球、1 球、2 球等等的機率。
為何卜瓦松成為足球進球建模的預設?
三個原因。進球相對稀少(頂級聯賽平均約每場 2.5 球)。在修正比賽狀態之後,進球在比賽中大致以接近隨機的時點發生,幾乎沒有顯著聚集。而卜瓦松的數學足夠簡單可以快速計算,使模擬數千種可能的比賽結果在實務上可行。三者結合,使它成為足球建模的主力工具。
卜瓦松進球模型的輸入是什麼?
兩個率:每隊一個。最常見的做法是從球隊實力推導出率(攻擊率減去對手防守率,已內建主場優勢)。現代變體改餵入每場 xG 數值,產生反應更快也更精確的分布。
卜瓦松在哪裡失效?
三種主要失敗模式。後段比賽狀態:落後追分的球隊與護住領先的球隊踢法不同,因此進球率在 90 分鐘內並非恆定。兩隊之間的相關性:一隊若於後段失球,常會在同一階段再失一球,但卜瓦松把這視為獨立。極低或極高得分的比賽:卜瓦松的尾端對極端結果代表不足。
Tactiq 在分析中直接使用卜瓦松嗎?
基於模擬的機率估計是促成比賽卡上機率三元組的多種技術之一。具體的模擬方式、率的推導,以及模型如何處理卜瓦松已知的弱點,這些細節留在產品內部。對使用者而言,效果是螢幕上的三個機率反映的是模擬出的結果分布,而不是手工編寫的規則。
有沒有比卜瓦松更好的替代?
負二項分布、二維卜瓦松、Dixon-Coles(為低得分比賽加入相關性)以及 Skellam 分布都被提出作為改良。每個都針對基本卜瓦松的某個弱點,代價是更高的複雜度。多數量產的足球模型使用其中一種改良版,而不是原始卜瓦松。