什麼是 xG?為足球球迷解讀預期進球
過去五年每一場足球對話都拾起了同樣的三個字母。解說員在重播之間隨口提到 xG。Twitter 時間線在真實比分旁邊發佈 xG 比分板。分析師提到預期進球的方式,就像老一輩人提到控球率一樣,彷彿每個人都已經知道那個數字代表什麼。
大多數球迷並不知道,而這是一個值得解決的問題。xG 是我們用來討論超越最終比分的足球的最有用方法之一,但也是最常被誤用的方法之一。把它當作神諭來對待,它會讓人失望。把它當作它實際所是的東西,即機會品質的機率分數,它會磨利你觀看比賽的方式。
這篇文章做兩件事。它用淺顯的語言解釋 xG 衡量什麼,不需要統計學學位。而且它對 xG 在哪裡誤導人保持誠實,因為那是大多數線上內容跳過的一半。到最後,下次你在 2-1 結果下看到「xG:1.4 比 2.8」時,你會知道它告訴你什麼,以及它刻意省略了什麼。
xG 實際上是什麼
預期進球,寫作 xG,是附加到單次射門上的機率分數。它回答一個問題:這個確切的機會,在這個確切的位置,經過這種建立之後,最終進入球網的可能性有多大?答案是 0 到 1 之間的小數。
在六碼(約 5.5 公尺)外有空間加上一次誘人的傳中所進行的射門,可能會得到 0.65 xG。在整個歷史樣本中,大約每三次這樣的機會中有兩次變成進球。一次兩名防守者擋住角度的 30 碼(約 27 公尺)外投機射門可能會得到 0.03 xG。每百次中有三次。這個數字是數千次類似嘗試的平均值,不是針對特定一天這位特定射手的預測。
把一隊在一場比賽中的每次射門加起來,你會得到該隊那場比賽的 xG 總計。xG 0.9 比 2.4 對進球 2-1 的比分告訴你,進 1 球的一方在機會創造上更好,而進 2 球的一方在其基礎比率之上表現良好。xG 2.7 比 0.4 配 0-0 進球告訴你,有人應該贏但沒贏,這是每個球迷從感覺不公平的比賽中認得出來的模式。
這個指標在 2010 年代初首次商業化使用,最明顯的是由 Opta,此後已成為描述職業足球每個層級機會品質的預設方式。它的有用性沒有爭議。它的誤用才有爭議。
xG 如何計算,概述
xG 模型不使用任何單一神奇的輸入。它們在巨大的歷史射門資料庫上訓練,通常是數十萬次,每一次都標記著最終結果(進球與否)和情境特徵列表。模型學習哪些特徵會提高轉換率,哪些會降低。
大多數 xG 模型依賴的特徵在整個行業中大致相似:
- 射門位置。 射門發生在球場哪裡,以到球門的距離與角度衡量。這是最強的單一驅動因素。
- 身體部位。 右腳、左腳、頭或其他。從同一位置的頭球與腳射的轉換率非常不同。
- 助攻類型。 是穿透球、傳中、回敲、定位球、反彈球。每種傳遞模式產生自己典型的轉換。
- 防守壓力。 射門與球門之間有多少防守者,最近的一位有多近。開放的射門比被封閉的射門更常轉換。
- 比賽狀態與階段。 開放式比賽、快速反擊、定位球、點球。在大多數公開模型中,點球尤其被視為幾乎恆定的 0.76 到 0.78 xG。
不同的供應商使用不同的具體特徵集。一些包括防守者定位等追蹤數據特徵。一些納入門將的起始位置。少數包括射門前建立特徵,例如每次控球的傳球次數。它們都共享的是基礎理念:將每次射門簡化為一小組描述性標籤,查找該標籤組合在歷史上進球的頻率,並將該比率作為 xG 返回。
Tactiq 使用來自授權體育數據源的事件級別比賽數據,涵蓋超過 1,200 個聯賽,為分析取得每次射門的情境。xG 訊號如何與產品查看的其他內容具體結合,保留在應用程式內部。對讀者有用的要點是:xG 本身是行業標準。工具之後用 xG 做什麼,是產品不同之處。
為什麼 xG 重要
聯賽積分榜按結果對球隊排名。進球欄按完成能力排名,這是有雜訊的。xG 給你第三個鏡頭:誰產生了最多的品質,與球是否進門無關。
這對足球球迷實際關心的幾個原因很重要。
它將運氣與表現分開。 一位三場比賽從累積 1.8 xG 中進五球的前鋒正在超出他的比率完成,而該比率通常會回歸。一位從累積 4.1 xG 中進零球的前鋒運氣不佳,而他的進球通常會來。在足夠多的射門中,xG 與進球收斂。當它們分歧時,正在發生某些暫時的事情,要麼是英雄式的完成,要麼是令人沮喪的錯失,要麼是門將正經歷職業生涯最好的一個月。
它獎勵過程而非結果。 創造 2.5 xG 價值機會但以定位球進球 0-1 輸球的一方,通常在 90 分鐘內是更好的一方。xG 以最終比分無法做到的方式捕捉那個差距。教練們使用這個想法的內部版本已經數十年。xG 使它公開。
它在結果之前浮現基礎狀態。 一支 xG 差距在六場比賽中悄悄改善的中游球隊,通常即將爬上積分榜,即使積分還沒跟上。一支 xG 正在滑落、卻繼續贏得接近比賽的上半區球隊,正在借用通常會到來的回歸。在四到八場比賽的滾動窗口中,xG 狀態是比原始結果更誠實的指標。
它提供一種談論射門品質的方式。 在 xG 之前,「好機會」和「壞機會」是主觀的。兩個人可以看同一次錯失並就它是否應該得分意見分歧。xG 給它一個數字。該數字不完美,但在比賽、聯賽與賽季之間是一致的。
它跨聯賽旅行。 荷蘭甲級聯賽中一次 0.30 xG 的射門可以被認出是義大利甲級聯賽中一次 0.30 xG 的射門。儘管周圍的戰術情境不同,基礎機會品質是同一指標。那種可攜性是 xG 成為現代足球分析通用語言的部分原因。
xG 在哪裡誤導人
這個部分是大多數 xG 解釋者省略的,這是為什麼 xG 被本應知道得更多的人當作魔法對待的原因。對指標的弱點保持誠實,是善用 xG 與被它愚弄的差別。
小樣本會說謊。 一場比賽幾乎從不是判斷任何事情的足夠 xG 數據。一位前鋒可以在一整晚讓他進入禁區的深度防守陣型下取得 1.4 xG,也可以在從不讓他轉身的高位壓迫下取得 0.05 xG。兩者都是關於該特定對決的資訊,而不是關於前鋒能力。在下結論之前至少滾動四到六場比賽是基準。少於此的都是加了數字的軼事。
精英終結者系統性地超越 xG。 一些球員在整個職業生涯中進的球比他們的 xG 所暗示的要多。梅西、薩拉、哈蘭德及少數其他俱樂部有足夠的射門量,他們的超表現不只是雜訊。一個普通的 xG 模型不知道是誰在射門,只知道射門來自哪裡。那是特點而不是缺陷,但這意味著原始 xG 低估了精英前鋒的價值,高估了不完成的量射手價值。
弱終結者系統性地錯失 xG。 反過來同樣成立。在整個賽季中慢性低於 xG 的前鋒通常不是運氣不佳。他們是完成得差。當職業模式說別的時,把他們的低表現當作即將到來的回歸,是一個常見的陷阱。
防守錯誤誇大 xG。 一次門將失誤滾到六碼外無人看管的攻擊者會得到高 xG 分數,因為射門發生在高品質位置。xG 模型看不到創造機會的防守錯誤。在單場比賽中,一支球隊可以很大程度上基於對手錯誤取得令人印象深刻的 xG 線,那不是可重複的技能。
定位球與點球扭曲標題數字。 每次點球約值 0.76 xG。在一場比賽中贏得兩次點球的球隊,在他們踢球之前已經有 1.5 xG 內建。關心開放式比賽表現的分析師有時會從總計中剝除點球和任意球。公開記分板通常不會。
杯賽決賽、德比與降級決戰打破模型。 xG 是根據常規賽季比賽的巨大歷史基礎校準的。決賽、本地德比與最後一天生存戰具有不同的心理、不同的戰術形狀、不同的裁判判決,以及小得多的可比樣本。用 xG 以讀常規賽季聯賽比賽的方式讀這些比賽是錯誤。數字仍然會被計算。圍繞它的信心應該更低,大多數公開儀表板並不讓這一點可見。
比賽後期狀態效應扭曲總計。 在最後二十分鐘追分的球隊創造不代表其真實品質的絕望機會。保護 1-0 領先的球隊下降到一個故意讓出控球權和射門量的陣型。原始全場 xG 把這些階段混在一起。有比賽狀態調整的 xG 存在,但那不是標題記分板顯示的。
它是團隊層級的訊號,卻被誤讀為球員層級的訊號。 「X 球員本場比賽有 0.8 xG」可能意味著他取了一個好機會錯過了,或取了六個半機會並全部錯過。基礎射門分佈的形狀很重要,不只是總和。在不看射門頻率與品質散佈的情況下把累積 xG 當作球員成績單,是球迷最終為描述不同事情的數字爭論的方式。
從這一切中得出的規則:xG 作為更廣泛閱讀的一個輸入最有用,跨若干場比賽窗口比較,把完成者品質和比賽情境記在腦中。作為對單場比賽的獨立判決最沒用。
Tactiq 如何在分析中使用 xG
Tactiq 以這篇文章剛剛描述的方式對待 xG:作為基礎表現數據的一部分,而非獨立的預測。
在比賽分析內,xG 訊號為誰在最近比賽中以什麼水平表現、哪些球員和球隊正在超出或低於他們的品質、以及對決的基礎形狀有多接近或一邊倒的圖景做出貢獻。xG 狀態與幾個其他輸入並列。它們中沒有一個被當作答案。
Tactiq 分析如何將 xG 與它所看的其他東西具體混合,權重、滾動窗口、聯賽特定調整、不穩定訊號被標記的方式,保留在產品內部。這是有意的設計選擇,不是閃爍其詞。發佈的方法論在幾週內被複製並錯誤校準;到達用戶的是一個帶有信心認定的分析,其推理以淺顯語言解釋,不是教科書。
用戶在比賽卡上看到的:
- 每一方的預期進球數字,帶有最近趨勢指標,以便你能判斷數字朝哪個方向移動。
- 結果的機率三元組,由可見的信心指標認定,反映這場特定比賽的基礎訊號有多穩定。
- 以淺顯語言命名 xG 情境的書面分析:「主隊最近五場比賽的 xG 趨勢上升,主要來自定位球品質」,而不是「我們的模型為特徵向量三分配權重 0.37」。
- 任何地方都沒有博彩公司賠率。沒有投注提示。沒有虛擬貨幣。框架是統計分析,並保持如此。
意圖是讓閱讀 Tactiq 卡片的球迷帶著對比賽更鋒利的解讀離開,而不是一個複製到別處的數字。
如何像專業人士一樣閱讀 xG
六個習慣將善用 xG 的人與引用它的人區分開來。
- 永遠看滾動窗口,不是一場比賽。 每隊四到八場比賽是基準。一場比賽是故事,不是模式。
- 比較 xG 差距,而非原始 xG。 「這支球隊比他們失去的多產生了多少品質」通常比任一方的總計單獨更有資訊量。
- 當你關心開放式比賽時剝除點球和任意球。 公開標題通常不會。每次點球減去 0.76 以查看開放式比賽形狀看起來如何。
- 檢查誰在射門。 超表現 xG 的精英終結者不是新聞。超表現 xG 的輪換前鋒是一個說「樣本大小」的旗幟。
- 與完成歷史一起讀 xG。 幾場比賽的超表現可能是雜訊。三個賽季的超表現是資訊。
- 謹慎對待德比、杯賽與決賽。 對於模型有較少可比比賽的比賽,降低對 xG 解讀的信心。數字會被計算。其周圍的帶寬比儀表板告訴你的更寬。
一起應用,這些習慣將 xG 從瑣碎數字變成一個鏡頭。鏡頭對它能看到什麼保持誠實。那就是全部要點。
結論
xG 是關於機會品質的有根據的預測,不是對比賽的判決。在若干場比賽的窗口內使用、與完成者品質和比賽情境一起閱讀、當開放式比賽是問題時剝除點球和定位球膨脹,它是球迷用來討論超越最終比分的足球的最鋒利工具之一。
作為單場比賽神諭、或作為無情境的排行榜數字、或作為觀看比賽的替代品使用時,它會誤導人。指標沒有改變。解讀改變了。
Tactiq 圍繞那種解讀構建。應用程式在情境中浮現 xG、用信心認定它、以球迷實際可用的語言解釋數字的意義,且從不將它與博彩公司賠率或投注提示混合。超過 1,200 個聯賽、介面與分析文本的 32 種語言本地化、每天八次分析的免費層,不需信用卡。
如果你覺得這篇文章有用,自然的配套文章是早先關於 AI 如何預測足球比賽 的指南。xG 是該文章詳細介紹的四個數據家族之一,兩篇文章一起是我們繼續構建部落格其餘部分的基礎。