xGとは何か?サッカーファンのための期待ゴール解説
過去5年間のすべてのサッカーの会話が、同じ3文字を取り上げてきました。解説者はリプレイの合間にさりげなくxGを口にします。Twitterのタイムラインは実際のスコアの横にxGスコアボードを投稿します。アナリストは、古い世代が支配率について語ったように期待ゴールに言及します。あたかも誰もがその数字の意味をすでに知っているかのように。
ほとんどのファンは知りません。そしてそれは解決する価値のある問題です。xGは最終スコアを超えてサッカーについて語るために私たちが持っている最も有用な方法の一つですが、同時に最も誤用されているものの一つでもあります。神託として扱えば失望します。実際のもの、つまりチャンスの質に対する確率スコアとして扱えば、試合の見方が鋭くなります。
この記事は2つのことをします。統計の学位を必要とせず、平易な言葉でxGが測定するものを説明します。そして、xGが誤解を招く場所について正直に書きます。なぜならそれがオンラインコンテンツの大半がスキップする半分だからです。最後には、次に2-1の結果の下に「xG: 1.4 対 2.8」を見たとき、それが何を伝えているか、そして意図的に何を省略しているかがわかるでしょう。
xGとは実際には何か
期待ゴール、xGと書かれるものは、単一のシュートに付けられた確率スコアです。一つの質問に答えます。この正確なチャンスが、この正確な位置で、この種の組み立ての後、ネットに収まる可能性はどれくらいか?答えは0から1の間の小数です。
6ヤード(約5.5メートル)からスペースがあり魅力的なクロスがあるシュートは0.65 xGを記録するかもしれません。歴史的サンプル全体で、そのようなチャンス3つのうちおよそ2つがゴールになります。角度をブロックする2人のディフェンダーがいる状態での30ヤード(約27メートル)からの投機的な一撃は0.03 xGを記録するかもしれません。100個のうち3個です。この数字は何千もの類似した試みの平均であり、この特定の日のこの特定のシューターに対する予測ではありません。
一つのチームの試合中のすべてのシュートを合計すると、そのチームの試合のxG合計が得られます。ゴール2-1に対してxG 0.9対2.4のスコアラインは、1ゴールの側がチャンス創出で優れており、2ゴールの側は基礎レートを大きく上回って決定したことを伝えます。ゴール0-0でxG 2.7対0.4のスコアラインは、誰かが勝つに値したのに勝たなかったことを伝えます。これは不公平に感じる試合からすべてのファンが認識するパターンです。
この指標は2010年代初頭に商業的に初めて使用され、最も目立ったのはOptaでした。それ以来、プロサッカーのあらゆるレベルでチャンスの質を記述するデフォルトの方法となっています。その有用性は議論の余地がありません。その誤用は議論の余地があります。
xGはどのように計算されるか、その概要
xGモデルは単一の魔法のような入力を使用しません。それらは膨大な歴史的シュートのライブラリ、通常は何十万ものシュートで訓練され、それぞれに最終結果(ゴールか否か)と文脈的特徴のリストがタグ付けされています。モデルはどの特徴がコンバージョン率を上げ、どれが下げるかを学習します。
ほとんどのxGモデルが依存する特徴は、業界全体で大まかに類似しています。
- シュートの位置。 ピッチ上のどこでシュートが行われたか、ゴールまでの距離と角度として測定されます。これが最も強い単一のドライバーです。
- 体の部位。 右足、左足、頭、その他。同じ場所からのヘディングと足のシュートは非常に異なる割合で得点します。
- アシストの種類。 スルーボール、クロス、カットバック、セットプレー、リバウンドだったか。各デリバリーパターンは独自の典型的なコンバージョンを生み出します。
- 守備の圧力。 シュートとゴールの間に何人のディフェンダーがいたか、最も近い選手はどれほど近かったか。オープンなシュートはクローズドなシュートよりもはるかに頻繁に得点します。
- 試合の状態とフェーズ。 オープンプレー、速攻、セットプレー、ペナルティ。特にペナルティは、ほとんどの公開モデルでほぼ一定の0.76から0.78 xGとして扱われます。
異なるプロバイダーは異なる特定の特徴セットを使用します。一部はディフェンダーのポジショニングなどのトラッキングデータ特徴を含みます。一部はゴールキーパーのスタート位置を取り込みます。いくつかはポゼッションごとのパスなどのシュート前の組み立て特徴を含みます。それらすべてが共有するのは基礎となるアイデアです。各シュートを小さな記述的タグセットに還元し、そのタグの組み合わせが歴史的にどれだけゴールになったかを調べ、その割合をxGとして返します。
Tactiqは、1,200以上のリーグにわたるライセンスされたスポーツフィードからのイベントレベルの試合データを使用して、分析のためのシュートごとのコンテキストを取得します。xGシグナルが製品が見る他のものとどのように具体的に組み合わさるかは、アプリ内にとどまります。読者にとっての有用な持ち帰りは、xG自体は業界標準であるということです。ツールがその後xGで何をするかが、製品が異なる場所です。
xGが重要な理由
リーグ表は結果でチームをランク付けします。得点欄は決定力でチームをランク付けしますが、それはノイズが多いです。xGは第三のレンズを提供します。ボールが入ったかどうかに関係なく、誰が最も質の高いチャンスを生み出したかです。
これはサッカーファンが実際に気にするいくつかの理由で重要です。
運とパフォーマンスを分離します。 3試合で累積1.8 xGから5ゴールを決めるストライカーは自身の割合を上回って決定しており、その割合は通常回帰します。累積4.1 xGから0ゴールのストライカーは不運であり、彼のゴールは通常やってきます。十分なシュートにわたって、xGとゴールは収束します。それらが分岐するとき、一時的な何かが起こっています。英雄的な決定力、苛立たしい失敗、またはキーパーがキャリアの月を持っているかのいずれかです。
結果よりもプロセスを報いる。 2.5 xG相当のチャンスを作り出し、セットプレーのゴールで0-1で負けるサイドは、しばしば90分を通してより良いサイドです。xGは最終スコアではできない方法でそのギャップを捉えます。監督たちはこのアイデアの内部版を何十年も使ってきました。xGはそれを公にしました。
結果に先立って基礎的な調子を浮上させる。 xG差が6試合にわたって静かに改善した中位のチームは、ポイントがまだ追いついていなくても、しばしば表を上がろうとしています。接戦を勝ち続けながらxGが滑っている上位半分のチームは、通常到来する回帰に借りを作っています。4から8試合のローリングウィンドウにわたって、xGの調子は生の結果よりも正直な指標です。
シュートの質について語る方法を提供します。 xGの前は、「良いチャンス」と「悪いチャンス」は主観的でした。2人が同じ失敗を見て、それが決められるべきだったかどうかで意見が一致しないことがありました。xGはそれに数字を置きます。その数字は不完全ですが、試合、リーグ、シーズンにわたって一貫しています。
リーグを越えて伝わります。 オランダのエールディヴィジでの0.30 xGのシュートは、イタリアのセリエAでの0.30 xGのシュートとして認識可能です。周囲の戦術的コンテキストは異なるものの、基礎となるチャンスの質は同じ指標です。その移植性は、xGが現代のサッカー分析の共通言語になった理由の一部です。
xGが誤解を招く場所
このセクションは、ほとんどのxG解説者が省略する部分であり、それがxGがもっとよく知るべき人々によって魔法として扱われる理由です。指標の弱点について正直であることは、xGをうまく使うこととそれに騙されることの違いです。
小さなサンプルは嘘をつきます。 1試合は何かを判断するのにほぼ決して十分なxGデータではありません。ストライカーは、一晩中ペナルティエリア内に入れてくれるディープブロックに対して1.4 xGを記録し、決して振り向かせないハイプレスに対して0.05 xGを記録することができます。どちらもその特定のマッチアップに関する情報であり、ストライカーの能力に関する情報ではありません。結論を引き出す前に最低4から6試合をローリングすることがベースラインです。それ以下は数字が付いた逸話です。
エリートフィニッシャーは体系的にxGを上回ります。 一部の選手は、キャリア全体にわたって、xGが示唆するよりも多くのゴールを決めます。メッシ、サラー、ハーランド、その他のいくつかのクラブは、そのオーバーパフォーマンスが単なるノイズではないほどのシュートボリュームを持っています。平均的なxGモデルは誰がシュートしているかを知らず、シュートがどこから来たかだけを知っています。それはバグではなく機能ですが、生のxGがエリートストライカーの価値を過小評価し、決定できないボリュームシューターの価値を過大評価することを意味します。
弱いフィニッシャーは体系的にxGを下回ります。 逆も同様に真です。フルシーズンにわたって慢性的にxGを下回るストライカーは、通常不運ではありません。彼らは決定が下手なのです。キャリアパターンが別のことを言っているのに、彼らの低パフォーマンスを差し迫った回帰として扱うのは、よくある罠です。
守備のミスはxGを膨らませます。 ゴールキーパーのファンブルが6ヤード先のマークされていない攻撃選手に転がると、シュートが高品質の位置から発生するため、高いxGを記録します。xGモデルは、チャンスを作った守備のミスを見ません。単一の試合中、チームは主に相手のミスに基づいて印象的なxGラインを記録することができ、それは再現可能なスキルではありません。
セットプレーとペナルティは見出しの数字を歪めます。 ペナルティは毎回およそ0.76 xGの価値があります。試合で2つのペナルティを獲得するチームは、サッカーをプレーする前に1.5 xGが既に組み込まれています。オープンプレーのパフォーマンスを気にするアナリストは、時にはペナルティとフリーキックを合計から差し引きます。公開のスコアボードは通常そうしません。
カップ決勝、ダービー、降格決定戦はモデルを破壊します。 xGはレギュラーシーズンの試合の巨大な歴史的ベースに対してキャリブレーションされています。決勝、地元のダービー、最終日の生き残り試合は、異なる心理、異なる戦術的形状、異なる審判の決定、そしてはるかに小さい比較可能なサンプルを持っています。xGを使ってこれらの試合をシーズン中のリーグ戦と同じように読むのは間違いです。数字は依然として計算されます。その周りの信頼性はもっと低くあるべきで、ほとんどの公開ダッシュボードはそれを見えるようにしていません。
試合終盤の状態効果は合計をねじ曲げます。 最後の20分でゴールを追いかけるチームは、真の質を代表しない絶望的なチャンスを作ります。1-0のリードを守るチームは、意図的にポゼッションとシュート数を譲るフォーメーションに落ちます。生のフルマッチxGはこれらのフェーズを混ぜ合わせます。試合状態調整xGは存在しますが、見出しのスコアボードに表示されるものではありません。
これはチームレベルのシグナルであり、選手レベルのシグナルとして誤読されます。 「選手Xはこの試合で0.8 xGを持っている」は、良いチャンスを1つ取ってミスしたか、ハーフチャンス6つを取ってすべてミスしたかのいずれかを意味する可能性があります。基礎となるシュート分布の形が重要で、合計だけではありません。シュートの頻度と品質の広がりを見ずに累積xGを選手の成績表として扱うことは、ファンが異なるものを記述する数字について議論することになる方法です。
このすべてから出てくるルール。xGはより広い読み取りへの一つの入力として、複数試合のウィンドウにわたって比較され、フィニッシャーの質と試合のコンテキストを頭に入れて使用する場合に最も有用です。単一試合の独立した判定として最も有用ではありません。
TactiqはxGを分析でどう使うか
Tactiqはこの記事がちょうど記述したようにxGを扱います。基礎的なパフォーマンスデータの一つの部分として、それ自体で予測ではなく。
試合分析の中で、xGシグナルは、誰が最近の試合でどのレベルでパフォーマンスしているか、どの選手やチームが自分の質を上回ったり下回ったりしているか、そしてマッチアップの基礎的な形状がどれほど接近しているか一方的であるかの図に貢献します。xGの調子は他のいくつかの入力と一緒に座ります。どれも答えとして扱われません。
Tactiqの分析がxGを見るものの残りとどのように具体的にブレンドするか、重み、ローリングウィンドウ、リーグ固有の調整、不安定なシグナルがフラグされる方法は、製品内にとどまります。これは意図的な設計選択であり、用心深いものではありません。公開された方法論は数週間以内にコピーされて誤キャリブレーションされます。ユーザーに届くのは、推論が平易な言葉で説明された信頼性で修飾された分析であり、教科書ではありません。
ユーザーが試合カードで見るもの。
- 各サイドの期待ゴール値、数字が動いている方向がわかるように最近のトレンドインジケーター付き。
- 結果の確率三つ組、この特定の試合の基礎シグナルがどれほど安定しているかを反映する可視の信頼性インジケーターで修飾されています。
- xGコンテキストを平易な言葉で名付ける書面分析。「ホームサイドの最近のxGトレンドは、主にセットプレーの質から、過去5試合にわたって上昇しています」であり、「私たちのモデルは特徴ベクトル3に重み0.37を割り当てます」ではありません。
- ブックメーカーのオッズはどこにもありません。賭けのプロンプトなし。仮想通貨なし。フレームは統計分析であり、そのままです。
意図は、Tactiqカードを読むファンが、どこかにコピーするための数字ではなく、試合についてのより鋭い読み取りとともに立ち去ることです。
プロのようにxGを読む方法
6つの習慣が、xGをうまく使う人々とそれを引用する人々を分けます。
- 常にローリングウィンドウを見て、一試合ではなく。 チーム当たり4から8試合がベースラインです。1試合は物語であり、パターンではありません。
- 生のxGではなく、xG差を比較します。 「このチームが失点したよりもどれだけ多くの質を生み出したか」は、通常、どちらの側の合計単独よりも有益です。
- オープンプレーを気にする場合、ペナルティとフリーキックを取り除きます。 公開の見出しはしばしばそうしません。オープンプレーの形状がどのように見えたかを確認するために、各ペナルティから0.76を減算します。
- 誰がシュートしているか確認します。 xGを上回るエリートフィニッシャーはニュースではありません。xGを上回るローテーションフォワードは「サンプルサイズ」というフラグです。
- 決定力の歴史と共にxGを読みます。 数試合のオーバーパフォーマンスはノイズかもしれません。3シーズンのオーバーパフォーマンスは情報です。
- ダービー、カップ、決勝の試合は慎重に扱います。 モデルが比較可能な試合が少ない試合では、xGの読み取りに対する信頼性を下げます。数字は計算されます。その周りのバンドはダッシュボードが伝えるよりも広いです。
一緒に適用すると、これらの習慣はxGをトリビア数字からレンズに変えます。レンズは何を見ることができるかについて正直です。それが全体の要点です。
まとめ
xGはチャンスの質に関する根拠ある予測であり、試合に対する判定ではありません。複数の試合のウィンドウ内で使用され、フィニッシャーの質と試合のコンテキストと共に読まれ、オープンプレーが問題であるときにペナルティとセットプレーのインフレを取り除いた場合、それは最終スコアを超えてサッカーについて語るためにファンが持っている最も鋭いツールの一つです。
単一試合の神託として、または文脈のないリーダーボード番号として、または試合を見る代わりとして使用されると、誤解を招きます。指標は変わりませんでした。読み取りが変わりました。
Tactiqはその読み取りを中心に構築されています。アプリはxGを文脈の中で浮上させ、信頼性で修飾し、ファンが実際に使える言葉で数字の意味を説明し、ブックメーカーのオッズや賭けのプロンプトと決して混ぜません。1,200以上のリーグ、インターフェースと分析テキスト全体の32言語ローカライゼーション、1日8分析の無料層、クレジットカード不要。
この記事が役に立ったと思ったら、自然な連載作品はAIがサッカー試合を予測する方法に関する以前のガイドです。xGはその記事が詳細に説明する4つのデータファミリーの1つであり、2つの記事が一緒になって、ブログの残りを構築し続ける基盤です。