Co Je xG? Očekávané Góly Vysvětlené Pro Fotbalové Fanoušky
Každá fotbalová konverzace v posledních pěti letech zachytila stejná tři písmena. Komentátoři nadhazují xG nenuceně mezi opakovanými záběry. Časové osy na Twitteru zveřejňují tabulky xG vedle skutečné. Analytici se odkazují na očekávané góly tak, jak starší generace odkazovaly na procenta držení míče, jako by všichni už věděli, co to číslo znamená.
Většina fanoušků ne, a to je problém, který stojí za to vyřešit. xG je jeden z nejužitečnějších způsobů, jak můžeme mluvit o fotbale mimo závěrečné skóre, ale je také jedním z nejzneužívanějších. Bráno jako věštec zklamává. Bráno jako to, čím skutečně je, skóre pravděpodobnosti kvality šance, zostřuje způsob, jakým hru sledujete.
Tento článek dělá dvě věci. Vysvětluje, co xG měří v prostém jazyce, bez vyžadovaného titulu ze statistiky. A je poctivý ohledně toho, kde xG klame, protože to je polovina, kterou většina obsahu online přeskakuje. Na konci, až příště uvidíte "xG: 1,4 ku 2,8" pod výsledkem 2-1, budete vědět, co vám to říká a co záměrně vynechává.
Co xG vlastně je
Očekávané góly, psané jako xG, je skóre pravděpodobnosti připojené k jedné střele. Odpovídá na jednu otázku: jak pravděpodobné je, že přesně tato šance, na přesně tomto místě, po tomto typu rozehrávky, skončí v síti? Odpovědí je desetinné číslo mezi 0 a 1.
Střela ze šesti metrů s prostorem a lákavým centrem může dosáhnout 0,65 xG. Zhruba dvě ze tří takových šancí, napříč celým historickým vzorkem, se stávají góly. Spekulativní střela z 27 metrů se dvěma obránci blokujícími úhel může dosáhnout 0,03 xG. Tři ze sta. Číslo je průměr napříč tisíci podobnými pokusy, ne předpověď pro tohoto konkrétního střelce v tento konkrétní den.
Sečtěte každou střelu v zápase pro jeden tým, a získáte celkové xG tohoto týmu za zápas. Výsledek xG: 0,9 ku 2,4 proti gólům 2-1 vám říká, že strana s jedním gólem byla lepší stranou v kreativitě šancí, a strana se dvěma góly zakončila výrazně nad svou základní mírou. Výsledek xG: 2,7 ku 0,4 s góly 0-0 vám říká, že někdo si zasloužil vyhrát a nevyhrál, to je vzor, který každý fanoušek pozná ze zápasů, které se zdají nespravedlivé.
Metrika byla poprvé komerčně použita na začátku roku 2010, nejviditelněji Opta, a od té doby se stala výchozím způsobem, jak popisovat kvalitu šancí na každé úrovni profesionálního fotbalu. Její užitečnost není sporná. Její zneužití ano.
Jak se xG počítá, v obrysu
xG modely nepoužívají žádný jediný magický vstup. Jsou trénovány na obrovských knihovnách historických střel, obvykle stovkách tisíc, každá označená konečným výsledkem (gól nebo ne) a seznamem kontextuálních rysů. Model se učí, které rysy zvyšují míru konverze a které ji snižují.
Rysy, na kterých většina xG modelů staví, jsou v zásadě podobné napříč odvětvím:
- Umístění střely. Kde na hřišti byla střela provedena, měřeno jako vzdálenost a úhel k bráně. To je nejsilnější jediný činitel.
- Část těla. Pravá noha, levá noha, hlava, nebo jiná. Hlavičky ze stejného místa jako střely nohou konvertují ve velmi odlišných poměrech.
- Typ přihrávky. Byla to prostupná přihrávka, centr, zpětná přihrávka, standardní situace, dorážka. Každý vzor dodání produkuje svou typickou konverzi.
- Obranný tlak. Kolik obránců bylo mezi střelou a bránou, a jak blízko byl nejbližší. Otevřené střely konvertují mnohem častěji než uzavřené.
- Stav a fáze hry. Otevřená hra, rychlý protiútok, standardní situace, penalta. Penalty se zejména zacházejí jako s téměř konstantním 0,76 až 0,78 xG ve většině veřejných modelů.
Různí poskytovatelé používají různé konkrétní sady rysů. Někteří zahrnují rysy tracking dat, jako je pozicování obránců. Někteří započítávají startovací pozici brankáře. Několik zahrnuje rysy předstřelecké rozehrávky, jako jsou přihrávky na držení. Co všichni sdílejí, je základní myšlenka: zredukovat každou střelu na malou sadu popisných značek, vyhledat, jak často tato kombinace značek byla historicky gólem, a vrátit tuto míru jako xG.
Tactiq používá data zápasů na úrovni událostí z licencovaných sportovních kanálů napříč více než 1200 ligami k získání kontextu na střelu pro analýzu. Konkrétní způsob, jak se xG signály kombinují se zbytkem toho, na co se produkt dívá, zůstává uvnitř aplikace. Užitečný závěr pro čtenáře je: samotné xG je průmyslový standard. To, co nástroj s xG dělá poté, je místem, kde se produkty liší.
Proč na xG záleží
Ligová tabulka řadí týmy podle výsledků. Sloupec vstřelených gólů je řadí podle zakončení, což je hlučné. xG vám dává třetí čočku: kdo vygeneroval nejvíce kvality, bez ohledu na to, zda míč šel dovnitř.
To záleží z několika důvodů, na kterých fotbalovému fanouškovi skutečně záleží.
Odděluje štěstí od výkonu. Útočník, který dává pět gólů ve třech zápasech z kumulativního 1,8 xG, zakončuje nad svou mírou, a tato míra se obvykle vrátí. Útočník, který dává nulu z kumulativního 4,1 xG, má smůlu, a jeho góly obvykle přijdou. Při dostatečném počtu střel se xG a góly sbíhají. Když se rozcházejí, děje se něco dočasného, buď hrdinské zakončování, nebo frustrující netrefené šance, nebo brankář prožívající měsíc kariéry.
Odměňuje proces nad výsledkem. Strana, která vytváří šance v hodnotě 2,5 xG a prohrává 0-1 gólem ze standardní situace, je často lepší stranou po 90 minutách. xG zachycuje tuto mezeru způsobem, jakým konečné skóre nemůže. Trenéři používali interní verze této myšlenky po desetiletí. xG ji udělalo veřejnou.
Odhaluje základní formu před výsledky. Tým ze středu tabulky, jehož xG diferenciál se tiše zlepšil za šest zápasů, se často chystá stoupat v tabulce, i když jeho body ještě nedohnaly. Tým z horní poloviny, jehož xG klouže, zatímco stále vyhrává těsné zápasy, si půjčuje proti regresi, která obvykle přichází. V klouzavém okně čtyř až osmi zápasů je forma xG upřímnějším indikátorem než surové výsledky.
Dává vám způsob, jak mluvit o kvalitě střel. Před xG byly "dobrá šance" a "špatná šance" subjektivní. Dva lidé mohli sledovat stejnou netrefenou šanci a nesouhlasit ohledně toho, zda měla být skórována. xG k tomu dává číslo. Číslo je nedokonalé, ale je konzistentní napříč zápasy, ligami a sezónami.
Cestuje napříč ligami. Střela 0,30 xG v nizozemské Eredivisie je rozpoznatelná jako střela 0,30 xG v italské Serii A. Základní kvalita šance je stejná metrika, i když taktický kontext kolem ní se liší. Tato přenositelnost je součástí toho, proč se xG stalo lingua franca moderní fotbalové analýzy.
Kde xG klame
Tato sekce je ta, kterou většina vysvětlovačů xG vynechává, a je to důvod, proč je xG zacházeno jako s magií lidmi, kteří by to měli vědět lépe. Být poctivý ohledně slabých míst metriky je rozdíl mezi dobrým používáním xG a necháním se jím oklamat.
Malé vzorky lžou. Jeden zápas není téměř nikdy dostatek xG dat k posouzení čehokoli. Útočník může zaznamenat 1,4 xG proti hlubokému bloku, který ho celou noc pouští do šestnáctky, a zaznamenat 0,05 xG proti vysokému pressingu, který ho nikdy nenechá se otočit. Obojí jsou informace o této konkrétní konfrontaci, ne o schopnostech útočníka. Klouzání minima čtyř až šesti zápasů před vyvozováním závěrů je základ. Cokoli méně je anekdota s číslem připojeným.
Elitní zakončovatelé systematicky překonávají xG. Někteří hráči, napříč celou kariérou, dávají více gólů, než jejich xG naznačuje, že by měli. Messi, Salah, Haaland a malý klub dalších mají dostatek objemu střel, že jejich nadvýkon není jen šum. Průměrný xG model neví, kdo střílí, jen odkud střela přišla. To je vlastnost, ne chyba, ale znamená to, že surové xG podceňuje hodnotu elitních útočníků a nadhodnocuje hodnotu objemových střelců, kteří nezakončují.
Slabí zakončovatelé systematicky pod xG. Opak je stejně pravdivý. Útočníci, kteří chronicky nedosahují xG po celou sezónu, obvykle nemají smůlu. Špatně zakončují. Zacházet s jejich podvýkonem jako s bezprostřední regresí, když kariérní vzor říká něco jiného, je běžná past.
Obranné chyby nafukují xG. Chyba brankáře, která se dokutálí k neobsazenému útočníkovi šest metrů od brány, má vysoké xG, protože střela se děje z vysoce kvalitní lokace. xG model nevidí obrannou chybu, která šanci vytvořila. V jednom zápase může tým zaznamenat působivou xG linii převážně díky chybám soupeře, a to není opakovatelná dovednost.
Standardní situace a penalty zkreslují hlavní číslo. Penalta má hodnotu zhruba 0,76 xG pokaždé. Tým, který získá dvě penalty v zápase, má 1,5 xG upečené, než začne hrát fotbal. Analytici, kterým záleží na výkonu z otevřené hry, někdy odečítají penalty a volné kopy z celkové sumy. Veřejná tabule obvykle ne.
Pohárové finále, derby a záchranářské zápasy lámou model. xG je kalibrováno proti obrovské historické základně zápasů pravidelné sezóny. Finále, místní derby a poslední záchranářské zápasy mají různé psychologie, různé taktické tvary, různá rozhodčí rozhodnutí a mnohem menší srovnatelné vzorky. Použití xG ke čtení těchto zápasů stejným způsobem, jakým byste četli středověký ligový zápas, je chyba. Číslo se stále počítá. Důvěra kolem něj by měla být nižší, a většina veřejných dashboardů to nedělá viditelným.
Efekty stavu pozdní hry zkreslují celkovou sumu. Tým honící gól v posledních dvaceti minutách vytváří zoufalé šance, které nejsou reprezentativní pro jeho skutečnou kvalitu. Tým chránící vedení 1-0 se propadá do tvaru, který úmyslně postupuje držení a objem střel. Surové xG celého zápasu tyto fáze slévá dohromady. xG přizpůsobené stavu hry existuje, ale to není to, co hlavní tabule zobrazuje.
Je to signál na úrovni týmu špatně čtený jako signál na úrovni hráče. "Hráč X má 0,8 xG v tomto zápase" může znamenat, že měl jednu dobrou šanci a netrefil ji, nebo šest pološancí a netrefil je všechny. Tvar základního rozdělení střel je důležitý, ne jen suma. Zacházet s kumulativním xG jako s reportkou hráče, bez pohledu na frekvenci střel a rozpětí kvality, je způsob, jak fanoušci končí hádáním se o čísla popisující různé věci.
Pravidlo, které z toho všeho vyplývá: xG je nejužitečnější jako jeden vstup do širšího čtení, srovnávaný napříč oknem několika zápasů, s kvalitou zakončovatele a kontextem zápasu drženými ve vaší hlavě. Je nejméně užitečné jako samostatný verdikt o jediném zápase.
Jak Tactiq používá xG v analýze
Tactiq zachází s xG tak, jak to tento článek právě popsal: jako s jedním kusem dat o základním výkonu, ne jako s předpovědí samou o sobě. Je součástí informované predikce, ne jí samou.
Uvnitř analýzy zápasu xG signály přispívají k obrazu, kdo podává výkon na jaké úrovni v posledních zápasech, kteří hráči a týmy nad- nebo pod-výkonnostně plní svou kvalitu, a jak těsný nebo jednostranný je základní tvar konfrontace. Forma xG sedí vedle několika dalších vstupů. Žádný z nich není zacházen jako odpověď.
Konkrétní způsob, jak analýza Tactiq míchá xG se zbytkem toho, co vidí, váhy, klouzavá okna, ligově specifická přizpůsobení, způsoby označování nestabilních signálů, zůstává uvnitř produktu. Je to záměrná volba designu, ne vyhýbavá. Zveřejněná metodologie je kopírována a špatně kalibrována během týdnů; co se dostává k uživateli, je analýza s kvalifikovanou důvěrou s odůvodněním vysvětleným prostým jazykem, ne učebnicí.
Co uživatel vidí na kartě zápasu:
- Hodnotu očekávaných gólů pro každou stranu, s indikátorem nedávného trendu, abyste mohli poznat, kterým směrem se číslo pohybuje.
- Pravděpodobnostní trojice pro výsledek, kvalifikované viditelným indikátorem důvěry, který odráží, jak stabilní jsou základní signály pro tento konkrétní zápas.
- Písemnou analýzu, která pojmenovává xG kontext v prostém jazyce: "Nedávný trend xG domácího týmu se zvedl v jejich posledních pěti zápasech, převážně díky kvalitě ze standardních situací", ne "náš model přiřazuje váhu 0,37 k feature vektoru tři".
- Žádné sázkové kurzy nikde. Žádné sázkové výzvy. Žádná virtuální měna. Rámec je statistická analýza, a tak zůstává.
Záměrem je, aby fanoušek čtoucí kartu Tactiq odcházel s ostřejším čtením zápasu, ne s číslem k okopírování někam jinam.
Jak číst xG jako profík
Šest zvyků odděluje lidi, kteří dobře používají xG, od těch, kteří ho citují.
- Vždy se dívej na klouzavé okno, ne na jeden zápas. Čtyři až osm zápasů na tým je základ. Jeden zápas je příběh, ne vzor.
- Porovnávej xG diferenciál, ne surové xG. "O kolik více kvality tento tým vygeneroval, než připustil" je obvykle informativnější než celková suma jakékoli strany sama.
- Odečti penalty a volné kopy, když ti záleží na otevřené hře. Veřejný titulek to často nedělá. Odečti 0,76 za každou penaltu, aby ses podíval, jak vypadal tvar otevřené hry.
- Zkontroluj, kdo střílí. Elitní zakončovatel překonávající xG není zpráva. Rotační útočník překonávající xG je vlajka, která říká "velikost vzorku".
- Čti xG vedle historie zakončování. Nadvýkon za několik zápasů může být šum. Nadvýkon za tři sezóny je informace.
- S derby, pohárovými a finálovými zápasy zacházej s opatrností. Snižuj svou důvěru ve čtení xG u zápasů, pro které má model méně srovnatelných utkání. Číslo se vypočítá. Pásmo kolem něj je širší, než ti dashboard říká.
Aplikované společně tyto zvyky proměňují xG z triviálního čísla v čočku. Čočka je poctivá ohledně toho, co může vidět. To je celý smysl.
Závěr
xG je informovaná predikce o kvalitě šance, ne verdikt o zápase. Použito uvnitř okna několika zápasů, čteno vedle kvality zakončovatele a kontextu zápasu, a zbaveno inflace penalt a standardních situací, když je otázka otevřená hra, je to jeden z nejostřejších nástrojů, které fanoušek má pro diskusi o fotbale mimo konečné skóre.
Použito jako věštec jednoho zápasu, nebo jako číslo v žebříčku bez kontextu, nebo jako náhrada za sledování hry, klame. Metrika se nezměnila. Čtení ano.
Tactiq je postaveno kolem tohoto čtení. Aplikace zobrazuje xG v kontextu, kvalifikuje ho důvěrou, vysvětluje, co číslo znamená v jazyce, který fanoušek může skutečně použít, a nikdy ho nemíchá se sázkovými kurzy nebo sázkovými výzvami. Více než 1200 lig, lokalizace ve 32 jazycích napříč rozhraním a textem analýzy, bezplatná úroveň osmi analýz denně, bez kreditní karty.
Pokud vám tento článek připadá užitečný, přirozeným doprovodným kouskem je dřívější průvodce o tom, jak AI předpovídá fotbalové zápasy. xG je jedna ze čtyř rodin dat, které ten článek podrobně prochází, a oba články dohromady jsou základem, na kterém stavíme zbytek blogu.