Co je npxG? Očekávané góly bez penalt vysvětleny
Otevřete jakýkoliv moderní fotbalový analytický dashboard a vedle jména útočníka uvidíte dva sloupce. Jeden říká xG. Druhý říká npxG. Čísla se liší, někdy výrazně. Útočník Premier League s 18 xG letos může mít 14,5 npxG, přičemž rozdíl 3,5 gólu pochází výhradně z penaltové alokace jeho klubu. Pokud čtete sloupec xG, aniž byste chápali, na který se díváte, čtete příběh s tiše zabudovaným penaltovým bonusem.
Tento článek prochází tím, co npxG je, proč je odečtení penalt z xG obvykle čestný krok, a nástrahy, které chytí analytiky, kteří tento přesun udělají bez přemýšlení o tom, co dalšího ještě nebylo pročištěno. Na konci, až někdo příště hodí nějakou xG statistiku, budete vědět, jestli je to titulková verze nebo verze, která skutečně popisuje kvalitu otevřené hry.
Co npxG skutečně je
Očekávané góly bez penalt jsou xG s odstraněnými střelami z penalt. To je vše. Nejde o samostatnou metriku trénovanou jinak: je to surové xG s odečtenou podmnožinou střel, které přišly z penaltové značky.
Mechanický výpočet:
- Sečtěte xG každé střely v okně, které vás zajímá (zápas, sezona, kariéra).
- Od tohoto součtu odečtěte xG každé střely z penalty.
Co zůstane, je npxG. xG penalty je napříč poskytovateli téměř konstantní, obvykle v rozmezí 0,76 až 0,78. Přesná hodnota závisí na tom, vůči jakému historickému vzorku se poskytovatel kalibruje, ale kolísání je dost malé na to, abyste si penaltu představovali jako zhruba tři čtvrtiny gólu čekajícího, až přijde.
Důvod, proč npxG existuje jako vlastní sloupec, je, že penaltové příležitosti se rozdělují mezi hráče a týmy způsobem, který neodráží celkovou útočnou kvalitu. Tým, který si vydupe hodně faulů v pokutovém území, vygeneruje více penalt bez ohledu na to, jak dobře přihrává či zakončuje v otevřené hře. Útočník, který je určeným exekutorem, akumuluje xG, které by jeho spoluhráč nenaakumuloval, ani kdyby si rovnoměrně rozdělili zátěž otevřené hry. Odečtěte penalty a oba efekty zmizí.
Co zbude, je číslo, které lidé skutečně chtějí, když se ptají: „jak dobrý byl tento tým nebo hráč v otevřené hře?“.
Proč na rozdílu záleží
Několik reálných vzorců činí rozdíl konkrétním.
Nafouknutí exekutora penalt. Útočník, který kope každou penaltu týmu, jenž si ročně vydupe 9 penalt, startuje s 9 × 0,76 = 6,84 xG dříve, než se spočítají jeho střely z otevřené hry. Pokud má tento útočník sezonu 15 xG, jeho npxG je 8,16. Čestné čtení jeho kvality v otevřené hře je 8,16, ne 15. Porovnejte ho s útočníkem z týmu s méně penalty, který také zaznamenal 8,0 xG bez zapojení do penalt, a porovnáváte srovnatelné.
Rozdíl xG týmů. Dva týmy mohou mít v sezoně podobné xG linie, přičemž v otevřené hře jsou různé kalibry. Tým A: 55 xG s 8 vydupanými penalty (6,1 xG z penalt, 48,9 npxG). Tým B: 52 xG s 1 vydupanou penaltou (0,76 xG z penalty, 51,24 npxG). Titulek staví Tým A vpřed. Ve tvorbě šancí v otevřené hře vede Tým B.
Srovnání mezi ligami. Tendence rozhodčích při udělování penalt se liší mezi ligami. La Liga historicky udělovala více penalt na zápas než Premier League. Surové xG týmu La Ligy z toho těží, jeho npxG ne. Meziligová srovnání xG bez úpravy npxG mohou zavést natolik, aby změnila závěr.
Vzorek z počátku sezony. V malých vzorcích jedna penalta prudce zhoupne percentil xG útočníka. Hráč s 2,3 xG v pěti zápasech a jednou proměněnou penaltou má 1,54 npxG. Po odečtení jeho základní sazba vypadá mnohem skromněji. Proto skautské zprávy provádějící časná srovnání sezóny téměř vždy pracují s npxG, když je hodně v sázce.
Vzorec v těchto případech je stejný. Surové xG odpovídá: „jaká byla kvalita všeho, co tato strana nebo hráč vystřelil“. npxG odpovídá: „jaká byla kvalita všeho, co tato strana nebo hráč udělal pro tvorbu šancí v živé hře“. Druhá otázka je obvykle užitečnější.
Jak se npxG obvykle počítá
Všechny veřejné modely xG produkují xG na střelu s příznakem identifikujícím penalty. Sestavit npxG je triviální, jakmile existují data na střelu: vyfiltrujte řádky s is_penalty = true a sečtěte, co zbylo.
Dvě drobná designová rozhodnutí se mezi poskytovateli liší:
Zpracování neproměněných penalt. Některé modely ponechávají hodnotu xG penalty v kumulativním xG hráče i tehdy, když střela neuspěla (zdůvodnění: střela existovala a nesla vysokou kvalitu, takže by se měla do xG započítat). Jiné ji odstraňují. První přístup znamená, že hráč, který neproměňuje penalty, si vytváří větší zdánlivou mezeru „podvýkonu vůči xG“ než ten, který je proměňuje. Pokud čtete sezonní npxG hráče, abyste posoudili jeho zakončování, zkontrolujte, kterou konvenci poskytovatel používá. Obhájitelnější volbou je započítávat exekvované penalty do surového xG, ale ne do npxG, bez ohledu na výsledek, protože npxG se explicitně týká práce v otevřené hře.
Dorážky po neproměněných penaltách. Chycená penalta, kterou spoluhráč doráží do sítě: dostane střela z dorážky plné xG, jaké si zaslouží? Většina poskytovatelů ji bere jako normální střelu z otevřené hry z její pozice a přiřazuje xG podle kontextu střely. To je správně. Ale některé jednodušší modely dorážku shlukují do penaltové sekvence a zacházejí s ní jinak. Pro uživatele čtoucí moderní datové zdroje to není téma; pro uživatele čtoucí starší historická data to stojí za zmínku.
Tactiq čte zápasová data na úrovni událostí z licencovaných sportovních zdrojů pokrývajících více než 1 200 soutěží. Data na střelu obsahují penaltový příznak, což umožňuje čistě spočítat jak surové xG, tak npxG pro analýzu zápasu. Jak se tyto dva signály kombinují se zbytkem toho, co produkt sleduje, zůstává uvnitř aplikace.
Kde npxG stále zavádí
Přechod z xG na npxG je očištění, ne lék. Ostatní slabiny surové metriky stále platí a několik nových se objevuje.
Standardní situace mimo penalty stále deformují. npxG odečítá penalty a ponechává rohy, přímé volné kopy, nepřímé volné kopy, standardky z vhazování. Pro tým postavený na exceletnosti ve standardkách npxG tuto hodnotu stále zachycuje. Chcete-li „xG z otevřené hry“ v přísném smyslu, musíte odstranit všechny střely ze standardních situací, nejen penalty. Někteří poskytovatelé publikují samostatný sloupec „open-play xG“. npxG je napůl cesty, ne celou.
Kontext vydupané penalty je ztracen. Útočník, který je v top úrovni ve vydupávání penalt chytrým pohybem a použitím těla, přispívá týmu skutečnou hodnotou. Tento příspěvek v npxG mizí, protože událost vydupané penalty produkuje střelu z penalty provedenou někým, ne střelu samotného hráče v živé hře. npxG vydupávajícího se čte níž než jeho skutečný útočný přínos. Porovnávání dvou útočníků pouze podle npxG, kde jeden vydupává fauly a druhý ne, podceňuje prvního.
Efekty určeného exekutora. npxG je číslo na úrovni hráče a ten, kdo penaltu vydupe, často není jejím exekutorem. Odečtení penalty z xG exekutora ji nepřipočte zpět na konto vydupávajícího. Pokud se snažíte posoudit, který útočník je pro tým skutečně produktivnější, efekt exekutora podceňuje hodnotu vydupávajícího v npxG stejně, jako surové xG nadhodnocuje hodnotu exekutora.
Nekonzistence zpracování neproměněných penalt. Jak uvádí FAQ, poskytovatelé se liší v tom, zda xG neproměněné penalty zůstává v součtu hráče. Porovnávání dvou hráčů mezi poskytovateli, kteří to řeší jinak, vede k nesrovnatelným závěrům.
Titulkové číslo stále neodráží kvalitu střelce. npxG útočníka říká, kolik šancí z otevřené hry dostal. Neříká, zda je proměnil lépe či hůř než průměr. To je otázka zakončování, na kterou odpovídá mezera npxG oproti gólům bez penalt, ne samotné npxG.
Malé vzorky stále lžou. Jedna velká šance z otevřené hry v jednom zápase může zvednout npxG týmu z 0,9 na 1,5. Tento posun vám neříká, že byl tým lepší po 90 minut. Říká, že se stala jedna dobrá šance. Klouzavé okno několika zápasů zůstává základem.
Pohárové a turnajové zápasy stále nesou vyšší rozptyl. Odečtení penalt nemění fakt, že čtení npxG z pohárového finále je méně spolehlivé než čtení npxG ze středosezonního ligového zápasu. Jistota škáluje s hloubkou srovnatelného vzorku, ne s tím, který sloupec xG čtete.
Použitelné pravidlo, které z toho plyne: npxG je čistší ze dvou čísel pro mezitýmová a mezihráčská porovnání zaměřená na schopnosti v otevřené hře. Stále je to pravděpodobnost, stále podléhá stejným varováním ohledně velikosti vzorku a kontextu jako surové xG, a stále je potřeba ji číst vedle doprovodných metrik.
Jak Tactiq využívá signál npxG v analýze
Tactiq zachází s npxG přesně tak, jak to právě popsal tento článek: jako se zpřesněním obrazu základního výkonu, ne jako se samostatným verdiktem.
Uvnitř analýzy zápasu je rozdíl mezi nedávným surovým xG týmu a jeho nedávným npxG jedním ze signálů, které analýza čte při posuzování formy týmu. Tým, jehož surové xG bylo vysoké, ale npxG skromné, si své xG vydělává hlavně profilem standardek. Tým, jehož npxG je stabilní a blízké surovému xG, si udržuje kvalitu otevřené hry. Tyto dva případy se na zápasové kartě čtou jinak, i když sloupec surového xG vypadá podobně.
Konkrétní způsob, jakým analýza Tactiqu váží surové xG proti npxG v rámci zbytku toho, co vidí, vzorková okna, která používá, způsob, jakým označuje nestabilní signály, zůstávají uvnitř produktu. Zveřejněná metodologie se během týdnů kopíruje a špatně kalibruje; to, co se dostane k uživateli, je informovaná predikce s viditelným ukazatelem jistoty a zdůvodněním vysvětleným běžným jazykem, ne učebnice.
Co uživatel na zápasové kartě vidí:
- Číslo očekávaných gólů pro každou stranu s ukazatelem trendu nedávné formy.
- Trojice pravděpodobností výsledku s viditelným ukazatelem jistoty.
- Psaná analýza pojmenovávající obraz otevřené hry prostým jazykem: „Nedávná tvorba šancí domácích se v otevřené hře drží, ale proměňování standardek upadlo, což stlačilo titulkové xG pod základní vzorec“.
- Žádná externí tržní data kdekoli. Žádná přesměrování na platformy třetích stran. Žádná virtuální měna. Pouze statistická analýza.
Analýza nevyhazuje na obrazovku surová čísla npxG; vyhazuje interpretaci toho, co mezera surové-versus-bez-penalt naznačuje o kvalitě otevřené hry týmu.
Jak číst npxG jako profesionál
Pět návyků promění npxG ze druhého sloupce v užitečný pohled.
- Spárujte surové xG a npxG, kdykoli jsou oba k dispozici. Mezera mezi nimi je penaltový bonus. Penaltově bohaté týmy a útočníci vypadají v obou sloupcích různě z dobrého důvodu.
- Pro mezitýmové srovnání otevřené hry používejte npxG. Profily standardek se liší mezi ligami; frekvence penalt se liší podle sklonů rozhodčích. npxG redukuje alespoň jednu z těchto deformací.
- Neposuzujte exekutory penalt jen podle npxG. Hodnota určeného exekutora zahrnuje to, že penalty spolehlivě proměňuje. npxG tento kredit odečítá a v této roli ho podhodnocuje. Pro hodnocení exekutora sledujte oba sloupce.
- Dejte pozor na zpracování neproměněných penalt napříč poskytovateli. Čtěte poznámky pod čarou na dashboardu. Vyprávění „hráč podvýkonoval xG“ hnané započítanými neproměněnými penaltami je jiný příběh než to hnané skutečně špatným zakončováním v otevřené hře.
- Uplatňujte stejnou disciplínu klouzavého okna jako u xG. Čtyři až osm zápasů. Jeden zápas je anekdota, ne vzorec.
Dohromady tyto návyky promění npxG z drobné varianty v opravdu užitečný pohled na fotbal otevřené hry.
Shrnutí
npxG je xG bez penaltové konstanty. Je čistší pro většinu porovnání, zvláště mezitýmová a mezihráčská čtení zaměřená na schopnosti v otevřené hře. Stále je to pravděpodobnost, ne verdikt, a širší disciplína xG (klouzavá okna, citlivost na kontext, ukazatele jistoty) platí stejně.
Používané jako upgrade oproti surovému xG pro otázky, kde záleží na kvalitě otevřené hry, je to čestné číslo. Používané jako věštec jednoho zápasu nebo tabulková statistika bez kontextu zavádí přesně stejnými způsoby, jakými zavádí surové xG.
Tactiq je postaven tak, aby obraz základního výkonu četl s tímto kontextem drženým na místě. Analýza odráží mezeru surové-versus-bez-penalt tam, kde záleží, vynáší ji běžným jazykem na zápasové kartě a nikdy nemíchá statistické čtení s externími tržními daty. Přes 1 200 soutěží, lokalizace do 32 jazyků, bezplatný plán s osmi analýzami denně, bez platební karty.
Pokud sledujete tuto sérii, přečetli jste si již základy ve třech vrstvách: jak AI predikuje fotbalové zápasy, co xG vlastně měří a kompletní průvodce xA na straně tvorby šancí. npxG stojí vedle xG a xA jako třetí metrika v sadě nástrojů pro základní výkon a čtyři články dohromady pokrývají půdu, na které zbytek blogu dál staví.