Czym jest npxG? Oczekiwane gole bez rzutów karnych wyjaśnione
Otwórz dowolny nowoczesny panel analityczny piłki nożnej, a obok nazwiska napastnika zobaczysz dwie kolumny. Jedna mówi xG. Druga mówi npxG. Liczby się różnią, czasem znacznie. Napastnik z Premier League z 18 xG w tym sezonie może mieć 14,5 npxG, przy czym różnica 3,5 gola pochodzi w całości z puli rzutów karnych jego klubu. Jeśli czytasz kolumnę xG bez zrozumienia, na którą patrzysz, czytasz historię z cicho wbudowaną premią za rzuty karne.
Ten artykuł przechodzi przez to, czym jest npxG, dlaczego usuwanie rzutów karnych z xG jest zwykle uczciwym ruchem, oraz pułapki, które łapią analityków dokonujących tej zmiany bez zastanowienia się, co jeszcze nie zostało wyczyszczone. Do końca następnym razem, gdy ktoś rzuci statystyką xG, będziesz wiedzieć, czy to wersja nagłówkowa, czy wersja, która faktycznie opisuje jakość gry otwartej.
Czym naprawdę jest npxG
Oczekiwane gole bez rzutów karnych to xG z usuniętymi strzałami z rzutów karnych. Tyle. To nie jest osobna metryka trenowana inaczej: to surowe xG z odjętym podzbiorem strzałów, które padły z jedenastego metra.
Mechaniczny rachunek:
- Zsumuj xG każdego strzału w interesującym Cię okresie (mecz, sezon, kariera).
- Odejmij od tej sumy xG każdego strzału z rzutu karnego.
To, co zostaje, to npxG. xG rzutu karnego jest prawie stałe u różnych dostawców, zwykle w zakresie od 0,76 do 0,78. Dokładna wartość zależy od tego, do jakiej historycznej próby kalibruje się dostawca, ale wahania są na tyle małe, że o rzucie karnym można myśleć jak o około trzech czwartych gola czekającego na realizację.
Powód, dla którego npxG istnieje jako własna kolumna, jest taki, że okazje do rzutów karnych rozkładają się wśród zawodników i drużyn w sposób, który nie odzwierciedla ogólnej jakości ofensywy. Drużyna, która zarabia dużo fauli w polu karnym, będzie generować więcej rzutów karnych niezależnie od tego, jak dobrze podaje czy wykańcza w grze otwartej. Napastnik, który jest wyznaczonym wykonawcą, gromadzi xG, którego jego kolega nie zgromadziłby nawet przy równym podziale ciężaru gry otwartej. Wyłącz karne i oba efekty znikają.
Zostaje liczba, której ludzie naprawdę chcą, gdy pytają „jak dobra była ta drużyna lub zawodnik w grze otwartej?”.
Dlaczego różnica ma znaczenie
Kilka realnych wzorców czyni tę różnicę konkretną.
Inflacja wykonawcy rzutów karnych. Napastnik wykonujący każdego karnego dla zespołu, który zarabia 9 karnych w sezonie, zaczyna z 9 × 0,76 = 6,84 xG, zanim policzone zostaną jego strzały w grze otwartej. Jeśli ten napastnik ma sezon 15 xG, jego npxG wynosi 8,16. Uczciwy odczyt jego jakości w grze otwartej to 8,16, a nie 15. Porównaj go z napastnikiem z drużyny zdobywającej mniej karnych, który również zanotował 8,0 xG bez udziału w karnych, a porównujesz równe z równym.
Różnica xG drużyny. Dwie drużyny mogą mieć podobne linie xG sezonu, będąc różnymi zespołami w grze otwartej. Drużyna A: 55 xG przy 8 zarobionych karnych (6,1 xG z karnych, 48,9 npxG). Drużyna B: 52 xG przy 1 zarobionym karnym (0,76 xG z karnych, 51,24 npxG). Nagłówek stawia Drużynę A z przodu. W kreowaniu sytuacji w grze otwartej z przodu jest Drużyna B.
Porównanie między ligami. Tendencje sędziów co do przyznawania rzutów karnych różnią się między ligami. La Liga historycznie przyznawała więcej karnych na mecz niż Premier League. Surowe xG drużyny La Liga korzysta z tego, ich npxG już nie. Porównania xG między ligami bez korekty npxG mogą wprowadzać w błąd na tyle, by zmienić wniosek.
Wczesna próba sezonu. W małych próbach jeden rzut karny gwałtownie przesuwa percentyl xG napastnika. Zawodnik z 2,3 xG w pięciu meczach i jednym zamienionym karnym ma 1,54 npxG. Po usunięciu jego wskaźnik bazowy wygląda znacznie skromniej. Dlatego raporty skautingowe prowadzące porównania wczesnosezonowe niemal zawsze pracują na npxG, gdy stawka jest wysoka.
Wzorzec w tych przypadkach jest ten sam. Surowe xG odpowiada na pytanie „jaka była jakość wszystkiego, co strzeliła ta drużyna lub zawodnik”. npxG odpowiada na pytanie „jaka była jakość wszystkiego, co ta drużyna lub zawodnik zrobili, by stworzyć sytuacje w grze żywej”. Drugie pytanie jest zwykle bardziej użyteczne.
Jak npxG jest zwykle obliczane
Wszystkie publiczne modele xG produkują xG na strzał z flagą identyfikującą strzały z rzutów karnych. Zbudowanie npxG jest trywialne, gdy dane na strzał istnieją: odfiltruj wiersze z is_penalty = true i zsumuj, co zostało.
Dwie drobne decyzje projektowe różnią się między dostawcami:
Traktowanie niewykorzystanych karnych. Niektóre modele zachowują wartość xG rzutu karnego w skumulowanym xG zawodnika nawet wtedy, gdy strzał był nieskuteczny (uzasadnienie: strzał istniał i niósł wysoką jakość, więc powinien wliczać się do xG). Inne to usuwają. Pierwsze podejście oznacza, że zawodnik, który pudłuje karne, rozwija większą pozorną lukę „słabszej formy niż xG” niż ten, który je wykorzystuje. Jeśli czytasz npxG zawodnika za sezon, aby ocenić jego wykończenie, sprawdź, którą konwencję stosuje dostawca. Bardziej obroną decyzją jest liczenie wykonanych rzutów karnych w surowym xG, ale nie w npxG, niezależnie od wyniku, ponieważ npxG wyraźnie dotyczy pracy w grze otwartej.
Dobitki po niewykorzystanych karnych. Obroniony karny, z którego kolega dobija do siatki: czy strzał z dobitki dostaje pełne xG, na które zasługuje? Większość dostawców traktuje go jako zwykły strzał z gry otwartej z jego lokalizacji i przypisuje xG na podstawie kontekstu strzału. To poprawne. Ale niektóre prostsze modele łączą dobitkę z sekwencją rzutu karnego i traktują ją inaczej. Dla użytkowników czytających nowoczesne kanały danych to nieistotny temat; dla użytkowników czytających starsze dane historycznych warto wiedzieć.
Tactiq czyta dane meczowe na poziomie zdarzenia z licencjonowanych kanałów sportowych obejmujących ponad 1200 rozgrywek. Dane na strzał zawierają flagę rzutu karnego, co pozwala czysto obliczyć zarówno surowe xG, jak i npxG dla analizy meczu. To, jak te dwa sygnały łączą się z resztą tego, co rozważa produkt, pozostaje wewnątrz aplikacji.
Gdzie npxG wciąż wprowadza w błąd
Przejście z xG na npxG to czyszczenie, a nie lekarstwo. Inne słabości surowej metryki nadal obowiązują, i pojawia się kilka nowych.
Stałe fragmenty inne niż karne wciąż zniekształcają. npxG usuwa rzuty karne i zostawia rożne, bezpośrednie i pośrednie rzuty wolne, zagrania ze wrzutów. Dla drużyny zbudowanej wokół doskonałości w stałych fragmentach npxG wciąż wychwytuje tę wartość. Jeśli chcesz „xG gry otwartej” w ścisłym sensie, musisz usunąć wszystkie strzały ze stałych fragmentów, nie tylko karne. Niektórzy dostawcy publikują oddzielną kolumnę „open-play xG”. npxG jest w połowie drogi, nie na całej.
Kontekst wywalczonego rzutu karnego jest tracony. Napastnik, który jest klasy światowej w wywalczaniu karnych sprytnym ruchem i użyciem ciała, wnosi realną wartość do swojej drużyny. Ten wkład znika w npxG, ponieważ zdarzenie wywalczenia karnego produkuje strzał z karnego wykonywany przez kogoś, a nie strzał tego zawodnika w grze żywej. npxG wywalczającego jest niższe niż jego rzeczywisty wkład ofensywny. Porównywanie dwóch napastników wyłącznie na npxG, gdzie jeden wywalcza faule, a drugi nie, niedocenia pierwszego.
Efekty wyznaczonego wykonawcy. npxG to liczba na poziomie zawodnika, a wywalczający karnego często nie jest jego wykonawcą. Usunięcie karnego z xG wykonawcy nie dodaje go z powrotem na konto wywalczającego. Jeśli próbujesz ocenić, który napastnik jest naprawdę produktywniejszy dla swojej drużyny, efekt wykonawcy niedocenia wartości wywalczającego w npxG tak samo, jak surowe xG zawyża wartość wykonawcy.
Niespójność obsługi niewykorzystanych karnych. Jak zauważa FAQ, dostawcy różnią się tym, czy xG niewykorzystanego rzutu karnego pozostaje w sumie zawodnika. Porównywanie dwóch zawodników u dostawców, którzy obsługują to inaczej, produkuje wnioski o nieporównywalnych podstawach.
Liczba nagłówkowa nadal nie odzwierciedla jakości strzelca. npxG napastnika mówi, ile sytuacji w grze otwartej otrzymał. Nie mówi, czy zamienił je lepiej, czy gorzej od średniej. To pytanie o wykończenie, na które odpowiada luka między npxG a golami bez karnych, a nie samo npxG.
Małe próby nadal kłamią. Jedna duża sytuacja w grze otwartej w jednym meczu może podnieść npxG drużyny z 0,9 do 1,5. To przesunięcie nie mówi, że drużyna była lepsza przez 90 minut. Mówi, że wydarzyła się jedna dobra sytuacja. Kroczące okno kilku meczów pozostaje bazą.
Mecze pucharowe i turniejowe nadal niosą większą wariancję. Usunięcie karnych nie zmienia faktu, że odczyt npxG z finału pucharu jest mniej wiarygodny niż odczyt npxG z ligowego meczu śródsezonowego. Pewność skaluje się z głębokością porównywalnej próby, a nie z tym, którą kolumnę xG czytasz.
Użyteczna reguła, która z tego wynika: npxG jest czystszą z dwóch liczb do porównań między drużynami i zawodnikami skupionych na umiejętnościach w grze otwartej. Nadal jest prawdopodobieństwem, nadal podlega tym samym ostrzeżeniom co do wielkości próby i kontekstu co surowe xG, i nadal wymaga czytania obok metryk towarzyszących.
Jak Tactiq wykorzystuje sygnał npxG w analizie
Tactiq traktuje npxG dokładnie tak, jak opisał to ten artykuł: jako dopracowanie obrazu leżącej u podstaw formy, a nie samodzielny werdykt.
Wewnątrz analizy meczu różnica między niedawnym surowym xG drużyny a jej niedawnym npxG jest jednym z sygnałów, które analiza odczytuje, oceniając formę zespołu. Drużyna, której surowe xG było wysokie, ale npxG umiarkowane, zarabia swoje xG głównie z profilu stałych fragmentów. Drużyna, której npxG jest stabilne i bliskie surowemu xG, utrzymuje jakość w grze otwartej. Te dwie sytuacje odczytują się inaczej na karcie meczu, nawet jeśli kolumna surowego xG wygląda podobnie.
Konkretny sposób, w jaki analiza Tactiq waży surowe xG względem npxG na tle reszty tego, co widzi, okna próbki, których używa, sposób, w jaki oznacza niestabilne sygnały, pozostają wewnątrz produktu. Opublikowana metodologia bywa kopiowana i źle kalibrowana w ciągu tygodni; to, co dociera do użytkownika, to świadoma predykcja z wyraźnym wskaźnikiem pewności i uzasadnieniem wyjaśnionym prostym językiem, a nie podręcznik.
Co użytkownik widzi na karcie meczu:
- Liczbę oczekiwanych goli dla każdej strony, ze wskaźnikiem trendu niedawnej formy.
- Trójki prawdopodobieństw wyniku, opatrzone widocznym wskaźnikiem pewności.
- Napisana analiza nazywająca obraz gry otwartej prostym językiem: „Niedawne kreowanie gospodarzy utrzymało się w grze otwartej, choć wykorzystanie stałych fragmentów spadło, co ściągnęło nagłówkowe xG poniżej wzorca leżącego u podstaw”.
- Brak zewnętrznych danych rynkowych gdziekolwiek. Brak przekierowań na platformy zewnętrzne. Brak wirtualnej waluty. Wyłącznie analiza statystyczna.
Analiza nie wyświetla surowych liczb npxG na ekranie; wyświetla interpretację tego, co luka surowe-kontra-bez-karnych mówi o jakości gry otwartej drużyny.
Jak czytać npxG jak profesjonalista
Pięć nawyków zmienia npxG z drugiej kolumny w użyteczny pryzmat.
- Zestawiaj surowe xG i npxG, kiedy oba są dostępne. Luka między nimi to premia karna. Drużyny i napastnicy z dużą liczbą karnych wyglądają inaczej w dwóch kolumnach z dobrego powodu.
- Używaj npxG do porównań gry otwartej między drużynami. Profile stałych fragmentów różnią się między ligami; częstotliwości karnych różnią się w zależności od tendencji sędziowskich. npxG redukuje przynajmniej jedno z tych zniekształceń.
- Nie oceniaj wykonawców karnych wyłącznie na npxG. Wartość wyznaczonego wykonawcy karnych obejmuje to, że niezawodnie je wykorzystuje. npxG odejmuje ten kredyt i niedocenia go w tej roli. Do oceny wykonawcy patrz na obie kolumny.
- Uważaj na obsługę niewykorzystanych karnych u różnych dostawców. Czytaj przypisy na pulpicie. Narracja „zawodnik poniżej xG” napędzana wliczonymi pudłami karnymi to inna historia niż ta napędzana prawdziwym słabym wykończeniem w grze otwartej.
- Stosuj tę samą dyscyplinę kroczącego okna co przy xG. Cztery do ośmiu meczów. Jeden mecz to anegdota, a nie wzorzec.
Razem te nawyki zmieniają npxG z drobnej odmiany w naprawdę użyteczny widok piłki w grze otwartej.
Wnioski
npxG to xG z usuniętą stałą karną. Jest czystsze dla większości porównań, szczególnie odczytów między drużynami i zawodnikami skupionych na umiejętnościach w grze otwartej. Nadal jest prawdopodobieństwem, a nie werdyktem, i szersza dyscyplina xG (kroczące okna, wrażliwość na kontekst, wskaźniki pewności) stosuje się równo.
Używane jako ulepszenie ponad surowe xG tam, gdzie liczy się jakość gry otwartej, jest uczciwą liczbą. Używane jako wyrocznia pojedynczego meczu lub statystyka tabelaryczna bez kontekstu, wprowadza w błąd dokładnie tak samo, jak wprowadza w błąd surowe xG.
Tactiq jest zbudowane, by odczytywać obraz leżącej u podstaw formy z tym kontekstem utrzymanym w miejscu. Analiza odzwierciedla lukę surowe-kontra-bez-karnych tam, gdzie ma to znaczenie, wyświetla ją prostym językiem na karcie meczu i nigdy nie miesza odczytu statystycznego z zewnętrznymi danymi rynkowymi. Ponad 1200 rozgrywek, lokalizacja w 32 językach, darmowy plan obejmujący osiem analiz dziennie, bez karty kredytowej.
Jeśli śledzisz tę serię, przeczytałeś już podstawy w trzech warstwach: jak AI przewiduje mecze piłkarskie, co xG naprawdę mierzy oraz kompletny przewodnik xA po stronie kreowania. npxG stoi obok xG i xA jako trzecia metryka w zestawie narzędzi do formy leżącej u podstaw, a cztery artykuły razem pokrywają grunt, na którym reszta bloga dalej buduje.