Czym Jest xG? Oczekiwane Gole Wyjaśnione Dla Kibiców Piłki Nożnej
Każda rozmowa o piłce nożnej w ciągu ostatnich pięciu lat podchwyciła te same trzy litery. Komentatorzy swobodnie wrzucają xG między powtórkami. Osie czasu na Twitterze publikują tablice wyników xG obok tych prawdziwych. Analitycy odnoszą się do oczekiwanych goli tak, jak starsze pokolenia odnosiły się do procentów posiadania piłki, jakby wszyscy już wiedzieli, co ta liczba oznacza.
Większość kibiców nie wie, i to problem wart rozwiązania. xG to jeden z najbardziej użytecznych sposobów, jakie mamy, aby rozmawiać o piłce nożnej poza wynikiem końcowym, ale jest też jednym z najczęściej nadużywanych. Traktowane jako wyrocznia, rozczarowuje. Traktowane jako to, czym faktycznie jest, wskaźnikiem prawdopodobieństwa dla jakości sytuacji, wyostrza sposób oglądania meczu.
Ten artykuł robi dwie rzeczy. Wyjaśnia, co xG mierzy prostym językiem, bez wymaganego dyplomu ze statystyki. I jest uczciwy co do tego, gdzie xG wprowadza w błąd, ponieważ to połowa, którą większość treści online pomija. Do końca, następnym razem gdy zobaczysz "xG: 1,4 do 2,8" pod wynikiem 2-1, będziesz wiedział, co ci to mówi i co celowo pomija.
Czym xG właściwie jest
Oczekiwane gole, zapisywane jako xG, to wskaźnik prawdopodobieństwa przypisany do pojedynczego strzału. Odpowiada na jedno pytanie: jak prawdopodobne jest, że dokładnie ta sytuacja, w dokładnie tej lokalizacji, po tego rodzaju akcji, skończy się w siatce? Odpowiedzią jest liczba dziesiętna między 0 a 1.
Strzał z sześciu metrów z przestrzenią i zachęcającym dośrodkowaniem może osiągnąć 0,65 xG. Mniej więcej dwie na trzy takie sytuacje, w całej historycznej próbce, kończą się golami. Spekulacyjny strzał z 27 metrów z dwoma obrońcami blokującymi kąt może osiągnąć 0,03 xG. Trzy na sto. Liczba jest średnią z tysięcy podobnych prób, a nie prognozą dla tego konkretnego strzelca tego konkretnego dnia.
Zsumuj każdy strzał w meczu dla jednej drużyny, a otrzymasz całkowite xG tej drużyny za mecz. Wynik xG: 0,9 do 2,4 przy bramkach 2-1 mówi ci, że strona z jedną bramką była lepszą stroną pod względem kreowania sytuacji, a strona z dwoma bramkami wykończyła znacznie powyżej swojego podstawowego wskaźnika. Wynik xG: 2,7 do 0,4 przy bramkach 0-0 mówi ci, że ktoś zasługiwał na wygraną i nie wygrał, to wzorzec, który każdy kibic rozpoznaje z meczów, które wydają się niesprawiedliwe.
Metryka została po raz pierwszy użyta komercyjnie na początku lat 2010, najbardziej widocznie przez Opta, i od tamtej pory stała się domyślnym sposobem opisywania jakości sytuacji na każdym poziomie profesjonalnej piłki nożnej. Jej użyteczność nie jest kontrowersyjna. Jej nadużywanie tak.
Jak xG jest obliczane, w zarysie
Modele xG nie używają żadnego pojedynczego magicznego wejścia. Są trenowane na ogromnych bibliotekach historycznych strzałów, zwykle setkach tysięcy, każdy oznaczony wynikiem końcowym (gol lub nie) i listą cech kontekstowych. Model uczy się, które cechy podnoszą wskaźnik konwersji, a które go obniżają.
Cechy, na których opiera się większość modeli xG, są w szerokim ujęciu podobne w całej branży:
- Lokalizacja strzału. Gdzie na boisku został wykonany strzał, mierzony jako odległość i kąt do bramki. To najsilniejszy pojedynczy czynnik.
- Część ciała. Prawa noga, lewa noga, głowa lub inna. Główki z tego samego miejsca co strzały nogą konwertują się w bardzo różnych proporcjach.
- Rodzaj asysty. Czy to było podanie prostopadłe, dośrodkowanie, cofnięcie, stały fragment gry, dobitka. Każdy wzorzec dostarczenia produkuje własną typową konwersję.
- Presja obronna. Ilu obrońców znajdowało się między strzałem a bramką i jak blisko był najbliższy z nich. Otwarte strzały konwertują się znacznie częściej niż zamknięte.
- Stan i faza gry. Gra otwarta, szybki kontratak, stały fragment, rzut karny. Rzuty karne w szczególności są traktowane jako prawie stałe 0,76 do 0,78 xG w większości publicznych modeli.
Różni dostawcy używają różnych konkretnych zestawów cech. Niektórzy włączają cechy danych śledzenia, takie jak pozycjonowanie obrońców. Niektórzy uwzględniają pozycję startową bramkarza. Kilku włącza cechy akcji przed strzałem, takie jak podania na posiadanie. To, co wszyscy dzielą, to podstawowa idea: zredukuj każdy strzał do małego zestawu opisowych tagów, sprawdź, jak często ta kombinacja tagów historycznie była golem, i zwróć ten wskaźnik jako xG.
Tactiq używa danych meczowych na poziomie zdarzeń z licencjonowanych kanałów sportowych w ponad 1200 ligach, aby pozyskać kontekst na strzał do analizy. Konkretny sposób, w jaki sygnały xG łączą się z resztą tego, na co patrzy produkt, pozostaje wewnątrz aplikacji. Użyteczny wniosek dla czytelnika jest taki: samo xG jest standardem branżowym. To, co narzędzie robi z xG potem, jest miejscem, w którym produkty się różnią.
Dlaczego xG ma znaczenie
Tabela ligowa klasyfikuje drużyny według wyników. Kolumna strzelonych goli klasyfikuje je według wykończenia, co jest hałaśliwe. xG daje ci trzecią soczewkę: kto wygenerował najwięcej jakości, niezależnie od tego, czy piłka wpadła do siatki.
To ma znaczenie z kilku powodów, na których kibic piłki nożnej faktycznie mu zależy.
Oddziela szczęście od wydajności. Napastnik, który strzela pięć goli w trzech meczach z łącznym 1,8 xG, wykańcza powyżej swojego wskaźnika, a ten wskaźnik zwykle cofnie się. Napastnik, który strzela zero z łącznego 4,1 xG, ma pecha, a jego gole zwykle przyjdą. Przy wystarczającej liczbie strzałów xG i gole zbiegają się. Kiedy się rozchodzą, dzieje się coś tymczasowego, albo heroiczne wykończenie, albo frustrujące pudła, albo bramkarz mający miesiąc kariery.
Nagradza proces ponad wynik. Drużyna, która tworzy sytuacje warte 2,5 xG i przegrywa 0-1 z bramki po stałym fragmencie, jest często lepszą stroną przez 90 minut. xG uchwyca tę lukę w sposób, w jaki końcowy wynik nie może. Trenerzy używali wewnętrznych wersji tego pomysłu przez dziesięciolecia. xG upubliczniło to.
Ujawnia podstawową formę przed wynikami. Drużyna ze środka tabeli, której różnica xG cicho poprawiła się w ciągu sześciu meczów, często wkrótce wspina się w tabeli, nawet jeśli jej punkty jeszcze nie nadrobiły. Drużyna z górnej połowy, której xG spada, podczas gdy wciąż wygrywa ciasne mecze, pożycza pod regresję, która zazwyczaj nadchodzi. W kroczącym oknie czterech do ośmiu meczów forma xG jest bardziej uczciwym wskaźnikiem niż surowe wyniki.
Daje ci sposób mówienia o jakości strzałów. Przed xG "dobra sytuacja" i "zła sytuacja" były subiektywne. Dwie osoby mogły oglądać to samo pudło i nie zgadzać się co do tego, czy powinno być strzelone. xG daje temu liczbę. Liczba jest niedoskonała, ale jest spójna w różnych meczach, ligach i sezonach.
Podróżuje przez ligi. Strzał 0,30 xG w holenderskiej Eredivisie jest rozpoznawalny jako strzał 0,30 xG w włoskiej Serie A. Podstawowa jakość sytuacji jest tą samą metryką, nawet jeśli kontekst taktyczny wokół niej się różni. Ta przenośność jest częścią tego, dlaczego xG stało się lingua franca nowoczesnej analizy piłki nożnej.
Gdzie xG wprowadza w błąd
Ta sekcja jest tą, którą większość objaśniaczy xG pomija, i jest powodem, dla którego xG jest traktowane jako magia przez ludzi, którzy powinni wiedzieć lepiej. Bycie uczciwym co do słabych punktów metryki to różnica między dobrym używaniem xG a daniem się przez nie zwieść.
Małe próbki kłamią. Jeden mecz prawie nigdy nie jest wystarczającą ilością danych xG, aby cokolwiek ocenić. Napastnik może uzyskać 1,4 xG przeciwko głębokiej obronie, która wpuszcza go do pola karnego całą noc, i uzyskać 0,05 xG przeciwko wysokiemu pressingowi, który nigdy nie pozwala mu się odwrócić. Oba to informacje o tym konkretnym starciu, a nie o zdolności napastnika. Przewijanie minimum czterech do sześciu meczów przed wyciągnięciem wniosków jest podstawą. Cokolwiek mniej to anegdota z liczbą dołączoną.
Elitarni wykańczacze systematycznie pobijają xG. Niektórzy zawodnicy, przez całe kariery, strzelają więcej goli, niż sugeruje ich xG. Messi, Salah, Haaland i mały klub innych mają wystarczający wolumen strzałów, że ich nadwyżka nie jest tylko szumem. Przeciętny model xG nie wie, kto strzela, tylko skąd padł strzał. To cecha, a nie bug, ale oznacza to, że surowe xG nie docenia wartości elitarnych napastników i przecenia wartość strzelców wolumenu, którzy nie wykańczają.
Słabi wykańczacze systematycznie nie osiągają xG. Odwrotność jest równie prawdziwa. Napastnicy, którzy chronicznie niedowartościowują xG przez cały sezon, zwykle nie mają pecha. Słabo wykańczają. Traktowanie ich niedowartościowania jako zbliżającej się regresji, podczas gdy wzorzec kariery mówi inaczej, jest powszechną pułapką.
Błędy obronne zawyżają xG. Pomyłka bramkarza, która toczy się do niepilnowanego napastnika z sześciu metrów, daje wysokie xG, ponieważ strzał odbywa się z lokalizacji wysokiej jakości. Model xG nie widzi błędu obronnego, który stworzył sytuację. W pojedynczym meczu drużyna może uzyskać imponującą linię xG w dużej mierze dzięki błędom przeciwnika, a to nie jest powtarzalna umiejętność.
Stałe fragmenty i rzuty karne zniekształcają liczbę główną. Rzut karny jest wart mniej więcej 0,76 xG za każdym razem. Drużyna, która zdobywa dwa rzuty karne w meczu, ma 1,5 xG upieczone, zanim zacznie grać w piłkę. Analitycy, którym zależy na wydajności z gry otwartej, czasem odejmują rzuty karne i wolne od sumy. Publiczna tablica wyników zwykle tego nie robi.
Finały pucharów, derby i mecze o utrzymanie łamią model. xG jest skalibrowane wobec ogromnej historycznej bazy meczów sezonu zasadniczego. Finały, lokalne derby i mecze przetrwania ostatniego dnia mają różne psychologie, różne kształty taktyczne, różne decyzje sędziowskie i znacznie mniejsze porównywalne próbki. Używanie xG do czytania tych meczów w taki sam sposób, w jaki czytałbyś mecz ligowy w środku sezonu, to błąd. Liczba wciąż jest obliczana. Zaufanie wokół niej powinno być niższe, a większość publicznych dashboardów nie czyni tego widocznym.
Efekty stanu późnej gry przekręcają sumę. Drużyna goniąca gol w ostatnich dwudziestu minutach tworzy sytuacje rozpaczy, które nie są reprezentatywne dla jej prawdziwej jakości. Drużyna broniąca prowadzenia 1-0 spada w ustawienie, które celowo oddaje posiadanie i wolumen strzałów. Surowe xG pełnego meczu zaciera te fazy razem. Istnieje xG dostosowane do stanu gry, ale to nie jest to, co pokazuje główna tablica wyników.
Jest sygnałem na poziomie drużyny źle odczytywanym jako sygnał na poziomie zawodnika. "Zawodnik X ma 0,8 xG w tym meczu" może oznaczać, że miał jedną dobrą sytuację i spudłował lub sześć półsytuacji i spudłował je wszystkie. Kształt podstawowego rozkładu strzałów ma znaczenie, nie tylko suma. Traktowanie skumulowanego xG jako karty raportu zawodnika, bez patrzenia na częstotliwość strzałów i rozrzut jakości, to sposób, w jaki kibice kończą kłócąc się o liczby opisujące różne rzeczy.
Zasada, która wynika z tego wszystkiego: xG jest najbardziej użyteczne jako jedno wejście w szerszy odczyt, porównywane w oknie kilku meczów, z jakością wykańczacza i kontekstem meczu trzymanymi w głowie. Jest najmniej użyteczne jako samodzielny werdykt w pojedynczym meczu.
Jak Tactiq używa xG w analizie
Tactiq traktuje xG tak, jak właśnie opisał to ten artykuł: jako jeden element danych leżącej u podstaw wydajności, a nie prognoza sama w sobie. Jest częścią świadomej predykcji, prognozy opartej na danych, a nie nią samą.
Wewnątrz analizy meczu sygnały xG przyczyniają się do obrazu, kto wykonuje się na jakim poziomie w ostatnich meczach, którzy zawodnicy i drużyny nad- lub nie dorównują swojej jakości, i jak ciasny lub jednostronny jest podstawowy kształt starcia. Forma xG siedzi obok kilku innych wejść. Żadne z nich nie jest traktowane jako odpowiedź.
Konkretny sposób, w jaki analiza Tactiq miesza xG z resztą tego, co widzi, wagi, kroczące okna, dostosowania specyficzne dla ligi, sposoby oznaczania niestabilnych sygnałów, pozostaje wewnątrz produktu. To celowy wybór projektowy, a nie wymijający. Opublikowana metodologia jest kopiowana i źle kalibrowana w ciągu tygodni; to, co dociera do użytkownika, to analiza z kwalifikowanym zaufaniem, z rozumowaniem wyjaśnionym prostym językiem, a nie podręcznikiem.
Co użytkownik widzi na karcie meczu:
- Liczbę oczekiwanych goli dla każdej strony, ze wskaźnikiem ostatniej tendencji, abyś mógł stwierdzić, w którą stronę porusza się liczba.
- Trójki prawdopodobieństw dla wyniku, kwalifikowane widocznym wskaźnikiem zaufania, który odzwierciedla, jak stabilne są podstawowe sygnały dla tego konkretnego meczu.
- Pisemną analizę, która nazywa kontekst xG prostym językiem: "Ostatni trend xG drużyny gospodarzy podniósł się w ciągu ich ostatnich pięciu meczów, głównie dzięki jakości ze stałych fragmentów", a nie "nasz model przypisuje wagę 0,37 do wektora cech trzy".
- Brak kursów bukmacherskich gdziekolwiek. Brak zachęt do zakładów. Brak waluty wirtualnej. Ramą jest analiza statystyczna, i tak pozostaje.
Intencją jest, aby kibic czytający kartę Tactiq odchodził z ostrzejszym odczytem meczu, a nie liczbą do skopiowania gdzie indziej.
Jak czytać xG jak profesjonalista
Sześć nawyków oddziela ludzi, którzy dobrze używają xG, od tych, którzy je cytują.
- Zawsze patrz na kroczące okno, a nie jeden mecz. Cztery do ośmiu meczów na drużynę to podstawa. Jeden mecz to historia, a nie wzorzec.
- Porównuj różnicę xG, a nie surowe xG. "O ile więcej jakości wygenerowała ta drużyna, niż straciła" jest zwykle bardziej pouczające niż sama suma którejkolwiek strony.
- Usuń rzuty karne i wolne, gdy zależy ci na grze otwartej. Publiczny nagłówek często tego nie robi. Odejmij 0,76 za każdy rzut karny, aby zobaczyć, jak wyglądał kształt gry otwartej.
- Sprawdź, kto strzela. Elitarny wykańczacz przewyższający xG to nie jest wiadomość. Napastnik rotacyjny przewyższający xG to flaga, która mówi "rozmiar próbki".
- Czytaj xG obok historii wykańczania. Nadwyżka przez kilka meczów może być szumem. Nadwyżka przez trzy sezony to informacja.
- Traktuj mecze derbowe, pucharowe i finałowe z ostrożnością. Obniż swoje zaufanie do odczytu xG w meczach, dla których model ma mniej porównywalnych starć. Liczba jest obliczana. Pasmo wokół niej jest szersze, niż mówi ci dashboard.
Zastosowane razem, te nawyki zamieniają xG z liczby trywialnej w soczewkę. Soczewka jest uczciwa co do tego, co może zobaczyć. O to w tym wszystkim chodzi.
Podsumowanie
xG to świadoma predykcja, prognoza oparta na danych dotycząca jakości sytuacji, a nie werdykt w meczu. Używane wewnątrz okna kilku meczów, czytane obok jakości wykańczacza i kontekstu meczu, i pozbawione inflacji rzutów karnych i stałych fragmentów, gdy pytanie dotyczy gry otwartej, to jedno z najostrzejszych narzędzi, jakie ma kibic do mówienia o piłce nożnej poza wynikiem końcowym.
Używane jako wyrocznia pojedynczego meczu, lub jako liczba rankingowa bez kontekstu, lub jako substytut oglądania meczu, wprowadza w błąd. Metryka się nie zmieniła. Odczyt tak.
Tactiq jest zbudowane wokół tego odczytu. Aplikacja eksponuje xG w kontekście, kwalifikuje je zaufaniem, wyjaśnia, co liczba oznacza w języku, którego kibic może faktycznie używać, i nigdy nie miesza go z kursami bukmacherskimi lub zachętami do zakładów. Ponad 1200 lig, lokalizacja w 32 językach w interfejsie i tekście analitycznym, darmowy poziom ośmiu analiz dziennie, bez karty kredytowej.
Jeśli ten artykuł okazał się przydatny, naturalnym towarzyszem jest wcześniejszy przewodnik o tym, jak AI przewiduje mecze piłkarskie. xG to jedna z czterech rodzin danych, które ten tekst omawia szczegółowo, a oba artykuły razem są fundamentem, na którym nadal budujemy resztę bloga.