Što je xG? Očekivani golovi objašnjeni za ljubitelje nogometa
Svaki nogometni razgovor u posljednjih pet godina pokupio je ista tri slova. Komentatori usput spominju xG između snimaka. Twitter timeline postavlja xG rezultate pored pravih. Analitičari govore o očekivanim golovima na način na koji su starije generacije govorile o postotku posjeda, kao da svi već znaju što taj broj znači.
Većina navijača ne zna, i to je problem koji vrijedi riješiti. xG je jedan od najkorisnijih načina koje imamo za razgovor o nogometu izvan konačnog rezultata, ali je također jedan od najzloupotrijebljenijih. Tretiran kao proročište, razočarava. Tretiran kao ono što zapravo jest, ocjena vjerojatnosti za kvalitetu prilike, izoštrava način na koji gledate utakmicu.
Ovaj članak radi dvije stvari. Objašnjava što xG mjeri jednostavnim jezikom, bez potrebe za statističkom diplomom. I iskren je o tome gdje xG zavarava, jer je upravo to polovica koju većina online sadržaja preskače. Do kraja, sljedeći put kada vidite "xG: 1,4 prema 2,8" ispod rezultata 2-1, znat ćete što vam to govori i što namjerno izostavlja.
Što xG zapravo jest
Očekivani golovi, napisano xG, ocjena je vjerojatnosti pridružena jednom udarcu. Odgovara na jedno pitanje: koliko je vjerojatno da će upravo ova prilika, na ovoj točnoj lokaciji, nakon ovakve pripreme, završiti u mreži? Odgovor je decimalni broj između 0 i 1.
Udarac ispucan sa šest metara s prostorom i pozivajućim centaršutom mogao bi imati 0,65 xG. Otprilike dvije od svake tri takve prilike, kroz cijeli povijesni uzorak, postaju golovi. Spekulativni udarac s 27 metara s dva branitelja koji blokiraju kut mogao bi imati 0,03 xG. Tri od svakih stotinu. Broj je prosjek kroz tisuće sličnih pokušaja, a ne predviđanje za tog konkretnog strijelca tog konkretnog dana.
Zbrojite svaki udarac u utakmici za jednu momčad i dobivate ukupni xG te momčadi za utakmicu. Rezultat xG: 0,9 prema 2,4 uz golove 2-1 govori vam da je strana s jednim golom bila bolja po stvaranju prilika, a strana s dva gola realizirala je daleko iznad svoje temeljne stope. Rezultat xG: 2,7 prema 0,4 uz golove 0-0 govori vam da je netko zaslužio pobijediti i nije, što je obrazac koji svaki navijač prepoznaje iz utakmica koje se čine nepravednima.
Metrika je prvi put komercijalno korištena početkom 2010-ih, najvidljivije od strane Opte, i od tada je postala zadani način opisivanja kvalitete prilike na svakoj razini profesionalnog nogometa. Njezina korisnost nije kontroverzna. Njezina zloupotreba jest.
Kako se xG izračunava, u osnovnim crtama
xG modeli ne koriste nijedan pojedinačni čarobni ulaz. Treniraju se na ogromnim bibliotekama povijesnih udaraca, obično stotinama tisuća njih, svaki označen konačnim ishodom (gol ili ne) i popisom kontekstualnih značajki. Model uči koje značajke pomiču stopu realizacije gore, a koje dolje.
Značajke na koje se većina xG modela oslanja široko su slične u industriji:
- Lokacija udarca. Gdje je na terenu udarac ispucan, mjereno udaljenošću i kutom prema golu. Ovo je najjači pojedinačni pokretač.
- Dio tijela. Desna noga, lijeva noga, glava ili drugo. Udarci glavom s istog mjesta kao udarci nogom pretvaraju se u golove u vrlo različitim stopama.
- Vrsta asistencije. Je li to bila prodorna lopta, centaršut, povratna lopta, prekid, odbijanac. Svaki obrazac dostave proizvodi svoju tipičnu realizaciju.
- Defenzivni pritisak. Koliko je branitelja bilo između udarca i gola i koliko je blizu bio najbliži. Slobodni udarci pretvaraju se u golove daleko češće od zatvorenih.
- Stanje i faza igre. Otvorena igra, brzi prijelaz, prekid, jedanaesterac. Jedanaesterci se posebno tretiraju kao gotovo konstantan 0,76 do 0,78 xG u većini javnih modela.
Različiti pružatelji koriste različite specifične skupove značajki. Neki uključuju značajke iz tracking podataka poput pozicioniranja branitelja. Neki uključuju početnu poziciju vratara. Nekolicina uključuje značajke pripreme prije udarca poput dodavanja po posjedu. Ono što svi dijele jest temeljna ideja: svesti svaki udarac na mali skup opisnih oznaka, pogledati koliko je često ta kombinacija oznaka povijesno bila gol i vratiti tu stopu kao xG.
Tactiq koristi podatke o utakmicama na razini događaja iz licenciranih sportskih feedova u više od 1200 liga za izvor konteksta po udarcu za analizu. Specifični način na koji se xG signali kombiniraju s ostatkom onoga što proizvod promatra ostaje unutar aplikacije. Korisna poruka za čitatelja jest: sam xG je industrijski standard. Ono što alat radi s xG-om poslije je mjesto gdje se proizvodi razlikuju.
Zašto je xG važan
Liga-tablica rangira momčadi prema rezultatima. Kolona postignutih golova rangira ih prema realizaciji, što je bučno. xG vam daje treću leću: tko je generirao najviše kvalitete, neovisno o tome je li lopta ušla.
To je važno iz nekoliko razloga koji navijača stvarno zanimaju.
Razdvaja sreću od izvedbe. Napadač koji zabije pet u tri utakmice iz 1,8 kumulativnog xG-a realizira iznad svoje stope, i ta će se stopa obično vratiti prema normalnom. Napadač koji zabije nula iz 4,1 kumulativnog xG-a ima peh, i njegovi golovi obično će doći. Kroz dovoljno udaraca, xG i golovi konvergiraju. Kada se razdvoje, događa se nešto privremeno, ili herojska realizacija, ili frustrirajući promašaji, ili vratar koji ima mjesec karijere.
Nagrađuje proces umjesto ishoda. Strana koja stvori prilike vrijedne 2,5 xG i izgubi 0-1 od gola iz prekida često je bolja strana u 90 minuta. xG bilježi taj jaz na način na koji konačni rezultat ne može. Menadžeri koriste interne verzije ove ideje desetljećima. xG ju je učinio javnom.
Izbacuje na površinu temeljnu formu ispred rezultata. Momčad iz sredine tablice čija je xG razlika tiho poboljšavala kroz šest utakmica često je na korak od uspona na tablici, čak i ako bodovi još nisu sustigli. Strana iz gornje polovice čiji xG klizi dok dobivaju tijesne utakmice posuđuje protiv regresije koja obično stiže. Kroz kliznu seriju od četiri do osam utakmica, xG forma iskreniji je pokazatelj od sirovih rezultata.
Daje vam način za razgovor o kvaliteti udarca. Prije xG-a, "dobra prilika" i "loša prilika" bile su subjektivne. Dvoje ljudi moglo je gledati isti promašaj i ne slagati se oko toga je li trebao biti postignut. xG stavlja broj na to. Broj je nesavršen, ali je dosljedan kroz utakmice, lige i sezone.
Putuje kroz lige. Udarac od 0,30 xG u nizozemskoj Eredivisie prepoznatljiv je kao udarac od 0,30 xG u talijanskoj Serie A. Temeljna kvaliteta prilike ista je metrika, iako se taktički kontekst oko nje razlikuje. Ta prenosivost dio je razloga zašto je xG postao lingua franca moderne nogometne analize.
Gdje xG zavarava
Ovaj odjeljak je onaj koji većina objašnjenja xG-a izostavlja, i to je razlog zašto se xG tretira kao magija od strane ljudi koji bi trebali znati bolje. Iskrenost o slabim točkama metrike razlika je između dobrog korištenja xG-a i toga da vas zavara.
Mali uzorci lažu. Jedna utakmica gotovo nikada nije dovoljno xG podataka da se išta prosudi. Napadač može postići 1,4 xG protiv dubokog bloka koji mu pušta ulazak u kazneni prostor cijelu noć i postići 0,05 xG protiv visokog pressinga koji ga nikad ne pušta da se okrene. Oboje su informacije o tom konkretnom susretu, ne o sposobnosti napadača. Klizna serija od minimalno četiri do šest utakmica prije donošenja zaključaka je osnova. Sve manje od toga je anegdota s brojem pričvršćenim na nju.
Elitni realizatori sustavno nadmašuju xG. Neki igrači, kroz cijele karijere, postižu više golova nego što njihov xG sugerira. Messi, Salah, Haaland i mali klub ostalih imaju dovoljno volumena udaraca da njihova natpredstava nije samo šum. Prosječan xG model ne zna tko puca, samo odakle je došao udarac. To je značajka, ne bug, ali znači da sirovi xG podcjenjuje vrijednost elitnih napadača i precjenjuje vrijednost strijelaca volumena koji ne realiziraju.
Slabi realizatori sustavno podbacuju xG. Obrnuto je jednako istinito. Napadači koji kronično podbacuju xG kroz cijelu sezonu obično nemaju peh. Loše realiziraju. Tretiranje njihovog podbacaja kao nadolazeće regresije, kada obrazac karijere kaže drugačije, uobičajena je zamka.
Obrambene pogreške napuhuju xG. Vratarov propust koji se otkotrlja do nepokrivenog napadača šest metara van bilježi visoki xG, jer se udarac događa s visoko kvalitetne lokacije. xG model ne vidi obrambenu pogrešku koja je stvorila priliku. Kroz jednu utakmicu, momčad može postići impresivnu xG liniju uglavnom na leđima protivničkih pogrešaka, a to nije ponovljiva vještina.
Prekidi i jedanaesterci iskrivljuju glavni broj. Jedanaesterac vrijedi otprilike 0,76 xG svaki put. Momčad koja zaradi dva jedanaesterca u utakmici ima 1,5 xG ugrađeno prije nego što su uopće igrali nogomet. Analitičari koji mare za izvedbu u otvorenoj igri ponekad oduzimaju jedanaesterce i slobodne udarce od ukupnog broja. Javna tablica obično to ne radi.
Kup-finale, derbiji i odlučujuće utakmice za ispadanje lome model. xG je kalibriran prema ogromnoj povijesnoj bazi utakmica redovne sezone. Finala, lokalni derbiji i utakmice za opstanak u posljednjem kolu imaju drugačiju psihologiju, drugačije taktičke oblike, drugačije sudačke odluke i mnogo manje usporedivih uzoraka. Korištenje xG-a za čitanje ovih utakmica na isti način kao što biste čitali ligašku utakmicu iz sredine sezone je pogreška. Broj se i dalje izračunava. Povjerenje oko njega trebalo bi biti niže, a većina javnih nadzornih ploča to ne čini vidljivim.
Efekti stanja igre u kasnoj fazi iskrivljuju ukupni broj. Momčad koja juri gol u posljednjih dvadeset minuta stvara očajničke prilike koje nisu reprezentativne za njihovu pravu kvalitetu. Momčad koja čuva prednost 1-0 spušta se u oblik koji namjerno ustupa posjed i volumen udaraca. Sirovi xG cijele utakmice razmazuje ove faze zajedno. xG prilagođen stanju igre postoji, ali to nije ono što glavni rezultat prikazuje.
To je signal na razini momčadi krivo pročitan kao signal na razini igrača. "Igrač X ima 0,8 xG u ovoj utakmici" može značiti da je iskoristio jednu dobru priliku i promašio, ili šest polu-prilika i sve promašio. Oblik temeljne distribucije udaraca je važan, ne samo zbroj. Tretiranje kumulativnog xG-a kao izvještaja o igraču, bez gledanja učestalosti udaraca i raspona kvalitete, način je na koji navijači završavaju raspravljajući o brojevima koji opisuju različite stvari.
Pravilo koje proizlazi iz svega ovoga: xG je najkorisniji kao jedan ulaz u širu lekturu, uspoređen kroz prozor od nekoliko utakmica, s kvalitetom realizatora i kontekstom utakmice u glavi. Najmanje je koristan kao samostalna presuda o jednoj utakmici.
Kako Tactiq koristi xG u analizi
Tactiq tretira xG onako kako ga je ovaj članak upravo opisao: kao jedan dio temeljnih podataka o izvedbi, ne kao predviđanje samo po sebi.
Unutar analize utakmice, xG signali doprinose slici o tome tko se izvodio na kojoj razini tijekom nedavnih utakmica, koji igrači i momčadi natprosječno ili podprosječno realiziraju svoju kvalitetu i koliko je tijesan ili jednostran temeljni oblik susreta. xG forma stoji uz nekoliko drugih ulaza. Nijedan od njih ne tretira se kao odgovor.
Specifičan način na koji Tactiqova analiza miješa xG s ostatkom onoga što vidi, težine, klizni prozori, prilagodbe specifične za ligu, načini na koje se nestabilni signali označavaju, ostaje unutar proizvoda. To je namjeran dizajnerski izbor, ne skrivanja radi. Objavljena metodologija bude kopirana i krivo kalibrirana unutar tjedana; ono što stiže do korisnika je analiza kvalificirana povjerenjem s obrazloženjem objašnjenim jednostavnim jezikom, ne udžbenik.
Ono što korisnik vidi na kartici utakmice:
- Brojku očekivanih golova za svaku stranu, s pokazateljem nedavnog trenda tako da možete reći u kojem se smjeru broj kreće.
- Trojke vjerojatnosti za ishod, kvalificirane vidljivim pokazateljem povjerenja koji odražava koliko su stabilni temeljni signali za tu konkretnu utakmicu.
- Pisanu analizu koja imenuje xG kontekst jednostavnim jezikom: "Nedavni xG trend domaće strane povećao se tijekom posljednjih pet utakmica, uglavnom iz kvalitete prekida," a ne "naš model dodjeljuje težinu 0,37 vektoru značajki tri."
- Nikakve kvote kladionice nigdje. Bez poticaja za klađenje. Bez virtualne valute. Okvir je statistička analiza i takav ostaje.
Namjera je da navijač koji čita Tactiq karticu ode s oštrijim čitanjem utakmice, ne s brojem za kopirati negdje drugdje.
Kako čitati xG kao profesionalac
Šest navika razdvaja ljude koji dobro koriste xG od onih koji ga citiraju.
- Uvijek gledajte klizni prozor, ne jednu utakmicu. Četiri do osam utakmica po momčadi je osnova. Jedna utakmica je priča, ne obrazac.
- Uspoređujte xG razliku, ne sirovi xG. "Koliko je više kvalitete ova momčad generirala nego primila" obično je informativnije od ukupnog broja bilo koje strane.
- Oduzmite jedanaesterce i slobodne udarce kada vas zanima otvorena igra. Javni naslov često to ne čini. Oduzmite 0,76 za svaki jedanaesterac da vidite kako je izgledao oblik otvorene igre.
- Provjerite tko puca. Elitni realizator koji nadmašuje xG nije vijest. Rezervni napadač koji nadmašuje xG zastavica je koja govori "veličina uzorka."
- Čitajte xG uz povijest realizacije. Natpredstava za nekoliko utakmica može biti šum. Natpredstava kroz tri sezone je informacija.
- Tretirajte derbije, kup i finalne utakmice s oprezom. Smanjite svoje povjerenje u xG očitanje utakmica za koje model ima manje usporedivih utakmica. Broj se izračunava. Pojas oko njega širi je nego što vam nadzorna ploča govori.
Primijenjene zajedno, ove navike pretvaraju xG iz trivijalnog broja u leću. Leća je iskrena o tome što može vidjeti. To je cijela poanta.
Zaključak
xG je informirano predviđanje o kvaliteti prilike, ne presuda o utakmici. Korišten unutar prozora od nekoliko utakmica, čitan uz kvalitetu realizatora i kontekst utakmice, i očišćen od inflacije jedanaesteraca i prekida kada je pitanje otvorena igra, jedan je od najoštrijih alata koje navijač ima za razgovor o nogometu izvan konačnog rezultata.
Korišten kao proročište za jednu utakmicu, ili kao broj na ljestvici bez konteksta, ili kao zamjena za gledanje utakmice, zavarava. Metrika se nije promijenila. Čitanje jest.
Tactiq je izgrađen oko tog čitanja. Aplikacija iznosi xG u kontekstu, kvalificira ga s povjerenjem, objašnjava što broj znači jezikom koji navijač zapravo može koristiti i nikada ga ne miješa s kvotama kladionice ili poticajima za klađenje. Više od 1200 liga, lokalizacija na 32 jezika kroz sučelje i tekst analize, besplatna razina od osam analiza dnevno, bez kreditne kartice.
Ako vam je ovaj članak bio koristan, prirodan pratitelj je raniji vodič o tome kako AI predviđa nogometne utakmice. xG je jedna od četiri obitelji podataka koje taj članak detaljno prolazi, a dva članka zajedno čine temelj na kojem nastavljamo graditi ostatak bloga.