Ce este xG? Golurile așteptate explicate fanilor de fotbal
Fiecare conversație despre fotbal din ultimii cinci ani a preluat aceleași trei litere. Comentatorii rostesc xG casual între reluări. Timeline-urile de pe Twitter postează tabele xG alături de cele reale. Analiștii se referă la golurile așteptate așa cum generațiile mai vechi se refereau la procentele de posesie, ca și cum toată lumea ar ști deja ce înseamnă numărul.
Majoritatea fanilor nu știu, iar asta este o problemă pe care merită să o rezolvăm. xG este una dintre cele mai utile modalități pe care le avem de a vorbi despre fotbal dincolo de scorul final, dar este și una dintre cele mai greșit folosite. Tratat ca un oracol, dezamăgește. Tratat drept ceea ce este de fapt, un scor de probabilitate pentru calitatea ocaziei, ascute modul în care urmărești jocul.
Acest articol face două lucruri. Explică ce măsoară xG într-un limbaj simplu, fără a fi necesară o diplomă în statistică. Și este sincer despre unde induce xG în eroare, pentru că aceasta este jumătatea pe care majoritatea conținutului online o sare. La final, data viitoare când vezi „xG: 1,4 la 2,8” sub un rezultat de 2-1, vei ști ce îți spune și ce lasă deoparte intenționat.
Ce este xG de fapt
Golurile așteptate, scrise xG, este un scor de probabilitate atașat unui singur șut. Răspunde la o singură întrebare: cât de probabil este ca această ocazie exactă, din acest loc exact, după acest tip de construcție, să se termine în plasă? Răspunsul este un număr zecimal între 0 și 1.
Un șut luat de la șase metri cu spațiu și o centrare invitantă ar putea puncta 0,65 xG. Aproximativ două din trei astfel de ocazii, pe întregul eșantion istoric, devin goluri. O lovitură speculativă de la 27 de metri cu doi fundași blocând unghiul ar putea puncta 0,03 xG. Trei din o sută. Numărul este o medie a mii de încercări similare, nu o predicție pentru acest șutator specific în această zi specifică.
Adună fiecare șut dintr-un meci pentru o echipă și obții xG-ul total al echipei pentru meci. Un scor xG 0,9 – 2,4 față de goluri 2-1 îți spune că echipa care a marcat 1 gol a fost cea mai bună la creare de ocazii, iar echipa cu 2 goluri a finalizat mult peste rata lor de fond. Un scor xG 2,7 – 0,4 cu goluri 0-0 îți spune că cineva merita să câștige și nu a făcut-o, iar acesta este tiparul pe care fiecare fan îl recunoaște din meciurile care par nedrepte.
Indicatorul a fost folosit comercial pentru prima dată la începutul anilor 2010, cel mai vizibil de Opta, și de atunci a devenit modul implicit de a descrie calitatea ocaziei la fiecare nivel al fotbalului profesionist. Utilitatea sa nu este controversată. Utilizarea greșită este.
Cum se calculează xG, pe scurt
Modelele xG nu folosesc o singură intrare magică. Sunt antrenate pe biblioteci enorme de șuturi istorice, de obicei sute de mii dintre ele, fiecare etichetat cu un rezultat final (gol sau nu) și o listă de caracteristici contextuale. Modelul învață ce caracteristici împing rata de conversie în sus și ce caracteristici o împing în jos.
Caracteristicile pe care se bazează majoritatea modelelor xG sunt în mare parte similare în industrie:
- Locația șutului. Unde pe teren s-a tras șutul, măsurat ca distanță și unghi față de poartă. Acesta este cel mai puternic factor unic.
- Partea corpului. Piciorul drept, piciorul stâng, capul sau altceva. Loviturile de cap din același loc ca un șut cu piciorul se convertesc la rate foarte diferite.
- Tipul pasei. A fost pasă în adâncime, centrare, pasă înapoi, fază fixă, respingere. Fiecare tipar de livrare produce propria conversie tipică.
- Presiunea defensivă. Câți fundași erau între șut și poartă și cât de aproape era cel mai apropiat. Șuturile libere se convertesc mult mai des decât cele închise.
- Starea și faza jocului. Joc deschis, contraatac rapid, fază fixă, penalty. Penalty-urile în special sunt tratate ca o valoare aproape constantă de 0,76 – 0,78 xG în majoritatea modelelor publice.
Furnizorii diferiți folosesc seturi specifice de caracteristici diferite. Unii includ caracteristici din date de urmărire, cum ar fi pozițiile fundașilor. Unii includ poziția de start a portarului. Câțiva includ caracteristici de construcție pre-șut, cum ar fi pasele per posesie. Ceea ce au toate în comun este ideea de fond: reducă fiecare șut la un set mic de etichete descriptive, caută cât de des a fost istoric gol acea combinație de etichete și returnă acea rată ca xG.
Tactiq folosește date de meci la nivel de eveniment din fluxuri sportive licențiate în peste 1.200 de ligi pentru a obține contextul pe fiecare șut pentru analiză. Modul specific în care semnalele xG se combină cu restul lucrurilor pe care produsul le analizează rămâne în interiorul aplicației. Concluzia utilă pentru un cititor este: xG în sine este standard industrial. Ce face un instrument cu xG după aceea este locul unde diferă produsele.
De ce contează xG
Un clasament al ligii ierarhizează echipele după rezultate. O coloană de goluri marcate le ierarhizează după finalizare, care este zgomotoasă. xG îți oferă o a treia lentilă: cine a generat cea mai mare calitate, independent de faptul că mingea a intrat sau nu.
Asta contează din mai multe motive care îi pasă cu adevărat unui fan de fotbal.
Separă norocul de performanță. Un atacant care marchează cinci în trei meciuri din 1,8 xG cumulat finalizează peste rata sa, iar acea rată de obicei va regresa. Un atacant care marchează zero din 4,1 xG cumulat este ghinionist, iar golurile sale vor veni de obicei. Pe suficiente șuturi, xG și golurile converg. Când diverg, se întâmplă ceva temporar, fie finalizare eroică, fie ratări frustrante, fie un portar care are o lună de carieră.
Recompensează procesul în locul rezultatului. O echipă care creează ocazii în valoare de 2,5 xG și pierde 0-1 dintr-un gol din fază fixă este adesea echipa mai bună pe parcursul celor 90 de minute. xG surprinde acel decalaj într-un mod în care scorul final nu poate. Antrenorii au folosit versiuni interne ale acestei idei de decenii. xG a făcut-o publică.
Aduce la suprafață forma de fond înaintea rezultatelor. O echipă de mijloc de clasament a cărei diferență de xG s-a îmbunătățit în liniște pe parcursul a șase meciuri este adesea pe punctul de a urca în clasament, chiar dacă punctele nu au prins-o încă din urmă. O echipă din jumătatea superioară al cărei xG alunecă în timp ce continuă să câștige meciuri strânse împrumută împotriva unei regresii care de obicei sosește. Pe o fereastră mobilă de patru până la opt meciuri, forma xG este un indicator mai sincer decât rezultatele brute.
Îți oferă un mod de a vorbi despre calitatea șutului. Înainte de xG, „ocazie bună” și „ocazie proastă” erau subiective. Două persoane puteau urmări aceeași ratare și nu puteau fi de acord dacă ar fi trebuit să fie marcată. xG pune un număr pe ea. Numărul este imperfect, dar este consecvent între meciuri, ligi și sezoane.
Călătorește între ligi. Un șut de 0,30 xG în Eredivisie olandeză este recunoscut ca un șut de 0,30 xG în Serie A italiană. Calitatea de fond a ocaziei este același indicator, chiar dacă contextul tactic din jur diferă. Acea portabilitate este parte din motivul pentru care xG a devenit lingua franca a analizei moderne de fotbal.
Unde induce xG în eroare
Această secțiune este cea pe care majoritatea explicatorilor xG o omit, și este motivul pentru care xG este tratat ca magie de oameni care ar trebui să știe mai bine. A fi sincer despre punctele slabe ale indicatorului este diferența între a folosi xG bine și a fi păcălit de el.
Eșantioanele mici mint. Un meci este aproape niciodată suficiente date xG pentru a judeca ceva. Un atacant poate posta 1,4 xG împotriva unui bloc adânc care îl lasă în careu toată noaptea și poate posta 0,05 xG împotriva unui presing înalt care nu îl lasă să se întoarcă. Ambele sunt informații despre acea confruntare specifică, nu despre capacitatea atacantului. Rularea a cel puțin patru-șase meciuri înainte de a trage concluzii este baza. Orice mai puțin este anecdotă cu un număr atașat.
Finalizatorii de elită depășesc sistematic xG. Unii jucători, pe parcursul unei cariere întregi, marchează mai multe goluri decât sugerează xG-ul lor că ar trebui. Messi, Salah, Haaland și un mic club al altora au suficient volum de șuturi încât supraperformanța lor să nu fie doar zgomot. Un model xG mediu nu știe cine trage, doar de unde a venit șutul. Acesta este o caracteristică, nu un bug, dar înseamnă că xG brut subestimează valoarea atacanților de elită și supraestimează valoarea șutătorilor de volum care nu finalizează.
Finalizatorii slabi ratează sistematic xG. Inversul este la fel de adevărat. Atacanții care subperformează cronic xG pe parcursul unui sezon întreg nu sunt de obicei ghinioniști. Finalizează prost. A trata subperformanța lor ca regresie iminentă, când tiparul de carieră spune altceva, este o capcană comună.
Erorile defensive umflă xG. O bâlbâială a portarului care se rostogolește la un atacant nemarcat la șase metri punctează xG ridicat, pentru că șutul se întâmplă dintr-un loc de înaltă calitate. Modelul xG nu vede greșeala defensivă care a creat ocazia. Într-un singur meci, o echipă poate posta o linie xG impresionantă în mare parte pe seama greșelilor adversarului, iar asta nu este o abilitate repetabilă.
Fazele fixe și penalty-urile distorsionează numărul de titlu. Un penalty valorează aproximativ 0,76 xG de fiecare dată. O echipă care obține două penalty-uri într-un meci are 1,5 xG integrați înainte să fi jucat fotbal. Analiștii care țin la performanța din joc deschis uneori scot penalty-urile și loviturile libere din total. Tabela publică de obicei nu.
Finalele de cupă, derby-urile și meciurile de decizie de retrogradare rup modelul. xG este calibrat față de baza istorică uriașă a meciurilor de sezon regulat. Finalele, derby-urile locale și meciurile de supraviețuire din ultima zi au psihologii diferite, forme tactice diferite, decizii de arbitraj diferite și eșantioane comparabile mult mai mici. A folosi xG pentru a citi aceste meciuri în același mod în care ai citi un meci de ligă de mijloc de sezon este o greșeală. Numărul încă se calculează. Încrederea din jurul său ar trebui să fie mai mică, iar majoritatea tablourilor de bord publice nu fac asta vizibil.
Efectele de stare de final de meci răsucesc totalul. O echipă care urmărește un gol în ultimele douăzeci de minute creează ocazii de disperare care nu sunt reprezentative pentru adevărata sa calitate. O echipă care protejează un avantaj de 1-0 intră într-o formă care cedează în mod deliberat posesia și volumul de șuturi. xG brut pe meci întreg amestecă aceste faze. xG ajustat la starea jocului există, dar nu este ce afișează tabela de titlu.
Este un semnal la nivel de echipă interpretat greșit ca semnal la nivel de jucător. „Jucătorul X are 0,8 xG în acest meci” poate însemna că a luat o ocazie bună și a ratat sau șase jumătăți de ocazie și le-a ratat pe toate. Forma distribuției de fond a șuturilor contează, nu doar suma. A trata xG-ul cumulat ca un carnet de note al jucătorului, fără a te uita la frecvența și răspândirea calității șutului, este modul în care fanii ajung să se certe pe numere care descriu lucruri diferite.
Regula care reiese din toate acestea: xG este cel mai util ca o intrare într-o citire mai largă, comparată pe o fereastră de mai multe meciuri, cu calitatea finalizatorului și contextul meciului ținute în cap. Este cel mai puțin util ca verdict de sine stătător asupra unui singur meci.
Cum folosește Tactiq xG în analiză
Tactiq tratează xG așa cum tocmai l-a descris acest articol: ca o piesă de date de performanță de fond, nu ca o predicție de sine stătătoare.
În cadrul unei analize de meci, semnalele xG contribuie la imaginea cine a performat la ce nivel în meciurile recente, ce jucători și echipe supra- sau subperformează calitatea lor și cât de strânsă sau unilaterală este forma de fond a unei confruntări. Forma xG stă alături de mai multe alte intrări. Niciuna nu este tratată ca răspunsul.
Modul specific în care analiza Tactiq amestecă xG cu restul lucrurilor pe care le vede, ponderile, ferestrele mobile, ajustările specifice ligii, modurile în care semnalele instabile sunt marcate, rămâne în interiorul produsului. Aceasta este o alegere deliberată de design, nu una evazivă. Metodologia publicată este copiată și calibrată greșit în câteva săptămâni; ce ajunge la utilizator este o analiză calificată cu încredere, cu raționamentul explicat în limbaj simplu, nu un manual.
Ce vede utilizatorul pe fișa meciului:
- O cifră a golurilor așteptate pentru fiecare parte, cu un indicator de tendință recentă, astfel încât să poți spune în ce direcție se mișcă numărul.
- Triplete de probabilitate pentru rezultat, calificate de un indicator vizibil de încredere care reflectă cât de stabile sunt semnalele de fond pentru acest meci specific.
- O analiză scrisă care denumește contextul xG în limbaj simplu: „Tendința xG recentă a gazdelor s-a ridicat în ultimele cinci meciuri, mai ales din calitatea fazelor fixe”, nu „modelul nostru atribuie ponderea 0,37 vectorului de caracteristici trei”.
- Nicio cotă de casă de pariuri nicăieri. Niciun îndemn la pariere. Nicio valută virtuală. Cadrul este analiză statistică și rămâne așa.
Intenția este ca un fan care citește o fișă Tactiq să plece cu o citire mai ascuțită a meciului, nu cu un număr de copiat altundeva.
Cum să citești xG ca un profesionist
Șase obiceiuri separă oamenii care folosesc xG bine de cei care îl citează.
- Uită-te întotdeauna la fereastra mobilă, nu la un meci. Patru până la opt meciuri per echipă este baza. Un meci este o poveste, nu un tipar.
- Compară diferența de xG, nu xG brut. „Câtă calitate mai mult a generat această echipă decât a concedat” este de obicei mai informativ decât totalul fiecărei părți singur.
- Scoate penalty-urile și loviturile libere când îți pasă de jocul deschis. Titlul public adesea nu o face. Scade 0,76 pentru fiecare penalty pentru a vedea cum arăta forma jocului deschis.
- Verifică cine trage. Un finalizator de elită care supraperformează xG nu este știre. Un atacant de rotație care supraperformează xG este un semnal care spune „mărime de eșantion”.
- Citește xG alături de istoricul finalizărilor. Supraperformanța pentru câteva meciuri poate fi zgomot. Supraperformanța pentru trei sezoane este informație.
- Tratează derby-urile, cupele și finalele cu prudență. Scade încrederea în citirea xG pe meciurile pentru care modelul are mai puține meciuri comparabile. Numărul se calculează. Banda din jur este mai largă decât îți spune tabloul de bord.
Aplicate împreună, aceste obiceiuri transformă xG dintr-un număr de trivia într-o lentilă. Lentila este sinceră despre ce poate vedea. Acesta este tot ideea.
Concluzia
xG este o predicție informată despre calitatea ocaziei, nu un verdict asupra unui meci. Folosit într-o fereastră de mai multe meciuri, citit alături de calitatea finalizatorului și contextul meciului, și dezbrăcat de inflația de penalty și fază fixă când jocul deschis este întrebarea, este unul dintre cele mai ascuțite instrumente pe care le are un fan pentru a vorbi despre fotbal dincolo de scorul final.
Folosit ca oracol pe un singur meci, sau ca număr de clasament fără context, sau ca substitut pentru urmărirea meciului, induce în eroare. Indicatorul nu s-a schimbat. Citirea da.
Tactiq este construit în jurul acelei citiri. Aplicația aduce xG în context, îl califică cu încredere, explică ce înseamnă numărul într-un limbaj pe care un fan îl poate folosi efectiv, și nu îl amestecă niciodată cu cote de case de pariuri sau îndemnuri la pariere. Peste 1.200 de ligi, localizare în 32 de limbi în interfață și textul de analiză, nivel gratuit de opt analize pe zi, fără card de credit necesar.
Dacă ai găsit acest articol util, piesa de companie naturală este ghidul anterior despre cum prezice AI meciurile de fotbal. xG este una dintre cele patru familii de date pe care acel articol le parcurge în detaliu, iar cele două articole împreună sunt fundația pe care continuăm să construim restul blogului.