Vad är xG? Förväntade mål förklarat för fotbollsfans
Varje fotbollssamtal under de senaste fem åren har tagit upp samma tre bokstäver. Kommentatorer släpper xG vardagligt mellan repriser. Twitter-flöden postar xG-resultattavlor bredvid de riktiga. Analytiker hänvisar till förväntade mål på det sätt äldre generationer hänvisade till bollinnehav, som om alla redan vet vad siffran betyder.
De flesta fans gör det inte, och det är ett problem värt att lösa. xG är ett av de mest användbara sätten vi har att prata om fotboll bortom slutresultatet, men det är också ett av de mest missbrukade. Behandlat som ett orakel besviker det. Behandlat som det faktiskt är, ett sannolikhetspoäng för chanskvalitet, skärper det hur du ser matchen.
Den här artikeln gör två saker. Den förklarar vad xG mäter på enkelt språk, utan att en statistikexamen krävs. Och den är ärlig om var xG vilseleder, eftersom det är den halvan som mest innehåll online hoppar över. I slutet, nästa gång du ser "xG: 1,4 mot 2,8" under ett 2-1-resultat, kommer du att veta vad det berättar för dig och vad det medvetet utelämnar.
Vad xG faktiskt är
Förväntade mål, skrivet xG, är ett sannolikhetspoäng kopplat till ett enskilt skott. Det besvarar en fråga: hur sannolikt är det att exakt denna chans, på exakt denna plats, efter denna typ av uppbyggnad, hamnar i nätet? Svaret är en decimal mellan 0 och 1.
Ett skott från cirka sex meter med utrymme och ett inbjudande inlägg kan ha 0,65 xG. Ungefär två av var tredje sådan chans, genom hela det historiska underlaget, blir mål. Ett spekulativt skott från 27 meter med två försvarare som blockerar vinkeln kan ha 0,03 xG. Tre av varje hundra. Siffran är ett genomsnitt över tusentals liknande försök, inte en förutsägelse för just denne skytt just den dagen.
Lägg ihop varje skott i en match för ett lag, och du får det lagets totala xG för matchen. Ett resultat på xG: 0,9 mot 2,4 mot mål på 2-1 säger att laget med ett mål var det bättre laget sett till chansskapande, och laget med två mål avslutade långt över sin underliggande nivå. Ett resultat på xG: 2,7 mot 0,4 med mål på 0-0 säger att någon förtjänade att vinna och gjorde det inte, vilket är mönstret varje fan känner igen från matcher som känns orättvisa.
Mätetalet användes först kommersiellt i början av 2010-talet, mest synligt av Opta, och har sedan dess blivit standardsättet att beskriva chanskvalitet på alla nivåer av professionell fotboll. Dess användbarhet är inte kontroversiell. Dess missbruk är det.
Hur xG beräknas, i korthet
xG-modeller använder ingen enskild magisk indata. De tränas på enorma bibliotek av historiska skott, vanligtvis hundratusentals, var och en märkt med ett slutgiltigt utfall (mål eller inte) och en lista med kontextuella egenskaper. Modellen lär sig vilka egenskaper som flyttar konverteringsgraden upp och vilka som flyttar den ner.
Egenskaperna som de flesta xG-modeller förlitar sig på är i stort sett likartade i branschen:
- Skottets plats. Var på planen skottet togs, mätt som avstånd och vinkel till målet. Detta är den enskilt starkaste drivkraften.
- Kroppsdel. Höger fot, vänster fot, huvud eller annat. Nickningar från samma plats som ett fotskott konverteras i mycket olika takter.
- Assisttyp. Var det en genombrottspassning, ett inlägg, en cutback, en fast situation, en retur. Varje leveransmönster producerar sin egen typiska konvertering.
- Defensivt tryck. Hur många försvarare som fanns mellan skottet och målet, och hur nära den närmaste var. Öppna skott konverteras mycket oftare än stängda.
- Matchläge och fas. Öppet spel, snabb kontring, fast situation, straff. Straffar behandlas särskilt som nära konstant 0,76 till 0,78 xG i de flesta offentliga modeller.
Olika leverantörer använder olika specifika egenskaper. Vissa inkluderar trackingdata-egenskaper som försvarspositionering. Vissa inkluderar målvaktens utgångsposition. Några inkluderar uppbyggnadsegenskaper före skottet som passningar per bollinnehav. Vad de alla delar är den underliggande idén: reducera varje skott till en liten uppsättning beskrivande taggar, slå upp hur ofta den taggkombinationen historiskt har blivit mål, och returnera den graden som xG.
Tactiq använder matchdata på händelsenivå från licensierade sportfeeds över mer än 1200 ligor för att hämta kontext per skott för analysen. Det specifika sättet xG-signaler kombineras med resten av vad produkten tittar på stannar inne i appen. Den användbara slutsatsen för en läsare är: xG självt är branschstandard. Vad ett verktyg gör med xG efteråt är där produkter skiljer sig åt.
Varför xG spelar roll
En ligatabell rangordnar lag efter resultat. En gjorda mål-kolumn rangordnar dem efter avslut, vilket är brusigt. xG ger dig en tredje lins: vem genererade mest kvalitet, oberoende av om bollen gick in.
Det spelar roll av flera skäl som ett fotbollsfan faktiskt bryr sig om.
Det separerar tur från prestation. En anfallare som gör fem mål på tre matcher från 1,8 kumulativt xG avslutar över sin nivå, och den nivån kommer vanligtvis att regredera. En anfallare som gör noll mål på 4,1 kumulativt xG har otur, och hans mål kommer vanligtvis att komma. Över tillräckligt många skott konvergerar xG och mål. När de divergerar händer något tillfälligt, antingen hjälteavslut, frustrerande missar eller en målvakt som har en karriärmånad.
Det belönar process framför utfall. Ett lag som skapar 2,5 xG i chanser och förlorar 0-1 på ett mål från fast situation är ofta det bättre laget under de 90 minuterna. xG fångar den klyftan på ett sätt slutresultatet inte kan. Tränare har använt interna versioner av den här idén i årtionden. xG gjorde den offentlig.
Det visar underliggande form före resultat. Ett mittenlag vars xG-differens tyst har förbättrats över sex matcher är ofta på väg att klättra i tabellen, även om deras poäng inte kommit ikapp än. Ett lag i övre halvan vars xG glider medan de fortsätter vinna jämna matcher lånar mot en regression som vanligtvis anländer. Över ett rullande fönster på fyra till åtta matcher är xG-form en mer ärlig indikator än råa resultat.
Det ger dig ett sätt att prata om skottkvalitet. Före xG var "bra chans" och "dålig chans" subjektiva. Två personer kunde titta på samma miss och vara oeniga om det borde ha gjorts mål. xG sätter en siffra på det. Siffran är ofullständig, men den är konsekvent över matcher, ligor och säsonger.
Det färdas mellan ligor. Ett 0,30 xG-skott i holländska Eredivisie är igenkännligt som ett 0,30 xG-skott i italienska Serie A. Den underliggande chanskvaliteten är samma mätetal, även om det taktiska sammanhanget runt det skiljer sig. Den portabiliteten är en del av varför xG har blivit lingua franca för modern fotbollsanalys.
Var xG vilseleder
Det här avsnittet är det som de flesta xG-förklaringar utelämnar, och det är anledningen till att xG behandlas som magi av folk som borde veta bättre. Att vara ärlig om mätetalets svaga punkter är skillnaden mellan att använda xG väl och att luras av det.
Små urval ljuger. En match är nästan aldrig tillräckligt med xG-data för att döma något. En anfallare kan posta 1,4 xG mot ett djupt block som släpper in honom i straffområdet hela kvällen och posta 0,05 xG mot en hög press som aldrig låter honom vända. Båda är information om just den matchuppen, inte om anfallarens förmåga. Att rulla minst fyra till sex matcher innan slutsatser dras är baslinjen. Något mindre är anekdot med en siffra fäst.
Elitavslutare slår systematiskt xG. Vissa spelare, över hela karriärer, gör fler mål än deras xG antyder att de borde. Messi, Salah, Haaland och en liten klubb av andra har tillräcklig skottvolym för att deras överprestation inte bara är brus. En genomsnittlig xG-modell vet inte vem som skjuter, bara var skottet kom från. Det är en funktion, inte en bugg, men det betyder att rå xG underskattar värdet av elitanfallare och överskattar värdet av volymskyttar som inte avslutar.
Svaga avslutare missar systematiskt xG. Det omvända är lika sant. Anfallare som kroniskt underpresterar xG under en hel säsong har vanligtvis inte otur. De avslutar dåligt. Att behandla deras underprestation som nära förestående regression, när karriärmönstret säger annat, är en vanlig fälla.
Defensiva misstag blåser upp xG. En målvaktsmiss som rullar till en omarkerad anfallare sex meter ut ger högt xG, eftersom skottet sker från en högkvalitativ plats. xG-modellen ser inte det defensiva misstag som skapade chansen. Under en enskild match kan ett lag posta en imponerande xG-linje till stor del på grund av motståndarens misstag, och det är inte en repeterbar färdighet.
Fasta situationer och straffar förvränger huvudsiffran. En straff är värd ungefär 0,76 xG varje gång. Ett lag som tar två straffar i en match har 1,5 xG inbakat innan de ens spelat fotboll. Analytiker som bryr sig om öppet spel drar ibland bort straffar och frisparkar från totalen. Den offentliga resultattavlan gör vanligtvis inte det.
Cupfinaler, derbyn och nedflyttningsavgöranden bryter modellen. xG är kalibrerat mot den enorma historiska basen av matcher i reguljär säsong. Finaler, lokala derbyn och sistadagsöverlevnadsmatcher har olika psykologi, olika taktiska former, olika domslut och mycket mindre jämförbara urval. Att använda xG för att läsa dessa matcher på samma sätt som du skulle läsa en ligamatch mitt i säsongen är ett misstag. Siffran beräknas fortfarande. Förtroendet kring den bör vara lägre, och de flesta offentliga instrumentpaneler gör det inte synligt.
Senmatchslägeseffekter vrider totalen. Ett lag som jagar ett mål i de sista tjugo minuterna skapar desperationschanser som inte är representativa för deras verkliga kvalitet. Ett lag som skyddar en 1-0-ledning går ner i en form som medvetet ger upp bollinnehav och skottvolym. Rå matchlång xG smetar ut dessa faser tillsammans. Matchlägesjusterad xG finns, men det är inte vad huvudresultattavlan visar.
Det är en signal på lagnivå som felläses som en signal på spelarnivå. "Spelare X har 0,8 xG den här matchen" kan betyda att han tog en bra chans och missade eller sex halvchanser och missade dem alla. Formen på den underliggande skottfördelningen spelar roll, inte bara summan. Att behandla kumulativ xG som ett spelarbetyg, utan att titta på skottfrekvens och kvalitetsspridning, är hur fans slutar bråka om siffror som beskriver olika saker.
Regeln som faller ut av allt detta: xG är mest användbart som en indata i en bredare läsning, jämfört över ett fönster på flera matcher, med avslutarkvalitet och matchkontext i huvudet. Det är minst användbart som en fristående dom om en enskild match.
Hur Tactiq använder xG i analysen
Tactiq behandlar xG på det sätt den här artikeln just har beskrivit det: som en del av underliggande prestationsdata, inte som en förutsägelse i sig självt.
Inne i en matchanalys bidrar xG-signaler till bilden av vem som presterat på vilken nivå under de senaste matcherna, vilka spelare och lag som över- eller underpresterar sin kvalitet, och hur jämn eller ensidig den underliggande formen av en matchning är. xG-form sitter bredvid flera andra indata. Ingen av dem behandlas som svaret.
Det specifika sättet Tactiqs analys blandar xG med resten av vad den ser, vikterna, de rullande fönstren, de ligaspecifika justeringarna, sätten instabila signaler flaggas på, stannar inne i produkten. Det är ett medvetet designval, inte ett undvikande. Publicerad metodik kopieras och felkalibreras inom veckor; det som når användaren är en förtroendekvalificerad analys med resonemanget förklarat på enkelt språk, inte en lärobok.
Vad användaren ser på matchkortet:
- En siffra för förväntade mål för varje sida, med en indikator för senaste trend så du kan säga åt vilket håll siffran rör sig.
- Sannolikhetstripletter för utfallet, kvalificerade av en synlig förtroendeindikator som reflekterar hur stabila de underliggande signalerna är för just denna match.
- En skriven analys som namnger xG-kontexten på enkelt språk: "Hemmalagets senaste xG-trend har lyfts under deras senaste fem matcher, mest från kvalitet i fasta situationer," inte "vår modell tilldelar vikt 0,37 till egenskapsvektor tre."
- Inga bookmakerodds någonstans. Inga spelpåminnelser. Ingen virtuell valuta. Ramen är statistisk analys och den förblir så.
Avsikten är att ett fan som läser ett Tactiq-kort går därifrån med en skarpare läsning av matchen, inte en siffra att kopiera någon annanstans.
Hur man läser xG som ett proffs
Sex vanor skiljer människor som använder xG väl från människor som citerar det.
- Titta alltid på det rullande fönstret, inte en match. Fyra till åtta matcher per lag är baslinjen. En match är en berättelse, inte ett mönster.
- Jämför xG-differens, inte rå xG. "Hur mycket mer kvalitet detta lag genererade än de släppte in" är vanligtvis mer informativt än endera sidans totalsumma ensam.
- Dra bort straffar och frisparkar när du bryr dig om öppet spel. Den offentliga rubriken gör det ofta inte. Subtrahera 0,76 för varje straff för att se hur formen i öppet spel såg ut.
- Kolla vem som skjuter. En elitavslutare som överpresterar xG är inte nyhet. En rotationsforward som överpresterar xG är en flagga som säger "urvalsstorlek."
- Läs xG tillsammans med avslutshistorik. Överprestation för några matcher kan vara brus. Överprestation för tre säsonger är information.
- Behandla derbyn, cup- och finalmatcher med försiktighet. Sänk ditt förtroende för xG-läsningen på matcher som modellen har färre jämförbara matcher för. Siffran beräknas. Bandet runt den är bredare än instrumentpanelen berättar för dig.
Tillämpade tillsammans förvandlar dessa vanor xG från en triviasiffra till en lins. Linsen är ärlig om vad den kan se. Det är hela poängen.
Slutsatsen
xG är en underbyggd förutsägelse om chanskvalitet, inte en dom om en match. Använd inom ett fönster av flera matcher, läst tillsammans med avslutarkvalitet och matchkontext, och befriad från straff- och fastsituationsinflation när öppet spel är frågan, är det ett av de skarpaste verktygen ett fan har för att prata om fotboll bortom slutresultatet.
Använt som ett enskilt matchorakel, eller som en topplistesiffra utan kontext, eller som en ersättning för att titta på matchen, vilseleder det. Mätetalet förändrades inte. Läsningen gjorde det.
Tactiq är byggt runt den läsningen. Appen lyfter fram xG i kontext, kvalificerar det med förtroende, förklarar vad siffran betyder på ett språk ett fan faktiskt kan använda, och blandar det aldrig med bookmakerodds eller spelpåminnelser. Mer än 1200 ligor, 32-språksöversättning över gränssnittet och analystexten, gratisnivå på åtta analyser per dag, inget kreditkort krävs.
Om du tyckte att den här artikeln var användbar är den naturliga följeslagaren den tidigare guiden om hur AI förutsäger fotbollsmatcher. xG är en av fyra datafamiljer som det stycket går igenom i detalj, och de två artiklarna tillsammans är grunden vi fortsätter bygga resten av bloggen på.