O que é xG? Gols esperados explicados para fãs de futebol
Toda conversa de futebol nos últimos cinco anos pegou as mesmas três letras. Comentaristas soltam xG casualmente entre replays. As linhas do tempo do Twitter postam placares de xG ao lado do placar real. Analistas se referem a gols esperados como gerações mais antigas se referiam à posse de bola, como se todo mundo já soubesse o que o número significa.
A maioria dos fãs não sabe, e isso vale a pena consertar. O xG é uma das maneiras mais úteis que temos de falar de futebol além do placar final, mas também uma das mais mal utilizadas. Tratado como oráculo, decepciona. Tratado como o que realmente é, uma pontuação de probabilidade para qualidade de chance, afia o jeito como você assiste ao jogo.
Este artigo faz duas coisas. Explica o que o xG mede em linguagem clara, sem exigir diploma de estatística. E é honesto sobre onde o xG engana, porque essa é a metade que a maior parte do conteúdo online pula. No fim, da próxima vez que você ver "xG: 1,4 a 2,8" debaixo de um 2-1, vai saber o que isso te diz e o que deliberadamente deixa de fora.
O que o xG é de verdade
Gols esperados, escritos xG, são uma pontuação de probabilidade ligada a uma única finalização. Respondem a uma pergunta: qual a probabilidade de esta chance exata, neste local exato, depois deste tipo de construção, terminar no fundo da rede? A resposta é um decimal entre 0 e 1.
Uma finalização de seis jardas com espaço e um cruzamento convidativo pode valer 0,65 xG. Aproximadamente duas em cada três dessas chances, em toda a amostra histórica, viram gol. Um chute especulativo de 30 jardas com dois defensores bloqueando o ângulo pode valer 0,03 xG. Três em cada cem. O número é uma média entre milhares de tentativas semelhantes, não uma previsão para este atacante específico neste dia específico.
Some cada chute de um jogo para um time e você tem o xG total do time na partida. Um placar de xG: 0,9 a 2,4 contra gols de 2-1 diz que o lado de 1 gol foi o melhor em criação de chances, e que o lado de 2 gols finalizou bem acima da sua taxa subjacente. Um placar de xG: 2,7 a 0,4 com gols de 0-0 diz que alguém mereceu ganhar e não ganhou, o padrão que todo fã reconhece de jogos que parecem injustos.
A métrica foi usada comercialmente pela primeira vez no início da década de 2010, mais visivelmente pela Opta, e desde então virou a maneira padrão de descrever qualidade de chance em todos os níveis do futebol profissional. Sua utilidade não é controversa. O seu mau uso, sim.
Como o xG é calculado, em linhas gerais
Modelos de xG não usam nenhuma entrada mágica. São treinados em bibliotecas enormes de finalizações históricas, geralmente centenas de milhares, cada uma marcada com um desfecho final (gol ou não) e uma lista de características contextuais. O modelo aprende quais características aumentam a taxa de conversão e quais a diminuem.
As características em que a maior parte dos modelos de xG se apoia são amplamente similares na indústria:
- Localização da finalização. Onde no campo a finalização aconteceu, medida como distância e ângulo até o gol. É o maior condutor isolado.
- Parte do corpo. Pé direito, pé esquerdo, cabeça ou outro. Cabeçadas do mesmo ponto que um chute de pé convertem em taxas muito diferentes.
- Tipo de assistência. Foi um lançamento, um cruzamento, um corte, uma bola parada, um rebote? Cada padrão de entrega produz sua própria taxa de conversão típica.
- Pressão defensiva. Quantos defensores havia entre a finalização e o gol, e quão perto estava o mais próximo. Chutes abertos convertem muito mais do que chutes fechados.
- Estado e fase do jogo. Jogo aberto, contra-ataque, bola parada, pênalti. Pênaltis em particular são tratados como xG quase constante de 0,76 a 0,78 na maioria dos modelos públicos.
Provedores diferentes usam conjuntos específicos diferentes de características. Alguns incluem dados de tracking, como posicionamento defensivo. Alguns dobram posicionamento inicial do goleiro. Poucos incluem características pré-chute como passes por posse. O que todos compartilham é a ideia subjacente: reduzir cada finalização a um pequeno conjunto de marcadores descritivos, consultar com que frequência essa combinação foi gol historicamente, e devolver essa taxa como xG.
O Tactiq usa dados de eventos a nível de partida vindos de feeds esportivos licenciados em mais de 1.200 ligas para obter o contexto por finalização que alimenta a análise. A forma específica como os sinais xG se combinam com o resto do que o produto olha fica dentro do aplicativo. O que é útil o leitor levar é: o xG em si é padrão da indústria. O que uma ferramenta faz com xG depois é onde os produtos se diferenciam.
Por que o xG importa
Uma tabela de classificação ordena times por resultados. Uma coluna de gols marcados os ordena por finalização, que é ruidosa. O xG te dá uma terceira lente: quem gerou mais qualidade, independentemente de a bola ter entrado.
Isso importa por várias razões que um fã de futebol de fato liga.
Separa sorte de desempenho. Um atacante que marca cinco em três jogos com 1,8 xG acumulados está finalizando acima da sua taxa, e essa taxa normalmente vai regredir. Um atacante que marca zero com 4,1 xG acumulados está com azar, e os gols costumam vir. Com chutes suficientes, xG e gols convergem. Quando divergem, algo temporário está acontecendo: finalização heróica, erros frustrantes, ou um goleiro em mês de carreira.
Premia processo sobre resultado. Um time que cria 2,5 xG de chances e perde por 0-1 para um gol de bola parada frequentemente foi o melhor lado nos 90 minutos. O xG captura essa lacuna de uma forma que o placar final não consegue. Técnicos usam versões internas dessa ideia há décadas. O xG a tornou pública.
Revela forma subjacente antes dos resultados. Um time de meio de tabela cujo diferencial xG melhorou silenciosamente em seis jogos costuma estar prestes a subir na tabela, mesmo que os pontos ainda não tenham alcançado. Um time da parte de cima cujo xG está escorregando enquanto continua vencendo jogos apertados está pegando emprestado contra uma regressão que costuma chegar. Ao longo de uma janela móvel de quatro a oito jogos, a forma xG é um indicador mais honesto do que os resultados brutos.
Dá um jeito de falar de qualidade de finalização. Antes do xG, "chance boa" e "chance ruim" eram subjetivas. Duas pessoas podiam assistir à mesma perdida e discordar se deveria ter entrado. O xG põe um número nisso. O número é imperfeito, mas é consistente entre jogos, ligas e temporadas.
Viaja entre ligas. Um chute de 0,30 xG na Eredivisie holandesa é reconhecível como um chute de 0,30 xG no Campeonato Italiano. A qualidade de chance subjacente é a mesma métrica, mesmo que o contexto tático ao redor difira. Essa portabilidade é parte do porquê de o xG ter virado a língua franca da análise futebolística moderna.
Onde o xG engana
Esta é a seção que a maioria das explicações de xG deixa de lado, e é a razão pela qual o xG é tratado como mágica por gente que deveria saber mais. Ser honesto sobre os pontos fracos da métrica é a diferença entre usar xG bem e ser enganado por ele.
Amostras pequenas mentem. Um jogo quase nunca é xG suficiente para julgar qualquer coisa. Um atacante pode somar 1,4 xG contra um bloco baixo que o deixa entrar na área a noite toda e somar 0,05 xG contra um pressing alto que nunca o deixa girar. Ambos são informação sobre aquele confronto específico, não sobre a habilidade do atacante. Pelo menos quatro a seis jogos antes de tirar conclusões é o básico. Menos que isso é anedota com um número grudado.
Finalizadores de elite superam o xG sistematicamente. Alguns jogadores, em carreiras inteiras, marcam mais gols do que seu xG sugere. Messi, Salah, Haaland e um clube pequeno de outros têm volume de finalização suficiente para que o seu sobredesempenho não seja só ruído. Um modelo médio de xG não sabe quem está finalizando, só de onde partiu o chute. É uma característica, não um defeito, mas significa que o xG bruto subestima o valor de atacantes de elite e superestima o valor de finalizadores de volume que não convertem.
Finalizadores fracos falham xG sistematicamente. O contrário é igualmente verdadeiro. Atacantes que têm desempenho cronicamente abaixo do xG durante toda uma temporada geralmente não estão com azar. Estão finalizando mal. Tratar esse subdesempenho como regressão iminente, quando o padrão de carreira diz o contrário, é uma armadilha comum.
Erros defensivos inflam o xG. Uma falha do goleiro que sobra para um atacante livre a seis jardas pontua alto em xG, porque o chute acontece a partir de um local de alta qualidade. O modelo xG não vê o erro defensivo que criou a chance. Num único jogo, um time pode registrar uma linha xG impressionante em grande parte a partir de erros do adversário, e isso não é uma habilidade repetível.
Bolas paradas e pênaltis distorcem o número-título. Um pênalti vale cerca de 0,76 xG sempre. Um time que ganha dois pênaltis num jogo já tem 1,5 xG embutidos antes de jogar futebol. Analistas que se importam com jogo aberto às vezes tiram pênaltis e faltas do total. O placar público geralmente não.
Finais de copa, clássicos e jogos decisivos quebram o modelo. O xG é calibrado contra a enorme base histórica de partidas de temporada regular. Finais, clássicos locais e jogos de último dia de sobrevivência têm psicologias, formas táticas, decisões de arbitragem e amostras comparáveis muito diferentes. Usar xG para ler esses jogos do mesmo jeito que você lê um de meio de temporada é um erro. O número ainda é calculado. A confiança ao redor dele deveria ser menor, e a maioria dos painéis públicos não deixa isso visível.
Efeitos de estado de jogo tardio retorcem o total. Um time correndo atrás de um gol nos últimos vinte minutos cria chances desesperadas que não representam sua real qualidade. Um time protegendo um 1-0 cai numa forma que deliberadamente cede posse e volume de finalizações. O xG bruto de 90 minutos mistura essas fases. xG ajustado por estado de jogo existe, mas não é o que o placar-título mostra.
É um sinal de time lido como sinal de jogador. "Jogador X tem 0,8 xG neste jogo" pode significar que ele teve uma chance boa e perdeu ou seis meias chances e perdeu todas. A forma da distribuição subjacente de finalizações importa, não só a soma. Tratar xG acumulado como boletim de jogador, sem olhar frequência e dispersão de qualidade de chute, é como fãs acabam discutindo sobre números que descrevem coisas diferentes.
A regra que sai de tudo isso: o xG é mais útil como uma entrada em uma leitura mais ampla, comparado numa janela de vários jogos, com a qualidade do finalizador e o contexto do jogo segurados na cabeça. É menos útil como veredito isolado sobre um único jogo.
Como o Tactiq usa xG na análise
O Tactiq trata o xG do jeito que este artigo acabou de descrever: como um pedaço de dado de desempenho subjacente, não como uma previsão por si só.
Dentro de uma análise de jogo, os sinais de xG contribuem para o quadro de quem vem rendendo em que nível nos últimos jogos, quais jogadores e times estão com desempenho acima ou abaixo da sua qualidade, e quão equilibrada ou desequilibrada é a forma subjacente de um confronto. A forma xG fica ao lado de várias outras entradas. Nenhuma é tratada como a resposta.
A maneira específica como a análise do Tactiq combina xG com o resto do que ela observa (os pesos, as janelas móveis, os ajustes específicos por liga, a forma como sinais instáveis são sinalizados) fica dentro do produto. É uma decisão de design deliberada, não evasiva. Metodologia publicada é copiada e descalibrada em semanas; o que chega ao usuário é uma análise qualificada por confiança, com o raciocínio explicado em linguagem simples, não um livro-texto.
O que o usuário vê no card do jogo:
- Um número de gols esperados para cada lado, com um indicador de tendência recente para você poder dizer para onde o número está indo.
- Triplas de probabilidade para o resultado, qualificadas por um indicador de confiança visível que reflete quão estáveis são os sinais subjacentes para aquele jogo específico.
- Uma análise escrita que nomeia o contexto xG em linguagem clara: "A tendência xG recente do mandante subiu nos últimos cinco jogos, principalmente por qualidade em bolas paradas," não "nosso modelo atribui peso 0,37 ao vetor de características três."
- Nenhuma cotação de casa de apostas em lugar nenhum. Nenhum prompt de aposta. Nenhuma moeda virtual. O enquadramento é análise estatística, e fica assim.
A intenção é que um fã lendo um card do Tactiq saia com uma leitura mais afiada do jogo, não com um número para copiar para outro lugar.
Como ler xG como um profissional
Seis hábitos separam quem usa xG bem de quem só cita.
- Sempre olhe para a janela móvel, não um único jogo. Quatro a oito jogos por time é o básico. Um jogo é anedota, não padrão.
- Compare diferencial de xG, não xG bruto. "Quanto mais qualidade este time gerou do que concedeu" costuma ser mais informativo do que o total de qualquer lado sozinho.
- Tire pênaltis e faltas quando o que interessa é o jogo aberto. O título público frequentemente não tira. Subtraia 0,76 de cada pênalti para ver a forma do jogo aberto.
- Confira quem está finalizando. Um finalizador de elite superando o xG não é novidade. Um atacante rotativo superando o xG é uma bandeira dizendo "tamanho de amostra."
- Leia o xG junto com o histórico de finalização. Sobredesempenho de alguns jogos pode ser ruído. Sobredesempenho de três temporadas é informação.
- Trate clássicos, copas e finais com cautela. Abaixe sua confiança na leitura xG de jogos para os quais o modelo tem menos partidas comparáveis. O número é calculado. A faixa ao redor é mais larga do que o painel diz.
Aplicados juntos, esses hábitos transformam o xG de um número de curiosidade em uma lente. A lente é honesta sobre o que consegue ver. É esse o ponto.
A conclusão
O xG é uma previsão informada (uma educated prediction) sobre qualidade de chance, não um veredito sobre um jogo. Usado dentro de uma janela de vários jogos, lido junto com a qualidade do finalizador e o contexto do jogo, e limpo da inflação de pênaltis e bolas paradas quando a pergunta é o jogo aberto, é uma das ferramentas mais afiadas que um fã tem para falar de futebol além do placar final.
Usado como oráculo de jogo único, ou como número de ranking sem contexto, ou como substituto para assistir ao jogo, engana. A métrica não mudou. Mudou a leitura.
O Tactiq é construído em torno dessa leitura. O aplicativo mostra xG em contexto, o qualifica com confiança, explica o que o número significa numa linguagem que um fã realmente pode usar, e nunca o mistura com cotações de casas de apostas ou prompts de aposta. Mais de 1.200 ligas, localização em 32 idiomas em toda a interface e no texto da análise, camada gratuita de oito análises por dia, sem cartão de crédito.
Se você achou este artigo útil, a peça companheira natural é o guia anterior sobre como a IA prevê jogos de futebol. O xG é uma das quatro famílias de dados que aquele artigo percorre em detalhe, e os dois juntos são a base sobre a qual continuamos construindo o resto do blog.