Что такое npxG? Ожидаемые голы без пенальти, объяснение
Откройте любую современную футбольную аналитическую панель, и рядом с именем нападающего увидите две колонки. Одна, xG. Другая, npxG. Числа отличаются, иногда сильно. У нападающего Премьер-лиги с 18 xG в этом сезоне может быть 14,5 npxG, а разрыв в 3,5 гола целиком идёт из распределения пенальти его клуба. Если читать колонку xG, не понимая, на какую именно смотришь, читаешь историю с тихо вшитой пенальтийной премией.
Эта статья проходит через то, что такое npxG, почему вычитание пенальти из xG обычно честный ход и какие ловушки ждут тех, кто делает переход, не думая о том, что ещё не было очищено. К концу, в следующий раз, когда кто-то упомянёт какую-то статистику xG, вы будете знать, заголовочная это версия или та, что действительно описывает качество открытой игры.
Что такое npxG на самом деле
Ожидаемые голы без пенальти, это xG с удалёнными ударами с пенальти. И всё. Это не отдельная метрика, обученная иначе; это сырой xG с вычтенным подмножеством ударов с одиннадцатиметровой отметки.
Механический расчёт:
- Суммируйте xG каждого удара в интересующем вас окне (матч, сезон, карьера).
- Вычтите xG каждого пенальти из этой суммы.
Остаётся npxG. xG пенальти близок к константе у всех провайдеров, обычно в диапазоне от 0,76 до 0,78. Точное значение зависит от того, к какой исторической выборке калибруется провайдер, но колебание достаточно мало, чтобы думать о пенальти как примерно о трёх четвертях гола, ожидающего случиться.
Причина, по которой npxG существует как отдельная колонка, в том, что возможности для пенальти распределяются между игроками и командами способами, не отражающими общее атакующее качество. Команда, зарабатывающая много фолов в штрафной, будет генерировать больше пенальти независимо от того, насколько хорошо она пасует или завершает в открытой игре. Нападающий, назначенный исполнителем пенальти, набирает xG, который его партнёр по команде не набрал бы, даже если бы они делили нагрузку в открытой игре поровну. Уберите пенальти, и оба эффекта исчезнут.
Остаётся число, которое люди действительно хотят, когда спрашивают: «насколько хороши эта команда или этот игрок в открытой игре?»
Почему разрыв важен
Несколько реальных закономерностей делают разницу наглядной.
Раздувание у исполнителя пенальти. Нападающий, бьющий все пенальти за команду, зарабатывающую 9 пенальти за сезон, начинает с 9 × 0,76 = 6,84 xG, прежде чем будут подсчитаны его удары в открытой игре. Если у этого нападающего сезон с 15 xG, его npxG, 8,16. Честное прочтение качества его игры в открытой фазе, 8,16, а не 15. Сравните его с нападающим команды, реже зарабатывающей пенальти, который тоже набрал 8,0 xG при нулевом участии в пенальти, и вы сравниваете подобное с подобным.
Разница xG у команды. Две команды могут иметь похожие сезонные линии xG, будучи разными в открытой игре. Команда A: 55 xG при 8 заработанных пенальти (6,1 xG от пенальти, 48,9 npxG). Команда B: 52 xG при 1 заработанном пенальти (0,76 xG от пенальти, 51,24 npxG). Заголовок ставит команду A впереди. По созданию моментов в открытой игре впереди команда B.
Сравнение между лигами. Судейские тенденции по назначению пенальти различаются в лигах. Ла Лига исторически назначала больше пенальти за матч, чем Премьер-лига. Сырой xG команды Ла Лиги выигрывает от этого; её npxG, нет. Межлиговые сравнения xG без корректировки на npxG могут ввести в заблуждение достаточно, чтобы изменить вывод.
Ранний сезон, малая выборка. На малых выборках один пенальти резко сдвигает перцентиль xG у нападающего. У игрока с 2,3 xG за пять матчей и одним реализованным пенальти 1,54 npxG. После вычета его базовая скорость выглядит куда скромнее. Именно поэтому скаутские отчёты, сравнивающие ранние отрезки сезона, почти всегда работают в npxG, когда вопрос серьёзный.
Закономерность во всех этих случаях одна. Сырой xG отвечает: «каким было качество всего, что эта команда или игрок пробили?» npxG отвечает: «каким было качество всего, что эта команда или игрок сделали, чтобы создать моменты в живой игре?» Второй вопрос обычно полезнее.
Как обычно рассчитывают npxG
Все публичные модели xG выдают xG на удар с флагом, обозначающим пенальти. Построить npxG тривиально, когда есть поударные данные: отфильтровать строки с is_penalty = true и просуммировать остаток.
Два небольших дизайн-решения различаются у провайдеров:
Обработка нереализованных пенальти. Некоторые модели сохраняют значение xG пенальти в кумулятивном xG игрока, даже если удар не попал (аргумент: удар существовал и нёс высокое качество, поэтому должен считаться в xG). Другие, убирают. Первый подход означает, что у игрока, промахивающегося с пенальти, разрыв «недобрал по xG» выглядит больше, чем у того, кто их реализует. Если вы читаете сезонный npxG игрока, чтобы судить о его реализации, проверьте, какую конвенцию использует провайдер. Более защитимый выбор, считать нанесённые пенальти в сыром xG, но не в npxG независимо от исхода, потому что npxG явно о работе в открытой игре.
Добивания после нереализованных пенальти. Отбитый пенальти, после которого мяч отскакивает к партнёру и тот забивает: получает ли удар-добивание полный xG, которого заслуживает? Большинство провайдеров обрабатывают его как обычный удар из открытой игры с его позиции и присваивают xG по контексту удара. Это верно. Но некоторые более простые модели объединяют добивание в последовательность пенальти и обрабатывают иначе. Для пользователей современных потоков данных это несущественно; для читающих старые исторические данные, стоит знать.
Tactiq читает событийные данные матчей из лицензированных спортивных фидов, охватывающих более 1200 турниров. Поударные данные включают флаг пенальти, что позволяет чисто вычислять и сырой xG, и npxG для анализа матча. То, как эти два сигнала сочетаются с остальным, что смотрит продукт, остаётся внутри приложения.
Где npxG всё ещё вводит в заблуждение
Переход с xG на npxG, это очистка, а не лекарство. Другие слабости сырой метрики остаются, и появляется несколько новых.
Стандарты, кроме пенальти, всё ещё искажают. npxG убирает пенальти и оставляет угловые, прямые штрафные, непрямые штрафные, розыгрыши от аута. Для команды, построенной на мастерстве стандартов, npxG всё равно учитывает эту ценность. Если хотите «xG открытой игры» в строгом смысле, нужно убрать все удары со стандартов, а не только пенальти. Некоторые провайдеры отдельно публикуют колонку «xG открытой игры». npxG, это на полпути, но не вся дорога.
Контекст заработанных пенальти теряется. Нападающий, элитно зарабатывающий пенальти умным движением и работой корпусом, приносит команде реальную ценность. Этот вклад исчезает в npxG, потому что событие заработанного пенальти порождает удар с пенальти, нанесённый кем-то, а не удар, нанесённый заработавшим в живой игре. npxG заработавшего читается ниже его реальной атакующей пользы. Сравнивать двух нападающих только по npxG, где один вынуждает фолы, а другой нет, недооценивает первого.
Эффекты назначенного исполнителя. npxG, это число на уровне игрока, и заработавший пенальти часто не является его исполнителем. Вычет пенальти из xG исполнителя не добавляет его обратно на счёт заработавшего. Если вы пытаетесь оценить, какой форвард действительно продуктивнее для команды, эффект исполнителя занижает ценность заработавшего в npxG так же, как сырой xG завышает ценность исполнителя.
Непоследовательность обработки нереализованных пенальти. Как отмечено в FAQ, провайдеры различаются в том, остаётся ли xG нереализованного пенальти в итоге игрока. Сравнение двух игроков у провайдеров, обрабатывающих это по-разному, даёт выводы «яблоки и апельсины».
Заголовочное число всё ещё не отражает качество бьющего. npxG нападающего говорит, сколько моментов в открытой игре он получил. Он не говорит, реализовал ли он их лучше или хуже среднего. Это вопрос реализации, на который отвечает разрыв между npxG и голами без пенальти, а не сам npxG.
Малые выборки всё ещё лгут. Один крупный момент в открытой игре в одном матче может поднять npxG команды с 0,9 до 1,5. Этот сдвиг не говорит, что команда была лучше в 90 минутах. Он говорит, что случился один хороший момент. Скользящее окно из нескольких матчей остаётся базой.
Кубковые и турнирные матчи всё ещё несут более высокую дисперсию. Убрать пенальти не меняет того факта, что чтение npxG финала кубка менее надёжно, чем чтение npxG середины сезона лиги. Уверенность масштабируется с сопоставимой глубиной выборки, а не с тем, какую колонку xG вы читаете.
Полезное правило, следующее отсюда: npxG, более чистое из двух чисел для сравнений команд и игроков, сосредоточенных на способностях в открытой игре. Это всё ещё вероятность, всё ещё подчиняется тем же предупреждениям о размере выборки и контексте, что и сырой xG, и всё ещё требует чтения рядом с сопровождающими метриками.
Как Tactiq использует сигнал npxG в анализе
Tactiq относится к npxG так, как только что описано: как к уточнению картины базовой работы, а не к самостоятельному вердикту.
Внутри анализа матча разница между недавним сырым xG команды и её недавним npxG, один из сигналов, которые анализ читает при оценке формы команды. Команда, у которой сырой xG был высоким, но npxG, скромным, зарабатывает свой xG в основном за счёт профиля стандартов. Команда, у которой npxG стабилен и близок к сырому xG, поддерживает качество в открытой игре. Эти два случая читаются по-разному на карточке матча, даже если колонка сырого xG выглядит похоже.
Конкретный способ, которым анализ Tactiq взвешивает сырой xG против npxG на фоне всего остального, окна выборки, которые он использует, способ пометки нестабильных сигналов, остаются внутри продукта. Опубликованная методология копируется и неправильно калибруется за недели; до пользователя доходит прочтение с квалификацией уверенности, обоснование которого объяснено простыми словами, а не учебник.
Что пользователь видит на карточке матча:
- Цифра ожидаемых голов для каждой стороны с индикатором тренда недавней формы.
- Тройки вероятностей для исхода, квалифицированные видимым индикатором уверенности.
- Письменный анализ, называющий картину открытой игры простым языком: «Недавнее созидание хозяев удержалось в открытой игре, хотя реализация стандартов упала, что прижало заголовочный xG ниже базовой картины.»
- Никаких внешних рыночных данных. Никаких переходов на сторонние платформы. Никакой виртуальной валюты. Только статистический анализ.
Анализ не выводит сырые цифры npxG на экран; он выводит интерпретацию того, что разрыв между сырым и без-пенальти подразумевает относительно качества команды в открытой игре.
Как читать npxG как профессионал
Пять привычек превращают npxG из второй колонки в полезную линзу.
- Сопоставляйте сырой xG и npxG, когда доступны оба. Разрыв между ними, пенальтийная премия. Команды и форварды с большим числом пенальти выглядят в двух колонках по-разному не просто так.
- Используйте npxG для сравнения команд в открытой игре. Профили стандартов различаются по лигам; частота пенальти различается по судейским тенденциям. npxG уменьшает хотя бы одно из этих искажений.
- Не оценивайте исполнителей пенальти только по npxG. Ценность назначенного исполнителя включает то, что он надёжно реализует пенальти. npxG отнимает эту заслугу и недооценивает его в этой роли. Для оценки исполнителя смотрите обе колонки.
- Будьте осторожны с обработкой нереализованных пенальти у разных провайдеров. Читайте сноски на панели. Нарратив «игрок недобрал по xG», вызванный засчитанными промахнутыми пенальти, это другая история, чем вызванная действительно плохой реализацией в открытой игре.
- Применяйте ту же дисциплину скользящего окна, что и для xG. От четырёх до восьми матчей. Один матч, анекдот, не паттерн.
Вместе эти привычки превращают npxG из мелкого варианта в действительно полезный взгляд на футбол в открытой игре.
Вывод
npxG, это xG с удалённой константой пенальти. Он чище для большинства сравнений, особенно для прочтений команд и игроков, сосредоточенных на способностях в открытой игре. Это всё ещё вероятность, а не приговор, и более широкая дисциплина xG (скользящие окна, чувствительность к контексту, квалификаторы уверенности) применяется к нему одинаково.
Используемый как улучшение над сырым xG для вопросов, где важно качество открытой игры, это честное число. Используемый как оракул одного матча или как статистика в таблице лидеров без контекста, он вводит в заблуждение ровно так же, как сырой xG.
Tactiq построен для чтения картины базовой работы с этим контекстом на месте. Анализ отражает разрыв между сырым и без-пенальти там, где это важно, выводит его простыми словами на карточке матча и никогда не смешивает статистическое прочтение с внешними рыночными данными. Более 1200 турниров, локализация на 32 языках, бесплатный уровень из восьми анализов в день, кредитная карта не требуется.
Если вы следите за этой серией, вы уже прочитали основы в трёх слоях: как ИИ анализирует футбольные матчи, что на самом деле измеряет xG и полное руководство по xA на стороне созидания. npxG стоит рядом с xG и xA как третья метрика в наборе инструментов базовой работы, и четыре статьи вместе покрывают основу, на которой продолжает строиться остальной блог.