Що таке npxG? Очікувані голи без пенальті, пояснення
Відкрийте будь-яку сучасну футбольну аналітичну панель, і поруч з іменем нападника побачите дві колонки. Одна, xG. Інша, npxG. Числа відрізняються, іноді сильно. Нападник Прем’єр-ліги з 18 xG у цьому сезоні може мати 14,5 npxG, а розрив у 3,5 гола цілком іде з розподілу пенальті його клубу. Якщо читати колонку xG, не розуміючи, на яку саме дивишся, читаєш історію з тихо вшитою пенальтійною премією.
Ця стаття проходить через те, що таке npxG, чому віднімання пенальті з xG зазвичай чесний крок, і які пастки чатують на тих, хто робить перехід, не думаючи про те, що ще не очищено. Наприкінці, наступного разу, коли хтось згадає якусь статистику xG, ви знатимете, заголовна це версія чи та, що справді описує якість відкритої гри.
Що таке npxG насправді
Очікувані голи без пенальті, це xG з вилученими ударами з пенальті. І все. Це не окрема метрика, навчена інакше; це сирий xG з відрахованою підмножиною ударів з одинадцятиметрової позначки.
Механічний розрахунок:
- Підсумуйте xG кожного удару в цікавому вам вікні (матч, сезон, кар’єра).
- Відніміть xG кожного пенальті від цієї суми.
Залишається npxG. xG пенальті близький до константи у всіх постачальників, зазвичай у діапазоні від 0,76 до 0,78. Точне значення залежить від того, до якої історичної вибірки калібрується постачальник, але коливання достатньо мале, щоб думати про пенальті як приблизно про три чверті гола, що чекає статися.
Причина, чому npxG існує як окрема колонка, у тому, що можливості для пенальті розподіляються між гравцями й командами способами, що не відображають загальної атакувальної якості. Команда, яка заробляє багато фолів у штрафному майданчику, генеруватиме більше пенальті незалежно від того, наскільки добре вона пасує чи завершує у відкритій грі. Нападник, призначений виконавцем пенальті, накопичує xG, який його партнер по команді не накопичив би, навіть якби вони ділили навантаження у відкритій грі порівну. Приберіть пенальті, і обидва ефекти зникнуть.
Залишається число, яке люди справді хочуть, коли запитують: «наскільки гарні ця команда чи цей гравець у відкритій грі?»
Чому розрив важливий
Кілька реальних закономірностей роблять різницю наочною.
Роздування виконавця пенальті. Нападник, що б’є всі пенальті за команду, яка заробляє 9 пенальті за сезон, починає з 9 × 0,76 = 6,84 xG, перш ніж будуть підраховані його удари у відкритій грі. Якщо в цього нападника сезон із 15 xG, його npxG становить 8,16. Чесне прочитання якості його гри у відкритій фазі, 8,16, а не 15. Порівняйте його з нападником команди, що рідше заробляє пенальті, який теж набрав 8,0 xG з нульовою участю в пенальті, і ви порівнюєте подібне з подібним.
Різниця xG у команди. Дві команди можуть мати схожі сезонні лінії xG, будучи різними у відкритій грі. Команда A: 55 xG при 8 зароблених пенальті (6,1 xG від пенальті, 48,9 npxG). Команда B: 52 xG при 1 заробленому пенальті (0,76 xG від пенальті, 51,24 npxG). Заголовок ставить команду A попереду. За створенням моментів у відкритій грі попереду команда B.
Порівняння між лігами. Суддівські тенденції щодо призначення пенальті відрізняються в лігах. Ла Ліга історично призначала більше пенальті за матч, ніж Прем’єр-ліга. Сирий xG команди Ла Ліги виграє від цього; її npxG, ні. Міжлігові порівняння xG без корекції на npxG можуть ввести в оману достатньо, щоб змінити висновок.
Ранній сезон, мала вибірка. У малих вибірках один пенальті різко зсуває перцентиль xG у нападника. У гравця з 2,3 xG за п’ять матчів та одним реалізованим пенальті 1,54 npxG. Після вичитання його базова швидкість виглядає значно скромніше. Саме тому скаутські звіти, що порівнюють ранні відрізки сезону, майже завжди працюють у npxG, коли питання серйозне.
Закономірність у всіх цих випадках одна. Сирий xG відповідає: «якою була якість усього, що ця команда чи гравець пробили?» npxG відповідає: «якою була якість усього, що ця команда чи гравець зробили, щоб створити моменти в живій грі?» Друге питання зазвичай корисніше.
Як зазвичай розраховують npxG
Усі публічні моделі xG видають xG на удар з прапорцем, що позначає пенальті. Побудувати npxG тривіально, коли є поударні дані: відфільтрувати рядки з is_penalty = true і підсумувати залишок.
Два невеликі дизайн-рішення відрізняються в постачальників:
Обробка нереалізованих пенальті. Деякі моделі зберігають значення xG пенальті в кумулятивному xG гравця, навіть якщо удар не влучив (аргумент: удар існував і ніс високу якість, тому має зараховуватися в xG). Інші прибирають. Перший підхід означає, що в гравця, який промахується з пенальті, розрив «недобрав за xG» виглядає більшим, ніж у того, хто їх реалізує. Якщо ви читаєте сезонний npxG гравця, щоб судити про його реалізацію, перевірте, яку конвенцію використовує постачальник. Більш захищений вибір, рахувати виконані пенальті в сирому xG, але не в npxG незалежно від результату, оскільки npxG явно про роботу у відкритій грі.
Добивання після нереалізованих пенальті. Відбитий пенальті, після якого м’яч відскакує до партнера, і той забиває: чи отримує удар-добивання повний xG, на який заслуговує? Більшість постачальників обробляють його як звичайний удар із відкритої гри з його позиції й присвоюють xG за контекстом удару. Це правильно. Але деякі простіші моделі об’єднують добивання в послідовність пенальті й обробляють інакше. Для користувачів сучасних потоків даних це несуттєво; для тих, хто читає старі історичні дані, варто знати.
Tactiq читає подієві дані матчів із ліцензованих спортивних фідів, що охоплюють понад 1200 турнірів. Поударні дані містять прапорець пенальті, що дозволяє чисто обчислювати й сирий xG, і npxG для аналізу матчу. Те, як ці два сигнали поєднуються з рештою, що дивиться продукт, залишається всередині застосунку.
Де npxG усе ще вводить в оману
Перехід з xG на npxG, це очищення, не ліки. Інші слабкості сирої метрики залишаються, і з’являється кілька нових.
Стандарти, окрім пенальті, усе ще спотворюють. npxG прибирає пенальті й залишає кутові, прямі штрафні, непрямі штрафні, розіграші від ауту. Для команди, побудованої на майстерності стандартів, npxG усе одно враховує цю цінність. Якщо хочете «xG відкритої гри» у строгому сенсі, треба прибрати всі удари зі стандартів, а не лише пенальті. Деякі постачальники окремо публікують колонку «xG відкритої гри». npxG, це на півдорозі, а не вся дорога.
Контекст зароблених пенальті втрачається. Нападник, який елітно заробляє пенальті розумним рухом і роботою корпусом, приносить команді реальну цінність. Цей внесок зникає в npxG, бо подія заробленого пенальті породжує удар з пенальті, нанесений кимось, а не удар, нанесений тим, хто заробив, у живій грі. npxG того, хто заробив, читається нижче за його реальну атакувальну користь. Порівнювати двох нападників лише за npxG, де один змушує фоли, а інший ні, недооцінює першого.
Ефекти призначеного виконавця. npxG, це число на рівні гравця, і той, хто заробив пенальті, часто не є його виконавцем. Вирахування пенальті з xG виконавця не додає його назад на рахунок того, хто заробив. Якщо ви намагаєтеся оцінити, який форвард справді продуктивніший для команди, ефект виконавця занижує цінність того, хто заробив, у npxG так само, як сирий xG завищує цінність виконавця.
Непослідовність обробки нереалізованих пенальті. Як зазначено у FAQ, постачальники відрізняються в тому, чи залишається xG нереалізованого пенальті в підсумку гравця. Порівняння двох гравців у постачальників, які обробляють це по-різному, дає висновки «яблука й апельсини».
Заголовне число все ще не відображає якості того, хто б’є. npxG нападника говорить, скільки моментів у відкритій грі він отримав. Він не говорить, реалізував він їх краще чи гірше за середній рівень. Це питання реалізації, на яке відповідає розрив між npxG і голами без пенальті, а не сам npxG.
Малі вибірки все ще брешуть. Один великий момент у відкритій грі в одному матчі може підняти npxG команди з 0,9 до 1,5. Цей зсув не говорить, що команда була кращою за 90 хвилин. Він говорить, що стався один хороший момент. Ковзне вікно з кількох матчів залишається базою.
Кубкові й турнірні матчі все ще несуть вищу дисперсію. Прибрати пенальті не змінює того факту, що читання npxG фіналу кубка менш надійне, ніж читання npxG середини сезону ліги. Упевненість масштабується зі співставною глибиною вибірки, а не з тим, яку колонку xG ви читаєте.
Корисне правило, що випливає звідси: npxG є чистішим із двох чисел для порівнянь між командами та гравцями, зосереджених на вміннях у відкритій грі. Це все ще ймовірність, все ще підпорядкована тим самим застереженням про розмір вибірки й контекст, що й сирий xG, і все ще потребує читання поряд із супровідними метриками.
Як Tactiq використовує сигнал npxG в аналізі
Tactiq ставиться до npxG так, як щойно описано: як до уточнення картини базової роботи, а не як до самостійного вердикту.
Усередині аналізу матчу різниця між недавнім сирим xG команди та її недавнім npxG, один із сигналів, які аналіз читає, оцінюючи форму команди. Команда, у якої сирий xG був високим, а npxG скромним, заробляє свій xG переважно за рахунок профілю стандартів. Команда, у якої npxG стабільний і близький до сирого xG, підтримує якість у відкритій грі. Ці два випадки читаються по-різному на картці матчу, навіть якщо колонка сирого xG виглядає схоже.
Конкретний спосіб, яким аналіз Tactiq зважує сирий xG проти npxG на тлі всього іншого, вікна вибірки, які він використовує, спосіб позначення нестабільних сигналів, залишаються всередині продукту. Опублікована методологія копіюється й неправильно калібрується за тижні; до користувача доходить прочитання з кваліфікацією впевненості, обґрунтування якого пояснено простою мовою, а не підручник.
Що користувач бачить на картці матчу:
- Цифра очікуваних голів для кожної сторони з індикатором тренду недавньої форми.
- Трійки ймовірностей для результату, кваліфіковані видимим індикатором впевненості.
- Письмовий аналіз, що називає картину відкритої гри простою мовою: «Нещодавнє творення господарів утрималося у відкритій грі, хоча реалізація стандартів впала, що притиснуло заголовний xG нижче базової картини.»
- Ніяких зовнішніх ринкових даних. Ніяких переходів на сторонні платформи. Ніякої віртуальної валюти. Лише статистичний аналіз.
Аналіз не виводить сирі цифри npxG на екран; він виводить інтерпретацію того, що розрив між сирим і без-пенальті має на увазі щодо якості команди у відкритій грі.
Як читати npxG як професіонал
П’ять звичок перетворюють npxG із другої колонки на корисну лінзу.
- Зіставляйте сирий xG і npxG, коли доступні обидва. Розрив між ними, це пенальтійна премія. Команди й форварди з великою кількістю пенальті виглядають у двох колонках по-різному не просто так.
- Використовуйте npxG для порівняння команд у відкритій грі. Профілі стандартів відрізняються за лігами; частота пенальті відрізняється за суддівськими тенденціями. npxG зменшує принаймні одне з цих спотворень.
- Не оцінюйте виконавців пенальті лише за npxG. Цінність призначеного виконавця включає те, що він надійно реалізує пенальті. npxG забирає цю заслугу й недооцінює його в цій ролі. Для оцінки виконавця дивіться обидві колонки.
- Будьте обережні з обробкою нереалізованих пенальті в різних постачальників. Читайте примітки на панелі. Наратив «гравець недобрав за xG», викликаний зарахованими пропущеними пенальті, це інша історія, ніж викликаний справді поганою реалізацією у відкритій грі.
- Застосовуйте ту ж дисципліну ковзного вікна, що й для xG. Від чотирьох до восьми матчів. Один матч, це анекдот, не патерн.
Разом ці звички перетворюють npxG з малого варіанту на справді корисний погляд на футбол у відкритій грі.
Висновок
npxG, це xG з вилученою константою пенальті. Він чистіший для більшості порівнянь, особливо для прочитань команд і гравців, зосереджених на вміннях у відкритій грі. Це все ще ймовірність, а не вирок, і ширша дисципліна xG (ковзні вікна, чутливість до контексту, кваліфікатори впевненості) застосовується до нього однаково.
Використаний як покращення сирого xG для питань, де важлива якість відкритої гри, це чесне число. Використаний як оракул одного матчу або як статистика в таблиці лідерів без контексту, він вводить в оману саме так, як сирий xG.
Tactiq побудовано для читання картини базової роботи з цим контекстом на місці. Аналіз відображає розрив між сирим і без-пенальті там, де це важливо, виводить його простою мовою на картці матчу й ніколи не змішує статистичне прочитання з зовнішніми ринковими даними. Понад 1200 турнірів, локалізація 32 мовами, безкоштовний рівень із восьми аналізів на день, кредитна картка не потрібна.
Якщо ви стежите за цією серією, ви вже прочитали основи в трьох шарах: як ШІ аналізує футбольні матчі, що насправді вимірює xG і повний посібник з xA з боку творення. npxG стоїть поруч із xG та xA як третя метрика в наборі інструментів базової роботи, і чотири статті разом охоплюють основу, на якій продовжує будуватися решта блогу.