什么是 npxG?非点球预期进球完整解析
打开任何一款现代足球数据面板,你会看到前锋名字旁有两列数字。一列写着 xG,另一列写着 npxG。两者数值不同,有时差距还不小。本赛季 18 xG 的英超前锋,npxG 可能只有 14.5,这 3.5 球的差距完全来自他所在俱乐部的点球分配。如果你在不清楚自己看的是哪一列的情况下阅读 xG 数据,你读到的故事里悄悄地夹带了点球溢价。
本文将说明 npxG 究竟是什么、为什么从 xG 中剔除点球通常是更诚实的做法,以及那些在换到 npxG 后仍没有把其他杂音清理干净的分析者会落入的陷阱。读完之后,下次再有人丢出一个 xG 数字时,你就能判断那是头条版本,还是真正描述运动战质量的版本。
npxG 到底是什么
非点球预期进球就是剔除了点球射门的 xG。仅此而已。它不是一个独立训练的指标,而是从原始 xG 中减去那些来自点球点的射门子集。
机械计算方式:
- 在你关心的窗口内(一场比赛、一个赛季、整个职业生涯),把每一次射门的 xG 加总。
- 从这个总和中减去每一次点球射门的 xG。
剩下的就是 npxG。点球 xG 在各家提供商之间接近一个常数,通常在 0.76 到 0.78 之间。具体数值取决于提供商校准所用的历史样本,但波动足够小,可以把点球大致看作四分之三个即将发生的进球。
npxG 之所以作为独立一列存在,是因为点球机会在球员和球队之间的分布方式,并不能反映整体的进攻质量。一支在禁区内经常赢得犯规的球队,无论他们在运动战中的传球或终结做得有多好,都会产生更多点球。作为指定主罚的前锋,所累积的 xG 是其队友即使平分运动战负荷也不会获得的。把点球剔除后,这两种效应都会消失。
剩下的,就是当人们问"这支球队或这名球员在运动战中到底有多好"时真正想要的那个数字。
为什么这个差距重要
几个真实案例能让差距变得具体。
点球主罚者的虚高。一支球队每赛季赢得 9 次点球,由同一名前锋全部主罚,那么他在运动战射门被计算之前,就已经拥有 9 × 0.76 = 6.84 xG。如果该前锋整个赛季 xG 为 15,他的 npxG 就是 8.16。关于他运动战质量的诚实解读是 8.16,而不是 15。把他和另一支点球较少的球队中同样打出 8.0 xG、零点球参与的前锋相比,才是同类比较。
球队 xG 差。两支球队可能拥有相似的赛季 xG 数据,但在运动战中是完全不同的球队。A 队:55 xG,赢得 8 次点球(点球贡献 6.1 xG,npxG 为 48.9)。B 队:52 xG,赢得 1 次点球(点球贡献 0.76 xG,npxG 为 51.24)。头条数据上 A 队领先。但在运动战机会创造上,B 队更占优。
跨联赛比较。裁判在点球判罚上的倾向因联赛而异。西甲历史上每场比赛判罚的点球比英超更多。西甲球队的原始 xG 会因此受益,但 npxG 不会。不做 npxG 调整的跨联赛 xG 比较,足以把结论引向相反方向。
赛季初样本。在小样本下,一次点球会让前锋的 xG 百分位剧烈波动。一名球员在五场比赛中累计 2.3 xG,其中包含一次转化的点球,其 npxG 为 1.54。剥离之后,他的底层水平看起来要低调得多。这就是为什么在利害关系较高时,赛季初的球探比较报告几乎总是使用 npxG。
这些情形背后的模式是相同的。原始 xG 回答"这支球队或这名球员所有射门的质量总和是多少"。npxG 回答"这支球队或这名球员在运动战中创造机会的质量总和是多少"。第二个问题通常更有用。
npxG 通常是怎么计算的
所有公开 xG 模型都会为每一次射门输出 xG,并附上一个标识点球的标志。只要有射门级数据,构建 npxG 就很简单:过滤掉 is_penalty = true 的行,再把剩下的加总。
提供商之间有两个小的设计决定会有所不同:
未命中点球的处理方式。有些模型即使在射门未命中的情况下,仍在球员累计 xG 中保留点球 xG 值(理由是射门确实发生且质量很高,因此应计入 xG)。另一些则将其剔除。前一种做法意味着罚失点球的球员会呈现出更大的"xG 发挥不足"差距。如果你在用球员赛季 npxG 判断其终结能力,要检查提供商采用的是哪种约定。更站得住脚的做法是:无论结果如何,都把主罚的点球计入原始 xG,但不计入 npxG,因为 npxG 本就只描述运动战部分。
点球反弹球。点球被扑出后弹给队友补射得分的情况:补射的那脚射门是否拿到它应得的完整 xG?大多数提供商将其视为从该位置发生的普通运动战射门,并根据射门情境赋予 xG。这是正确的。但一些较简化的模型会把反弹球并入点球序列,采取不同处理方式。对于阅读现代数据源的用户而言,这不是问题;对于查看较早期历史数据的用户而言,值得了解一下。
Tactiq 从授权体育数据源读取事件级比赛数据,覆盖 1.200 多项赛事。每次射门的数据包含点球标志,能够为比赛分析干净地计算出原始 xG 和 npxG 两个信号。这两个信号与产品所关注的其他内容如何结合,保留在应用内部。
npxG 仍会在哪些地方误导
从 xG 切换到 npxG 是一次清理,而不是治愈。原始指标的其他弱点依然存在,而且还会出现一些新问题。
点球之外的定位球仍会扭曲结果。npxG 剔除了点球,却保留了角球、直接任意球、间接任意球、界外球战术。对于以定位球见长的球队,npxG 仍会把这部分价值计入。如果你想要严格意义上的"运动战 xG",需要把所有定位球射门都剔除,而不只是点球。一些提供商会单独发布"运动战 xG"列。npxG 只走了一半路,而不是全程。
制造点球的情境信息丢失。一名擅长通过巧妙跑位与身体对抗制造点球的前锋,正在为球队贡献真实价值。但这部分贡献在 npxG 里消失了,因为"制造点球"这一事件产生的是由某人主罚的点球射门,而不是制造者本人在运动战中完成的射门。制造者的 npxG 会比其真实进攻贡献要低。若仅凭 npxG 对比两名前锋,其中一人擅长制造犯规,另一人不擅长,前者会被低估。
指定主罚者效应。npxG 是球员层级数据,而制造点球的人往往不是主罚的人。从主罚者的 xG 里剔除点球,并不会反过来加到制造者账上。如果你想评估哪名前锋对球队的实际贡献更大,主罚效应在 npxG 中会低估制造者的价值,就像原始 xG 会高估主罚者的价值一样。
未命中点球处理不一致。正如 FAQ 所述,提供商对未命中点球的 xG 是否保留在球员总账中看法不一。拿两家处理方式不同的提供商去横向比较两名球员,会得出苹果对橘子的结论。
头条数字仍然不反映射手本身的质量。一名前锋的 npxG 告诉你他在运动战中得到了多少机会,却没告诉你他转化这些机会是否优于或劣于平均水平。那是一个终结问题,由 npxG 与非点球进球之间的差值来回答,而不是由 npxG 单独回答。
小样本依然会骗人。单场比赛中的一次大运动战机会可以把球队的 npxG 从 0.9 推到 1.5。这种跃升并不能说明球队整整 90 分钟踢得更好,它只是告诉你发生了一次好机会。跨多场比赛的滚动窗口仍是基准。
杯赛和锦标赛仍然方差更高。剔除点球并不会改变一个事实:杯赛决赛的 npxG 解读不如中段联赛的 npxG 解读可靠。置信度取决于可比的样本深度,而不是你阅读哪一列 xG。
由此得出的可用准则:对于关注运动战能力的跨球队、跨球员比较,npxG 是两列数字中更干净的那一列。它仍然是概率,仍然受到与原始 xG 相同的样本量和情境警告的约束,仍然需要与其伴随指标一起阅读。
Tactiq 如何在分析中使用 npxG 信号
Tactiq 对 npxG 的处理方式正如本文刚才所描述:它是对底层表现画面的细化,而不是独立的结论。
在一场比赛的分析中,球队近期原始 xG 与近期 npxG 之间的差值,是分析在评估球队状态时读取的信号之一。原始 xG 偏高但 npxG 较为平淡的球队,xG 主要是从定位球轮廓中得来的。npxG 稳定且接近原始 xG 的球队,运动战质量是在持续维持的。即使原始 xG 这一列看起来相近,这两种情况在比赛卡上也会呈现不同的读法。
Tactiq 的分析如何在原始 xG 与 npxG 之间加权、使用哪些样本窗口、如何标记不稳定信号,这些细节保留在产品内部。公开的方法论会在数周内被复制并被错误校准;呈现给用户的是一段由置信度限定的解读,并用通俗语言给出理由,而不是教科书。
用户在比赛卡上看到的是:
- 每一方的预期进球数,附带近期状态趋势指示。
- 结果的概率三元组,附有明显的置信度标识。
- 以通俗语言描述运动战画面的书面分析:「主队近期在运动战中的创造力仍然稳定,但定位球转化下滑,这使得头条 xG 被压在底层模式之下。」
- 任何位置都没有外部市场数据。没有跳转至第三方平台。没有虚拟货币。仅限统计分析。
分析不会在屏幕上直接展示原始 npxG 数字,而是展示对原始 xG 与非点球 xG 之差所暗示的球队运动战质量的解读。
如何像专业人士一样阅读 npxG
五个习惯能把 npxG 从第二列数字变成一块有用的透镜。
- 只要两列都有,就把原始 xG 和 npxG 配对看。两者之间的差值就是点球溢价。重点球的球队和前锋在这两列中呈现出不同面貌是有其道理的。
- 用 npxG 做跨球队的运动战比较。定位球轮廓因联赛而异,点球频率因裁判倾向而异。npxG 至少能减少其中一种扭曲。
- 不要仅凭 npxG 来评价点球主罚者。指定主罚者的价值包含他稳定转化点球这一事实。npxG 把这份功劳剥离了,对这个角色而言是低估。评价主罚者时要同时看两列。
- 留意不同提供商对未命中点球的处理方式。阅读面板上的脚注。由被计入的罚失点球驱动的"球员 xG 发挥不足"叙事,和由真正运动战终结不佳驱动的叙事是两回事。
- 对 npxG 应用与 xG 相同的滚动窗口纪律。四到八场比赛。一场比赛是个案,不是模式。
合起来看,这些习惯能把 npxG 从一个次要变体变成对运动战足球真正有用的视角。
总结
npxG 就是剔除了点球这个常数的 xG。对于大多数比较场景,尤其是关注运动战能力的跨球队、跨球员解读,它更干净。它仍然是概率,而不是结论,更宽泛的 xG 使用纪律(滚动窗口、情境敏感度、置信度限定)同样适用于它。
作为在运动战质量才是问题核心时对原始 xG 的升级使用,它是那个诚实的数字。作为单场比赛的神谕,或缺乏上下文的排行榜统计来使用,它会以与原始 xG 同样的方式误导读者。
Tactiq 的设计初衷,就是在保持这些上下文的前提下读取底层表现画面。分析在重要之处反映原始 xG 与非点球 xG 之间的差距,用通俗语言呈现在比赛卡上,绝不将统计解读与外部市场数据混为一谈。覆盖 1.200 多项赛事,32 种语言本地化,每日 8 次分析的免费层,无需信用卡。
如果你一路读过本系列,你现在已经分三层读完了基础:AI 如何分析足球比赛、xG 究竟衡量什么,以及创造侧的完整 xA 指南。npxG 与 xG、xA 并列,是底层表现工具箱中的第三个指标,这四篇文章一起覆盖了博客后续内容继续展开的基础。