控球率调整数据(Padj):为什么原始防守数字会误导
如果你看过英超赛季"每 90 分钟抢断"的仪表盘,注意到一名 Manchester City 中场刚刚切断了对方所有进攻,却排在保级球队抢断领先者的下方,那你就看到了 Padj 这一控球率调整数据所要解决的问题。
防守数据以进攻数据所不具有的方式依赖机会。当你持球时,无防守动作可能。当你的球队有 70% 控球,剩下的 30% 才是抢断、拦截、解围能记录的窗口。控球主导型俱乐部的中场累计这些数字的机会更少。不加修正,原始计数让他显得懒散或不参与,而事实上他在所获得的窄窄防守窗口内以精英速率防守。
控球率调整指标,简称 Padj,修正这一点。本文逐项介绍这一修正、它在哪里有效、在哪里失效,以及为什么对现代足球分析重要。
Padj 究竟做什么
Padj 根据对手控球率修正防守数据。修正基于一个简单观察:防守动作只能在对方持球时发生。所以如果对方只有 40% 控球,你的球队只享有 40% 的理论防守机会。
最简公式:
Padj_Stat = 原始数据 × (50 / 对手控球率)
或等价地:Padj_Stat = 原始数据 × (对手控球率 / 50)(具体形式因归一惯例略有不同,原理相同)。
如果对手有 60% 控球,原始抢断乘以 60/50 = 1.2。在对手 60% 控球的比赛中打出 3 次原始抢断的中场,得到 3.6 次 Padj 抢断。
如果对手有 30% 控球,乘以 30/50 = 0.6。在对手 30% 控球的比赛中打出 5 次原始抢断的中场,得到 3 次 Padj 抢断。
比较从"绝对层面有多少防守动作"变成"每单位防守机会有多少防守动作"。
为什么这件事重要
控球率调整的四个实际效果。
精英控球俱乐部得到防守认可。 Guardiola 时期的 Barcelona、Guardiola 治下的 City、历史的 Bayern:原始防守数据让他们看起来几乎不防守。Padj 显示他们其实按每次机会以精英速率防守,控球期防守量低是因为多数时间球在他们脚下。
低位防守俱乐部不再奇迹般地坚不可摧。 一支整场 80% 时间深位防守的球队累积巨大的原始防守数字,看起来令人印象深刻。Padj 揭示他们通常以完全正常的每机会速率防守;他们机会更多,因为球不在自己脚下。
跨球队风格的中场评价变得公平。 Manchester City 的 Rodri 与 Arsenal 的 Declan Rice 原始防守数据差异部分源于球队风格差异。Padj 缩小差距,让比较反映实际防守质量而非位置工作量差异。
转会市场决定改善。 一家俱乐部基于原始拦截数据从低控球球队签后卫,可能得到一个无法适应新俱乐部控球主导风格的球员。Padj 帮助转会分析师识别防守速率能在球队风格变化后存活的目标。
哪些数据应当做 Padj 修正
应当对其应用 Padj:
- 抢断(尝试与成功)
- 拦截
- 解围
- 封堵
- 对抗
- 压迫(FBref 含义)
- 空中对抗(防守方)
- 夺回
任何只能在对方持球时记录的数据。
不应当对其应用 Padj:
- 传球
- 推进性传球
- 射门
- xG
- xA
- 过人
- 控球
这些是进攻方数据,已按己方控球归一。
模糊:
- 空中对抗(进攻方)。在己方持球高空时发生,技术上属进攻方。
- 抢断成功率与尝试率:比率不需 Padj,但尝试或成功的原始计数需要。
- 犯规:通常不做 Padj,但逻辑可以套用,因为犯规常跟随对方控球。
规则:如果对方持球是该数据可以记录的前提,就做 Padj 修正。
Padj 在哪里会误导
三种真实局限。
线性扩展假设。 Padj 公式假设防守机会按控球线性扩展。并非完全如此。30% 控球的球队往往那 30% 时间被钉在己方三区持续防守,每单位控球产生的防守机会比 50% 控球的球队更多。Padj 乘数在这些情况下纠正不足。
区域与状态盲。 在攻击三区做出 10 次抢断的中场,与在自己半场做出 10 次抢断的中场,贡献截然不同。Padj 把它们等同看待。区域加权变体存在但非标准公开输出。
比赛状态效应。 1-0 领先并低位防守 30 分钟的球队在那段时间累积的防守数据并不能推广到他们正常踢法。Padj 不修正这一点;分阶段或比赛状态调整变体能修正。
对手质量。 Padj 修正控球,不修正对手质量。在均等控球分配下防守 Napoli 与防守 Frosinone 不一样。对手调整 Padj 存在但增加复杂度,且各提供方标准化不足。
有用的规则:Padj 是原始防守数据的更好版本,但不是完美的。多数实用目的下,它是合适的比较;精英级分析中,区域加权与对手调整变体能加更多信号。
Tactiq 如何处理控球率调整信号
Tactiq 的分析将控球率调整防守信号作为最近多场比赛战术形态画像的一部分。按每机会精英速率防守的球队,与原始防守数字仅因球队风格而高的球队,在比赛卡上呈现方式不同。
Padj 信号与 xG、压迫指标、状态指标和比赛背景的具体组合方式属于产品内部。最终送到用户面前的,是反映真实防守质量而非原始数据累积的、带置信度限定的读数。
用户在比赛卡上看到:
- 结果的概率三元组,由置信度指标限定。
- 双方的预期进球与近期趋势。
- 一段以平实语言点出防守画面的文字分析:"主队最近六场比赛按每机会以精英速率防守,但深位防守风格产生的防守转换比平时少。"
- 任何地方都没有外部市场数据。没有跳转到第三方平台。没有虚拟货币。仅统计分析。
分析不显示原始 Padj 数字;它呈现一个考虑了控球背景的解读。
总结
控球率调整数据根据球队实际拥有的防守机会修正防守指标。没有这一修正,控球主导型俱乐部看起来防守不足,低位防守俱乐部看起来防守英勇,而事实上两种模式都是各队场上场下时间分布的产物。
Padj 是有用的细化,不是完美答案。线性扩展假设和状态盲限制了修正。但对多数跨球队比较,Padj 比原始防守数字好得多。
Tactiq 的设计就是在保持控球背景的前提下读取防守信号。分析以平实语言呈现战术形态,绝不把统计读数与外部市场数据混在一起。1200 多项赛事覆盖、32 种语言本地化、免费版每天 8 次分析,无需信用卡。
如果你一直在跟读这个系列,指标词汇现在已涵盖 人工智能如何分析足球比赛、xG、xA、npxG、PPDA、Field Tilt、推进性动作、SCA / GCA、xPts、Elo 评分、Brier 分数 与 Poisson 分布。Padj 是把这些信号在不同球队风格之间公平比较的防守数据细化。