如何给球员评级?基于有球非传统算法的实践(1)

球员评级 足球数据分析 VAEP框架 行动价值 算法应用
传统足球球员评级方法存在局限性,主要集中于进球和射门等罕见行为,忽略了其他动作及其背景。本文介绍了一种新的数据驱动框架VAEP(Valuing Actions by Estimating Probabilities),旨在更全面地评估球员表现。VAEP框架不仅包含所有类型的动作(如传球、过人、射门等),还考虑了动作发生的环境和长期影响。通过计算每个动作对进球和失球概率的变化,VAEP为每个动作分配一个值,进而聚合为球员的评级。评级可以在不同时间粒度(如单场比赛或整个赛季)和维度上进行,捕捉球员每90分钟对球队净进球差的贡献。此外,按动作类型计算评级有助于识别球员的不同比赛风格。
文章内容
思维导图
常见问题
社交分享

系列介绍

球员的评级从来没有标准答案,传统指标在解决这个问题时有各种问题,因为它们要么只关注罕见的行为,如射门和进球,要么忽略了行为发生的背景,如传球前是来自其他传球还是抢断。这里,我开始一个系列的文章,主要讲解一些论文里提出的思路和对比,并对他们的算法进行实现,基于 2022/23 赛季的数据,进行排名和拆解分析,并对比评级的算法结果和球迷/大V视角评价的区别。

第一篇我会尝试解释论文:Actions Speak Louder than Goals: Valuing Player Actions in Soccer,下一篇会根据实际的数据结果,来讨论算法的应用

Actions Speak Louder than Goals: Valuing Player Actions in Soccer

概括

大多数现有的评估足球行动的方法存在三个重要的局限性。

  1. 很大程度上忽略了除进球和射门之外的其他动作,因为到目前为止,大多数工作都集中在进球预期价值的概念上。
  2. 其次,现有的方法倾向于给每个动作分配一个固定的值,而不管该动作是在什么情况下完成的。例如,许多基于传球的指标对防守方在没有任何压力的情况下的传球和进攻方在对手重压下的传球进行类似处理。
  3. 第三,大多数方法只考虑即时效果,而没有考虑到一个动作在稍后的时间内的效果。

为了帮助填补客观量化球员表现的空白,本文提出了一个新的数据驱动的框架,以评估足球比赛中的行动。与大多数现有的工作不同,它

  1. 包含了所有类型的动作(例如,传球、过人、运球、接球和射门),
  2. 并考虑了这些动作发生的环境以及它们可能的长期影响。
  3. 直观地说,一个行动的价值反映了该行动对比赛结果的预期影响。也就是说,一个价值为+0.05的行动预计将为实施该行动的球队带来0.05个进球,而一个价值为-0.05的行动预计将为他们的对手带来0.05个进球。

这个框架就是 VAEP(Valuing Actions by Estimating Probabilities)框架。

算法拆解

VAEP(Valuing Actions by Estimating Probabilities)是一种数据驱动的框架,用于评估足球比赛中的行动。它考虑所有类型的行动(例如传球、过人、射门等),并考虑每个行动发生的环境以及可能的长期效果。行动的价值反映了该行动对比分的预期影响。

VAEP的核心思想是,大多数足球比赛中的行动都是为了(1)增加进球的机会,或者(2)减少失球的机会。因此,评估一个行动的效果的一种方式是计算它在近期内如何改变进球和失球的机会。VAEP将行动的影响分为进攻价值和防守价值两部分,这两部分可能是不对称的,并且取决于上下文。

具体来说,假设我们有每个比赛状态Si = [a1, …, ai]的进球和失球的概率,其中h代表主队,v代表客队。Pscores(Si,h)和Pconcedes(Si,h)分别表示主队h在近期内进球和失球的概率。同样,Pscores(Si,v)和Pconcedes(Si,v)表示客队v在近期内进球和失球的概率。

对于一个队伍来说,评估一个行动的价值需要评估行动ai将比赛从状态Si-1变为状态Si后,进球和失球概率的变化。队伍x(可以是主队h或客队v)进球概率的变化可以计算为:

∆Pscores(ai,x) = Pscores(Si,x) - Pscores(Si-1,x)

这个变化如果为正,表示该行动增加了队伍x进球的概率。我们称这个变化∆Pscores(ai,x)为行动ai对队伍x的进攻价值。同样,队伍x失球概率的变化可以计算为:

∆Pconcedes(ai,x) = Pconcedes(Si,x) - Pconcedes(Si-1,x)

这个变化如果为正,表示该行动增加了队伍x失球的概率。然而,所有的行动都应该旨在减少失球的概率。这就是为什么我们称这个变化的相反数-∆Pconcedes(ai,x)为行动ai对队伍x的防守价值。

我们将公式1和公式2结合起来,得到一个行动的总VAEP值。行动的总VAEP值是该行动的进攻价值和防守价值的和:

V(ai,x) = ∆Pscores(ai,x) + (-∆Pconcedes(ai,x))

如何给球员评级?

VAEP框架为每个行动分配一个值,我们可以将这些单个行动的值聚合成球员的评级。这个评级可以在多个时间粒度以及多个不同的维度上进行。球员的评级可以针对任何给定的时间框架进行,最自然的包括比赛中的一个时间窗口、一场完整的比赛或者一个完整的赛季。无论时间框架如何,我们都以相同的方式计算球员的评级。由于在场上的时间越长,有机会贡献的机会就越多,我们按每90分钟的比赛时间计算球员的评级。

给定时间框架T和球员p,我们计算球员的评级为:

ratinд(p) = 90/m * ∑ai ∈ATp V (ai)

其中,ATp是球员p在时间框架T内执行的行动集,V (ai)根据定义1计算,m是球员在T期间比赛的分钟数。这个球员评级捕捉到了球员每90分钟对球队平均净进球差的贡献。

此外,除了对所有行动进行求和,还可以按行动类型计算球员的评级。这允许构建一个球员的个人资料,可能有助于识别不同的比赛风格。总的来说,球员的评级可以根据使用情况沿着不同的维度进行计算。

思维导图生成中,请稍候...

问题 1: 什么是 VAEP 框架?
回答: VAEP(Valuing Actions by Estimating Probabilities)是一种数据驱动的框架,用于评估足球比赛中的行动。它考虑所有类型的行动(如传球、过人、射门等),并评估这些行动发生的环境及其可能的长期影响,从而计算行动对比赛结果的预期影响。

问题 2: VAEP 框架如何评估一个行动的价值?
回答: VAEP 框架通过计算一个行动对进球和失球概率的变化来评估其价值。具体来说,它计算行动对进攻价值(增加进球概率)和防守价值(减少失球概率)的贡献,并将两者结合得到行动的总 VAEP 值。

问题 3: 为什么传统指标在球员评级中存在局限性?
回答: 传统指标通常只关注罕见行为(如射门和进球),忽略了其他动作及其发生的背景。此外,它们倾向于为每个动作分配固定值,而不考虑上下文,且只关注即时效果,忽略了长期影响。

问题 4: VAEP 框架如何计算球员的评级?
回答: VAEP 框架通过聚合球员在给定时间框架内所有行动的 VAEP 值来计算评级。评级按每 90 分钟的比赛时间计算,以捕捉球员对球队平均净进球差的贡献。

问题 5: 球员评级可以按行动类型分解吗?
回答: 是的,球员评级可以按行动类型分解,这有助于构建球员的个人资料,识别不同的比赛风格。

问题 6: VAEP 框架如何考虑行动的长期效果?
回答: VAEP 框架通过评估行动对比赛状态的长期影响来考虑其效果,而不仅仅是即时结果。它计算行动对进球和失球概率的长期变化。

问题 7: VAEP 框架的进攻价值和防守价值如何计算?
回答: 进攻价值通过计算行动后队伍进球概率的变化(∆Pscores)得到,防守价值通过计算行动后队伍失球概率的相反数变化(-∆Pconcedes)得到。

问题 8: 球员评级的时间框架可以灵活调整吗?
回答: 是的,球员评级可以针对不同的时间框架计算,例如比赛中的一个时间窗口、一场完整比赛或整个赛季,计算方法保持一致。

问题 9: VAEP 框架如何帮助填补球员表现评估的空白?
回答: VAEP 框架通过包含所有类型的动作、考虑动作发生的环境及其长期影响,提供了更全面和客观的球员表现评估方法。

问题 10: VAEP 框架的评级结果与球迷或大V的评价有何区别?
回答: VAEP 框架基于数据驱动的算法,量化了球员对比赛结果的贡献,而球迷或大V的评价可能更主观,受个人偏好和印象影响。