当足球遭遇大数据:胜负靠计算还是直觉?

2_62

文_苏安德  制图_郭文哲

2013/14赛季英超联赛戏剧性地画上句号,如果说还有什么比最后一轮才决出冠军归属更让人跌破眼镜的,一定是卫冕冠军“红魔”曼联的快速衰落和名不见经传的埃弗顿异军突起。埃弗顿不仅力压曼联,排名甚至高于转会市场一掷千金的伦敦球队热刺,也成为球迷津津乐道的话题。

埃弗顿的逆袭代表了足球界的新趋势:数据革命。

欧洲足球正在经历这样一场革命。专业球迷们可能从新闻堆里发现蛛丝马迹:各大球会都在变得更聪明也更有效率。以前,关于足球的数据统计只有角球、任意球、红黄牌和射门次数,现在人们还可以看到球员单场跑了多少米、移动轨迹还有速度,等等。以体育数据公司OPTA为例,他们在每场足球赛中记录的数据多达1500项。

如今,英超联赛的所有20家球会都有专门的技术分析人员来处理这些新的数据信息,其中,光曼城一家就聘请了11个这样的人。2012年,利物浦甚至专门创建了一个名为“研究总监”的新职务,把理论物理学博士伊安·格拉汉姆招至麾下。这些研究人员会参与赛前布置和赛后总结,他们会帮助管理层鉴别和选择转会目标,甚至还会给年轻球员提出营养建议。这场革命是如此令人震撼,以至于有英国媒体惊呼:“科技怪人已经入侵欧洲竞技体育世界!”

数据不会说谎

在足球这项传统而保守的运动中,哪怕是引入门线技术(判断进球是否有效)或增设门线裁判都会造成轩然大波,数据革命听起来不可思议。

然而,在大洋彼岸的美国,系统的数据分析早在十年前就已入侵各大体育联盟。最有名的当属美国职棒大联盟奥克兰运动家队总经理比利·比恩的疯狂实验,2003年,他大胆摈弃了传统上用“打击率”选材的做法,转而挖掘“上垒率”高的潜在明星,并将这些球员招揽进球队。

比恩的“革命”招来了铺天盖地的嘲笑。因为体育世界里有句老话,“数据会说谎”。举几个简单的例子:篮球选手得分高不等于对球队贡献大,因为他可能为了追求得分而疯狂出手,导致球队进攻无法流畅运转;橄榄球四分卫被抄截率低也未必一定就好,因为他可能为了避免被抄截而拖延出手时间,最终被对方防守组擒杀;某些网球选手,例如瑞士天王罗杰·费德勒的非受迫性失误比例会比其他球员高,但那是因为他的球风比较积极,致胜分也比别人要多。所以,运动员的实力和潜力实在很难用一个简单的数字来判断,集体项目中尤其如此。

然而,运动家队随后的表现却成为了最好的回击。在随后的新赛季里,这支球队创下了20连胜的佳绩,常规赛总共摘下103胜,与洋基并列为大联盟胜场数最多的球队(洋基因少赛一场而战绩占优);要知道,运动家全队薪金总额不过5100多万,还不到豪门纽约洋基三个明星的年薪之和。

虽然比恩过分强调上垒率来挑选人才的做法也遭到一些诟病,他的球队在更强调巨星表现的季后赛里也确实表现不佳,然而,在他的启发下,大联盟其他球队也开始接纳更完善的大数据分析,而不再依靠原来的少数几项数据和球探的“直觉”来选人。

比恩和他的运动家传奇被畅销书作者迈克尔·刘易斯写成书,而后,这本名为《点球成金》(又译为《魔球理论》)的畅销书又被翻拍成电影,不仅在体育世界里掀起波澜,连华尔街的对冲基金经理都开始谈论如何“点球成金”。

其实,会说谎的其实不是数据,而是缺乏数据。在当今这种大数据时代里,球会、媒体和专业球迷已经不太可能会被单个数据一叶障目。因为他们在看到某个NBA球员单场得到36分的时候,还会看见他完成了全队40%的进攻,而且每回合进攻得分只有0.87分,与此同时,他的对位球员每回合进攻得分却有1.12分。他们也会看到,另外一个球员虽然投篮命中率只有35%,但12次出手中有7次都是在24秒的最后3秒接到球,所以他的命中率低不是他自己的错,而是为队友背了“黑锅”。

体育经理比媒体和球迷更早明白这一点。2004年,阿森纳的法国主帅温格从数据里得知,法国有个默默无闻的小孩名叫马蒂厄·弗拉米尼,他一场比赛能跑14000米。这个数字真的很惊人,但光有这个数字还是不够,因为温格不确定他是否跑对了方向。于是,温格去现场看了一场他的比赛,回来以后就决定签下这个小球员。

但是,在大数据时代,你不需要去现场看也能知道球员是否跑对了方向。1998年,在NBA菲尼克斯太阳队担任了11年录像剪辑师的加里克·巴尔成立了一家专门记录每一场NBA比赛数据的公司,他们通过视频追踪每一次进攻回合,然后分门别类给每一个球员生成“进攻趋势报告”。两年后,他和前微软工程师尼尔斯·拉尔共同成立了Synergy体育技术公司,将NBA教练们想要的细化数据跟与每个数据相应的视频结合在了一起。比如,Synergy记录了诺维茨基在1998年进入NBA之后的每一次进攻,通过该数据公司提供的数据,我们就能知道诺维茨基向右侧或向左侧突破的成功率如何,低位背打得分失误比是多少,在24秒的最后关头出手命中率怎样,等等。

到了2011年,NBA全联盟30支球队中已有26支球队使用了Synergy的数据系统,而ESPN和NBA官网在内的媒体公司也都使用了该公司的数据来研究比赛,他们甚至还推出了面向球迷的普及版本,只需要不到100美元,普通球迷也能看到几十项结合录像回放的“高级数据”。

埃弗顿逆袭

在欧洲,足球界的传统主义者也意识到了《点球成金》的魔力,至少,他们看过布拉德·皮特主演的那部好莱坞电影。但他们认为足球是一项极具动态的运动,跟棒球截然不同。在英超乃至于欧陆其他大联赛,大多数主教练都曾是出色的职业球员,他们自认为对这项运动有更深入的理解。哈利·雷德克纳普就是他们中的一员。当他还在南安普顿当主教练的时候,有一次比赛输了,数据分析人员试图给他展示比赛中暴露出来的弱点,雷德克纳普却转头嘲讽:“要不然这样,下个礼拜,我们就用你的电脑和他们的电脑来决定胜负好不好?”

雷德克纳普不知道,他的嘲讽其实无比接近问题的重点:足球并不应该只是22个球员之间的较量,更重要的是,它是两个主帅用自己麾下的队员来斗智斗勇的比赛。

埃弗顿也许会是英超的运动家队。《金融时报》专栏作家西蒙·库珀曾指出,在过去10年里,埃弗顿是英超投入产出比最高最稳定的球队。在莫耶斯手下,他们在2007到2013年的每个赛季里都取得了第八名以上的成绩。尽管每年花钱不多,同城又有利物浦这样的大牌球队,在转会市场上也难招来大牌球星,但他们光依靠青训队里培养出来的人才,就能保持稳定的成绩,还能在转会市场上赚钱。鲁尼、罗德维尔和罗斯·巴克利都是他们的青训成果。

在莫耶斯跳槽到曼联之后,埃弗顿请来维甘竞技队的马丁内斯来当他们的新主教练。马丁内斯对数据分析的迷恋众所皆知,他在家里放了一台60英寸的触屏电视,再结合一款能够记录分析球员表现的软件Prozone,每天反复观看球队的比赛录像,特别是输球的比赛,最多会看十几次,去挖掘其中的败因。他的执教思路也极具创造性,大多数球队都青睐于传统的4-4-2阵型,而马丁内斯执教的维甘竞技队则会在4-3-3、3-4-3和4-2-3-1之间来回转换。简而言之,他特别适合像埃弗顿俱乐部这样的创新型球会。

在马丁内斯的指导下,埃弗顿会在训练中记录每个球员的每个动作:“我们用GPS和心率测量仪来监测每个球员的状态。从体能的角度来说,最显著的数据是冲刺数量、冲刺距离和每个球员投入的高强度运动次数。我们这样监测一整个赛季下来,就能知道一个球员目前状态是否疲劳,以及他需要多久的休息时间。”

马丁内斯知道,如果不经处理,数据就永远只是一堆数字,无法给人以启示。于是,分析这些数字的人应该是谁,便成了新的问题。被莫耶斯一道带去曼联的技术球探总监詹姆斯·史密斯说,相较于北美职业联盟而言,欧洲足球在数据分析上仍有欠缺:“英超俱乐部里处理这些数据的人通常都是运动科学专业出身,我就是其中一例,”他说,“但在美国,你可能会看见一个哈佛法学院或者麻省理工计算机科学出身的人去干这样的活。我们英国足球俱乐部有个问题,我们为转会费、球员工资和经纪人费用上面花费了太多钱,所以无法招来足够的高质量的技术分析员工。”

当然,在英超俱乐部里也有一些出色的数据处理大师,然而由于大多数球队都还比较保守,这些数字高手们往往都是Prozone这类数据服务提供商的俱乐部联络员。为了改变这种状况,曼城曾经在2012年8月进行过一次有趣的实验,他们开启了一个名为“MCFC分析论”的项目,大胆地公开了一大批OPTA采集的2011/12赛季曼城相关数据文档,并号召任何“热爱足球与数据”的人进行分析。

“有很多人都喜欢足球,也喜欢自己进行分析,但他们需要数据,而采集数据需要钱,”曼城球员表现分析负责人加文·弗雷格说:“于是,我们给他们数据。”他们的这个做法被舆论称为“开源数据分析”,在开放数据库的前36个小时就吸引了超过1500名用户登录。然而这个项目在运营一年后便被叫停,其成功与否很难评估。

数据还是直觉?

牛津大学的数学教授马库斯·杜萨托是一个死忠阿森纳球迷,他认为,数据分析有潜力成为一个X因素,改变现有的俱乐部实力格局。“足球比人们想象中更像一场棋局对弈,”他说,“一支队伍在比赛中发生的事情并不是随机的,而是具有一定的规律。通过数据,我们可以找到这些规律,并且预测未来将会发生的事情。本质上来说,这跟对冲基金经理们做的事情也没任何不同。”

杜萨托相信,我们应该将足球队视为一个网络,而场上的11个球员就是节点,“就像一个迷你因特网”。像巴塞罗那这样的成功球队,他们有能力让所有节点直接的交流保持畅通,从理论上来说,任何其他球队也应该能够做到这一点。于是,数据分析理应能够破解巴萨的独门绝招,并成为其他球会效仿的指南书。

“如今的足球世界还相当保守,”杜萨托说,“比如说像阿森纳和利物浦这样的球队,如果他们能接纳一些外部人士的意见,就一定会获得真正的提高。”之后,他还半认真地表示,如果温格想要一个数学家来帮他们做分析的话,他会非常乐意为之效力。

不过,就算马丁内斯也得承认,数据分析亦有它的局限性。他以及手下两个最顶尖的球探里弗斯和布朗都认为“光凭数据就能买进某个球员”这种想法是十分荒谬的。“你需要亲眼看看那个球员,你需要爱上那个球员,”马丁内斯说,“你会看到他如何做热身运动,他怎样跟裁判交流,在错过机会后他是怎样跟队友沟通的,他怎样庆祝得分,还有在他进球以后其队友的反应。数据只会帮你排除一些明显的错误,但最终的决定必须依赖人的判断。这就是球探和教练的直觉。”

与此同时,数据分析可能还会有一些负面影响。博尔顿的分析研究总监布莱恩·普莱斯迪奇透露说,自从他们的守门员开始研究对方的点球手的数据以后,他的扑点球效率反而降低了,过去两个赛季只有9%的成功率。“我们给他灌输了数据分析的思维方式,却拿走了人性的部分,他作为球员的直觉被弱化了,”普莱斯迪奇说,虽然他马上又补充强调,“其实数据分析也带来了很多正面的影响。”

 如果数据专家们想要给足球俱乐部带来更大的影响,他们可能必须将游说重点从主教练转移到俱乐部老板身上。比如说利物浦老板约翰·W·亨利就是个好的游说对象,毕竟他是靠股票发家的,对数据分析这一套绝不陌生,而且他也是美国职棒大联盟波士顿红袜队的老板—要知道,红袜队就是在效仿比恩的“点球成金”理论进行改革后,才终于打破86年不冠的“圣婴魔咒”,在2004年终于取得世界大赛冠军。另一方面,球员也可能开始主动索要这些数据,切尔西的数据分析总监本·史密斯就表示,目前像埃登·阿扎尔这样的年轻球员,已经习惯了在每场比赛和训练之后拿到一分自己的数据报告,他们自己也会根据这些数据发现自己哪些地方做得好,哪些地方还需要加强。

足球是一项激情的运动,如果它变成了一项没有灵魂的纯计算工作,那么它也就丧失了其魅力。然而,在这个时代里,如果还有任何俱乐部或者主教练否认数据的作用,那么这将是他们巨大的劣势。

无论是在电视机前看直播,还是在现场观战,球迷永远不会知道俱乐部里发生的一切。如果一个替补球员在上场后第一次触球就射门得分,你会感谢主教练的天才之举,还是他那些数据分析智囊团的精密计算?在这个时刻,尤其如果你是一个曼联球迷,你可能根本不会在乎这其中的差别。

来源:南都周刊

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部