×
支持199IT发展可加入知识交流群(10K+用户),最有价值数据分享!
点击即可加入!
关闭

《数字的游戏》:北美体育数据分析的冰与火之歌

1461908001-8480-VWibKYbId9lysImN4k5OZhl5WkhA

体育数据分析在北美的发展历史及现状

1、1944年MLB布鲁克林道奇就雇佣数据分析员

尽管“点球成金”取得了巨大的成功,但它还是受到了不少的争议。体育数据分析的历史要比作者刘易斯笔下所描述的要丰富得多。

 

比如铸就奥克兰运动家在进攻上高产表现的决定性数据上垒率,早在1944年就有人意识到其重要性。MLB布鲁克林道奇的总经理布兰奇-里奇在当年雇用阿兰-罗斯担任球队的数据分析员,并在之后于著名的“生活杂志(LIFE Magazine)”上发表“告别旧思想(Goodby to Some Old Baseball Ideas)”一文,分享了罗斯发现上垒率数据的故事。

 

2、克拉夫特家族用数学模型管理工资帽

也有人质疑,比利-比恩和他的奥克兰运动家只是因为“点球成金”这本书而被推上神坛。在他们之前早有先行者,比如新英格兰爱国者:1994年,NFL正式引入“工资帽”体系。于同年入主爱国者的克拉夫特家族意识到了工资帽管理与球队成绩之间的关联性。时任球队副总裁的现球队主席乔纳森-克拉夫特联手当年在金融界的同事,开始运用数据模型来管理球队的薪金分布及结构。精明的工资帽管理也使得这支东北球会在球员人事决策上弃取自如,在NFL中保持长期的竞争力。

3、“点球成金”推开了统计学背景人士进职业联盟管理层的大门

 

不过,“点球成金”这本书的确成功地传播了将数据分析带入人事决策的概念,改变了整个MLB乃至整个北美职业体育的面貌。在该书出版之前,球队雇用纯统计学背景人士进入管理层的决定若被公开报道,将难逃来自媒体和球迷群体的抨击。但在过去的十几年中,体育数据分析已成长为提高球队竞争力的“必需品”。

 

2012年12月中旬,NBA孟菲斯灰熊在新老板完成对球队收购后,聘请了ESPN篮球数学家约翰-霍林格担任球队篮球事务部副总裁。在ESPN的告别文中,霍林格写道:“很难相信这一切都变成了事实。但8年前,很少有球队对数据分析感兴趣,而感兴趣的那些人也不愿公开承认……但在不到10年时间内,很多球队都改变了他们的思路:如今,许多球队甚至都在对外炫耀自己在数据分析上的投入。联盟里至少有三分之二的球队已在这上面进行投资,尽管有部分球队只是在形式上做做样子,但大多数还是非常投入。”

 

霍林格所说的NBA2/3球队已经开始投入数据分析并不夸张。根据ESPN最近的一份统计报告显示,整个MLB联盟在数据分析上投入的球队已多达22支,而完全不相信数据分析的球队仅有2支。NBA方面,完全不相信数据分析也只有布鲁克林篮网,纽约尼克斯和洛杉矶湖人这三支球队。

4、MIT体育分析峰会应运而生

 

正因为“点球成金”扭转了公众对于体育数据分析的想法,许许多多有着数据统计背景的“圈外人”能够堂堂正正地走进圈内,发光发热。这也催生了一个生态圈的形成。创建一个分享讨论的交流平台也成为了必然。

在2006年4月3日跳槽至NBA休斯敦火箭后,原本在麻省理工学院教授体育商业课程的达雷尔-莫雷因无暇于波士顿和休斯敦之间来回奔波,而选择将他的课程进行转型。麻省理工学院斯隆体育分析峰会(MIT Sloan Sports Analytics Conference,以下简称为MIT体育分析峰会)也由此应运而生,在过去的十年间逐步成长为体育数据分析领域的标准制定者和领导者,进一步催化体育数据分析的发展。

 

5、凯尔特人是第一支深挖球迷大数据的NBA球队

如今,体育数据分析的范畴已不局限于球队在场上的表现好坏。它已渗透至北美职业体育的方方面面。越来越多的球队及机构意识到,在商业领域的深度数据分析能够增强他们的盈利能力。

 

2003年1月,以维克-格罗斯贝克和史蒂夫-帕柳卡为首的财团收购了NBA波士顿凯尔特人。有着风险投资背景的格罗斯贝克认为,球队除了在篮球事务方面需运用数据分析之外,在商业事务方面也得实践。正是在格罗斯贝克的领导下,凯尔特人成为NBA范围内第一支在球迷体验方面进行深度信息挖掘的球队。绿衫军的这套思维模式也在日后为其他球队及NFL所借鉴及运用。

 

在今年的MIT体育分析峰会上,格罗斯贝克如是说:“在商业这边,我们通过数据分析开始更进一步地去认识我们的球迷。我们修改了整个会员系统。你不再是凯尔特人的季票持有者。你是我们球队的一份子。我们希望尽可能地认识你。我们试着去找到你的需求,然后短平快地回馈你。科技让我们懂得如何去感谢球迷,什么时候去感谢球迷。”

6、博客圈与高阶数据的灵活应用

 

随着互联网于21世纪蓬勃发展,博客圈的出现大大降低了体育圈外人进入媒体行业的门槛。这也使得在过去十几年中,媒体界内涌现出一大批优秀的体育数据分析作者。一篇篇干货十足的文章,一个个有别于传统记者的观点迫使主流体育媒体重新思考。

当年从博客圈中脱颖而出的前ESPN首席写手,Grantland创立者比尔-西蒙斯就曾坦言,有营养的数据分析能够加强自己作品的质量,满足自己的受众。他当年为Grantland招募的扎克-洛,比尔-巴恩韦尔,乔纳-克里,科克-高尔斯贝里等人,都是擅于运用数字阐述自己观点的优秀写手。如今,高阶数据词汇已在各家体育电视网络的日常节目中频繁出现。像ESPN这样的媒体也开始在高阶数据研发上加强投入,以此更好地服务球迷。

 

体育数据分析在NBA的瓶颈与突破

1、从TENDEX方程到球员效率值

近年来,北美职业体育在中国市场的开发上频出动作。MLB与乐视体育达成全生态战略合作,已计划每年在乐视旗下的各平台上直播超过120场赛事。NFL也在积极探索在中国举行常规赛的可能。

 

但无疑,NBA才是最受国人欢迎的北美职业体育赛事。作为登陆最早受众最广的联盟,NBA在大中华地区的商业拓展已非常成熟。休斯敦火箭CEO泰德-布朗在今年的MIT体育分析峰会上就曾感叹:“我们在中国播一场比赛,比如说火箭打凯尔特人。在中国看这场比赛直播的观众数量比我们本地台一个赛季的还要多。”因此,篮球的体育数据分析也是中国体育迷们所最先接触到的。

 

早期的篮球数据分析与棒球的方向相同,都是基于初阶数据转化创造出高阶数据。大卫-席仑是该领域的先锋人物。他在1958年所创造(直到1989年发表出版)的TENDEX方程是篮球历史上第一个用来评估球员个人水平的线性方程(席仑的TENDEX效率值= [得分 + 篮板+ 助攻 + 抢断+ 盖帽 – 投篮错失数– 0.5 * 罚篮错失数 – 失误 – 犯规] / 上场时间)。

此后,又有不少人士以TENDEX方程为基础,创造出各种版本的线性模型,并以此用来评估球员的个人效率。其中最著名的莫过于由霍林格所创造的球员效率值(Player Efficiency Rating,简称PER),目前已被广泛使用。

 

2、为什么说篮球的数据分析还处于“婴儿期”

但是,目前在北美的主流观点依旧是:篮球以及其他体育项目在数据分析上较棒球,仍处于“婴儿学步”的状态。

 

其原因其实不难理解。棒球的数据由投手数据,打击数据和守备数据三个部分组成。前面两项的初阶数据均有着“非黑即白”的特征,比较好收集(比如“打者上垒只有成功和不成功”,又比如“投手对打者只有解决和不解决”)。因此,这两项数据在高阶数据方面较牵扯到人员移动的守备数据更容易开发。

 

而篮球是一个非常“动态”的运动。其初阶数据并不能很好地体现球员的能力。霍林格本人也承认,像盖帽和抢断这样的初阶数据本身就会误导人们对于防守本身的理解。这也导致在衡量球员个人防守表现时,他的PER评值并不是一个值得信赖的考核工具。像布鲁斯-鲍文这样被世人认为是外线顶级大闸的球员,其PER值一直都处于个位数水平(联盟平均PER值是15)。

 

同时,类似于PER的高阶数据也不能为教练人员带来多少营养。尽管近年来有像“正负值”这样更“顾大局”的数据被NBA官方引入,但它也不能很好地对球员个人的作用进行很好的诠释。于是,数据对于临场执教的有限价值也成为了篮球数据分析研发的一大瓶颈。

3、SportVU球员追踪系统,让分析人士有了与教练交流的语言

 

不过,球员追踪系统的出现解决了这一难题。

 

2005年,一群有着导弹追踪背景的以色列科学家发明了SportVU球员追踪系统。其本质是一个摄像机系统,被安置在体育场馆上空,对篮球场上的一切活动进行每秒25次捕捉。该系统能实时提供球员的二维移动以及篮球的三维移动数据。

自2013年以来,SportVU已在NBA全部29个球馆中完成安装,共记录了超过3000场NBA比赛。该系统所提供的海量数据为各球队的数据分析提供强有力的基础。

 

在SportVU诞生前,一支球队若想知道其球员在挡拆防守方面的表现的话,他们收集信息的方式只有手动观看录像这一种。这样的工作费时费力,且效率不高。如今,他们可以从SportVU这边下载数量达万级的挡拆防守数据,通过机器学习来识别并确定每一个挡拆防守的种类,并在识别工作完成后对每一项挡拆防守类别进行逐一分析并总结。

 

SportVU系统能够让各球队的分析人士通过坐标数据来解读场上的方方面面,比如球员的投篮热点,亦或是他们在场上的跑动距离等。而诸如此类的信息无疑是具有价值的,因为这些信息都是简单易懂的篮球语言,可以为教练员,训练师和球员们带来更加直观的认识。因此,SportVU也被MIT体育峰会列为过去十年以来体育产业界最重要的革新技术。

关于体育分析的争议

一直以来,体育数据分析在体育产业中的角色存在着各种争议。很多人担心职业体育在接受数据分析及创新后会引发负面效应。他们对于分析派人士接管球队管理层存在抵触情绪,对数据是否能让球队保持长期成功提出质疑。他们甚至担心,数据分析最终会带走运动本身的魅力,影响它们的受欢迎程度。

 

当然,单以“创新即正面”的论调来回击这些争议是不负责任的。这些质疑的声音是值得去探讨的。在“创新的扩散(Diffusion of Inovations)”一书中,社会学学家埃弗里特-罗杰斯将创新所能引发的负面后果归纳为“间接的”,“不受欢迎的”和“意料之外的”这三大类。

在对以上这些反对声音进行逐一评估后,我们不难得出数据分析对职业体育的负面影响是有限的:传统派人士和分析派人士之间的关系并非矛盾。而球队只要将信息私有化,就有长期保持竞争力的可能。数据分析的引入也并非是导致个别运动受欢迎度下降的决定因素。

 

就目前而言,数据分析并没有破坏北美职业体育的竞争环境,而是进一步加强它们的竞技性。正如NBA达拉斯小牛老板马克-库班所认为的,职业球队将数据分析纳入考虑范围的动机其实清晰且直白:“我只是想尽我所能,让小牛取得尽可能多的优势。”

 

 tiyu tiyu  体育大生意体育大生意
微信公号:sportsmoney

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部