草庐IT

科技与世界杯:大数据如何改变足球赛

David Adam 2023-03-28 原文

上个月,当葡萄牙超级巨星C罗在曼联对纽卡斯尔的比赛还剩18分钟时被罚下场,他脸上的愁容登上了国际新闻的头版头条。但他绝非唯一有这种情绪的人。很少有球员认同主教练用新球员替换他们的决定。

在此次卡塔尔世界杯足球赛期间,球员们将有一种更科学的方式来争取上场时间。在终场哨响后的几分钟内,赛事组织者将向每位球员发送一份详细的表现明细。例如,中锋的传球、带球和射门表现;以及当对方控球时,防守队员对对方的抢断频率和程度数据等。

这是数字对这场竞赛的完美加持。现在,数据分析有助于指导一切,从球员转会到训练强度,到瞄准对手,再到建议最佳射门点等等。

与此同时,足球运动员还面临着航天员级别的数据审查强度。可穿戴背心和肩带可以感知运动,用GPS追踪位置,并计算每只脚的射门次数。摄像机从多个角度捕捉一切,从头球得分到球员持球时间。为了让这些信息有意义,大多数精英足球队现在都雇佣了数据分析师,其中包括数学家、数据科学家以及从顶级公司和实验室——比如计算巨头微软和欧洲核子研究中心(CERN,位于瑞士日内瓦附近的欧洲粒子物理实验室)——挖来的物理学家。

作为回报,分析人士的见解正在改变比赛的进行方式:中锋远距离射门的频率减少,边锋传球给队友而不是传中(cross),教练痴迷于提高球场控球权——这些战术转变都有确凿证据来支持教练的直觉。

德国科隆体育大学的体育科学家丹尼尔·梅默特(Daniel Memmert)表示,“大数据开创了足球的新时代。它改变了球队的理念和行为,改变了他们分析对手的方式,改变了他们培养人才和发掘球员的方式。”

覆盖所有项目

关于数据如何改变体育运动,最著名的案例之一来自一项不同的比赛。迈克尔·刘易斯(Michael Lewis)在2003年出版的《点球成金(Moneyball)》一书中详细描述了奥克兰运动家队(Oakland Athletics)的经理比利·比恩(Billy Beane)是如何依靠球员数据在2002年以极低的预算打造了一支获胜的棒球队。据悉,Beane根据球员表现的详细数据招募球员,包括以前被低估的测量值,比如击球手上垒的频率。

Memmert表示,“通过利用数据,Beane获得了极大的优势。不过,足球要比棒球复杂得多。棒球是一种自然的‘停止-开始’(stop–start)游戏,在同一时间只有一支球队试图得分,而且几十年来,棒球统计数据一直被例行收集和大规模研究。相比之下,足球是一种移动的、得分低的‘入侵’游戏,而且要记录谁做了什么以及它如何影响结果也困难得多。”

几十年来,足球统计学家倾向于关注进球数和失球数,并寻找一种方法对它们进行建模来进行预测。这种方法的变种至今仍被用于预测比赛结果。英国牛津大学开发了一个数学模型,该模型假设进球数和丢球数分布在一个平均值附近,并正确预测了意大利将在2020年欧洲杯上击败英格兰。它还正确判断了8个进入1 / 4决赛的选手中的6个。

这样的成功案例并不罕见。牛津大学的博士生马修·佩恩(Matthew Penn)也曾开发了一个2020年欧洲杯的模型,他说,统计匹配预测比许多人意识到的更准确。对于正在进行的卡塔尔世界杯,Penn的模型显示,比利时最有可能捧得冠军奖杯,其次是巴西。

谁将赢得世界杯?

根据一种“双泊松”(double Poisson)统计模型,考虑到各男子足球队的攻守实力,比利时夺冠几率最高,而巴西则在FIFA排名中位列第一。

完美球场

对教练来说,更有趣的是球场上发生的事件以及球员如何影响事态走向。

足球分析家一直在记录这类信息。最成功的是,前皇家空军会计师查尔斯·雷普(Charles Reep)花了20世纪50年代的大部分时间在英格兰观看比赛,并对球场位置和传球顺序等因素进行了基本观察。Reep甚至用他的数据来分析球队的表现,并提出策略和战术建议。在伍尔弗汉普顿流浪者足球俱乐部(FC),他甚至帮助引进了一种直接而犀利的打法,这种打法不允许横传,成功助力球队在五年内赢得三次联赛冠军。

现代技术使这些数据的获取和分析变得非常容易,以至于大多数顶级俱乐部和许多国家队在十多年前就开始聘请数据分析师。目前,它的用途已经延伸到足球金字塔的深处。在攻读博士学位的同时,Penn还在牛津城(Oxford City)俱乐部担任兼职数据分析师。牛津城是一家半职业俱乐部,在英国足球体系的第六梯队国家南部联盟(National League South)中踢球。

许多分析人士将伦敦俱乐部布伦特福德(Brentford FC)最近的成功部分归功于一种内部算法,该算法为不同联赛的球员打分,并帮助球队招募被低估的球星。利物浦足球俱乐部的数据团队——包括曾在欧洲粒子物理研究所和英国剑桥大学工作的物理学家——已经建立了一个模型,可以评估球员在球场上的动作是否更有可能进球。去年,葡萄牙里斯本大学的体育科学家与西班牙豪门巴塞罗那足球俱乐部合作,发表了一份分析报告,分析了比赛中不同类型的传球机会能持续多久。

Penn表示,“我认为我们(在牛津城俱乐部)做的最有用的事情是赛前报告。我们观察其他球队球员的属性,然后绘制一些图表来显示他们的比赛和控球情况。之后,我会针对性地提出一些战术建议或改变。在最近一场对阵‘霸主’球队的比赛之前,我们的分析发现该球队左后卫的头球数据很糟糕。所以我建议让我们的大中锋站在球场的右侧。最终,牛津城俱乐部赢得了比赛。”

当然,一些有经验的侦察员用肉眼也能观察到这些结果。但Penn认为,“数据提供的结果偏见性要比人为见解少得多”。

俱乐部不需要自己生成这些战术分析的原始数据。相反,他们可以从商业公司那里购买信息,这些公司用视频记录了约3000个主要比赛事件的结果,包括运球、传球和抢断。起初,这些数据是手动记录的,但现在通常使用一种名为计算机视觉的人工智能来完成。通常情况下,这些数据带有汇总的统计数据,比如每个球员的完成率。

乔安娜·马克斯(Joanna Marks)是英国华威大学数学专业的本科生,今年早些时候,她与牛津城俱乐部的Penn合作,开发了一个模型,利用这些原始数据来评估牛津联赛中所有球员的传球强度——这种详细的分析通常无法从公司提供的原始数据中获得。

Marks解释称,“你需要考虑到他们的传球方式。你不能只看完成率,因为有些传球要难得多。这种模式有助于球队做好准备,因为如果你知道对手在球场的某个区域传球很好,那么你就知道应该注意什么。”

拉维·拉米内尼(Ravi Ramineni)曾是微软的一名数据分析师,2012年调往美国职业大联盟(MLS)俱乐部西雅图海湾人(Seattle Sounders)担任类似的工作。他的首要任务之一是使用GPS数据记录球员跑了多远,以优化他们的训练和准备过程。

他解释称,“在训练期间收集这些数据,你可以看出今天的训练可能太多或太少,这样可以避免球员受伤。当我们运用这些方法的时候,我们确实有了一个非常完美的赛季。”

镜头之外的行动

分析人士现在越来越关注球员没有球权时会发生什么。

Ramineni解释称,“在足球分析中,你总会听到一件事,那就是我们需要知道球员在无球状态下做了什么。”

这更困难,因为它需要专门的摄像机,不仅要跟踪主要行动,还要密切关注那些没有直接参与的球员,并以每秒25次的速度标记他们的位置。

Ramineni补充道,“提供这类数据的公司倾向于与国家联赛签订独家协议,这使得外来者很难获得数据。这样一来,如果我从南美或欧洲为美国足球大联盟物色一名国际球员,那么我将无法获悉他们的无球率(off-the-ball)指标。”

近年来,出现了一种更强大的技术,它利用人工智能来预测拍摄比赛中球员的动作,即使他们没有被摄像机直接捕捉到。这意味着数据公司可以使用比赛的直播画面(不受限制)为世界上任何地方的球员提供全面的有球和无球分析。

谷歌旗下、总部位于伦敦的人工智能公司DeepMind的研究人员与利物浦FC3的数据团队合作开发了这样一个预测模型。

利物浦足球俱乐部的研究主管伊恩•格雷厄姆(Ian Graham)称,“有了这种应用程序,你就可以开始提出战术问题。对于比赛中的一个特定事件,该模型可以生成数千个不同的模拟结果,以预测可能发生的情况。所以,你有能力谈论在那段时间的比赛中,一个进攻动作进行得有多好。”

俱乐部的数据团队倾向于不分享他们正在做什么或工作效果如何的具体信息,所以公布这项工作对利物浦来说是充满挑战的一步。但这是与Deep Mind合作的一个条件。

Graham表示,“利物浦拥有足球界最大、最发达的分析部门之一,但我们自己却没有建立这些模型所需的任何资源(其他俱乐部也一定做不到),所以只能与Deep Mind合作开发这一模型。”

和其他数据分析师一样,Graham并不认为自己是球场上取得胜利的“功臣”。他认为,“足球是一种瞬息万变的游戏,所以球队经常会在不该输的时候输,在不该赢的时候赢。在很多时候,当球队表现不佳时,我们的工作更容易,因为我们的分析可以帮助他们踢得更好。如果我们保持这样的表现,我们将赢得本赛季预期的比赛数量。”

DeepMind公司计算机科学家卡尔•图尔斯(Karl Tuyls)表示,镜头外(off-camera)建模工作是创建一个虚拟的、由人工智能驱动的助理教练的第一步,该助理教练使用实时数据指导足球和其他运动的决策。他表示,“你可以想象,AI看到上半场的表现后,会建议改变阵型,这样可能会做得更好。这种方法在球场之外也很有用,比如在繁忙的城市街道上为自动驾驶汽车和行人的轨迹建模。”

接下来该怎么做?和所有优秀的科学家一样,研究足球数据的专家强调,仍需要进行更多的研究。前微软数据科学家莎拉•路德(Sarah Rudd)去年离开了阿森纳俱乐部(Arsenal FC),此前他在这家伦敦俱乐部从事了近10年的分析工作。现在,她对赛车产生的海量遥测数据十分垂涎,这些数据可以帮助车队调整和提高赛车性能。

她表示,“我经常看F1,并且总是想着我们足球也能有如此高水平的数据就太好了。目前,足球界仍然有很多东西没有被衡量,或者它正在被衡量,只是我们还没有弄清楚如何从中得出见解而已。”

下一个进步可能是数据显示球员的方向,甚至他们如何转移重心。Rudd认为,“跟踪数据可能还没有达到人们想要的细粒度。我们还没有注意到球员为了让防守者失去平衡或给守门员‘虚晃一枪’而采取的假动作。”

即使是利物浦俱乐部的人工智能驱动的分析也可能会被这种行为所迷惑。Graham表示,“该模型可能会显示这个球员出现异常行为,在本该跑的时候并没有做出预期动作。但那可能是因为他被绊倒了,正躺在球场上。”

随着现代足球被数据淹没,数字如何改变了比赛?

Ramineni认为,“数据分析带来的最大好处可能体现在球员招募方面。另一个领域则是定位球的策略,即球队在比赛暂停后获得任意球。”

从数据分析中得到的一个明确的教训是,球员不应该在距离球门很远的时候射门。Ramineni解释称,“如果你观看世界上任何一个联赛,十年前球员射门的距离要远得多。这一切改变都得益于从事数据分析的人强调,‘你为什么要从那里射击?只有2%的机会!’”

他补充说,许多球队现在也不鼓励球员尝试向禁区长传,因为数据显示大多数传中都是无意义的。

最后,Ramineni认为,随着生成的数据量不断增长,应用场景也会不断增加。现在,数据足迹已经遍布整个体育界,也将改变整个体育界的运行方式。

有关科技与世界杯:大数据如何改变足球赛的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  4. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  5. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  6. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  7. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  8. ruby - 如何指定 Rack 处理程序 - 2

    Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

  9. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

    在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

  10. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

    我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

随机推荐