F1赛车统计与分析使用Tableau

在像F1这样竞争激烈的运动中,即使是最微小的性能提升也可能导致胜利。从球迷和数据科学的角度分析F1可能有助于获得有用的见解。这激发了我撰写本文,并帮助揭示制造商和车手应该专注改善他们的排名,即使没有赢得世界冠军。
介绍
方程式赛车是最高级别的单座车辆比赛,因此吸引了来自全球几乎每个国家的重要投资和数百万观众。要参与并赢得大奖赛,需要极高的精确度、对快车的执着以及强大的团队。这不是一项适合胆小者的运动。驾驶员们在这些极速赛车上超越自己,成为世界冠军。
分析问题
Q1)最好的车手和车队的“状态”在近年来如何变化?
Q2)在过去十年中,哪些车队和车手遭遇了最多的事故?
Q3)谁是面临最多引擎故障的车手?
Q4)在过去十年中,最危险的大奖赛是哪个?
Q5)制造商应该专注哪些因素,以使F1赛车更加可靠?
数据探索
数据来自Kaggle,具有CC0:公共领域许可。Formula 1 World Championship (1950–2021) 这个数据集包含了1950年到2021年的所有关于F1比赛的信息,分为13个CSV文件。
- circuits.csv — F1比赛赛道
- constructor_results.csv — 车队冠军的比赛结果
- constructor_standings.csv — 车队冠军的最终排名
- constructors.csv — F1中的车队
- driver_standings.csv — 车手冠军的最终排名
- drivers.csv — F1中的车手
- lap_times.csv — F1中的圈速
- pit_stops.csv — F1中的停车次数
- qualifying.csv — F1中的排位赛
- races.csv — F1中的比赛
- results.csv — F1比赛的结果
- seasons.csv — F1的赛季
- status.csv — 不同状态的映射
数据预处理
由于有13个CSV文件,所以需要进行大量预处理并组合起来创建最终的数据集。
- 将13个CSV文件导入JupyterHub。
- 读取单个CSV文件,并根据比赛ID、车队ID、车手ID、赛道ID和状态ID进行合并。
- 删除错误值。
- 基于新的清洁数据集创建一个新的CSV文件。

工具
以下工具用于协助数据分析过程:
- Tableau:用于创建可视化效果。
- JupyterHub:用于整理、清洗和准备数据集以进行可视化处理。
分析

可视化清楚地显示了F1的历史,从1950年的首个赛季到当前赛季。意大利大奖赛和英国大奖赛自1950年以来一直举办,并且在这期间从未中断过。
我是一名艺术家,赛道是我的画布,赛车是我的画笔。 — 格雷厄姆·希尔
问题:最佳车手和车队的“状态”如何在最近几年发生变化?
我们从过去五年的数据开始,因为Max Verstappen在2015年才加入了F1。他在2015年的澳大利亚大奖赛上首次亮相,当时他只有17岁,成为参加F1比赛的最年轻车手。

Max Verstappen是当前的F1世界冠军,结束了刘易斯·汉密尔顿的统治时代。汉密尔顿在过去的七年中一直占据主导地位,他分别在2015年、2017年、2018年、2019年和2020年获得世界冠军。他在2021年的最后一站大奖赛中被Max Verstappen以5分之差击败,而在2016年的最后一站大奖赛中,他以5分之差输给了他的前队友尼科·罗斯伯格。尽管他不是当前的世界冠军,但他依然状态出色,并将继续是一个不可忽视的力量。瓦尔特里·博塔斯在梅赛德斯表现稳定,始终排名前五。

梅赛德斯继续在F1中占据主导地位,连续从2014年至2021年赢得车队冠军。红牛车队在2010年至2013年赢得了车队冠军。红牛车队在2014年后陷入低谷,并且在过去的七年中未能战胜梅赛德斯。Max Verstappen可能是红牛车队在未来几年战胜梅赛德斯的最佳希望。虽然Verstappen是当前的世界冠军,但由于瓦尔特里·博塔斯的积分比塞尔吉奥·佩雷斯多得多,梅赛德斯今年获胜。
在过去的十年中,法拉利的表现不如法拉利黄金时代的标准。当迈克尔·舒马赫还在比赛时,法拉利连续六次获得冠军,从1999年到2004年。在他退役后,法拉利的表现下滑且未能恢复。
在一级方程式赛车(Formula One)中,占据主导地位并不是什么新鲜事;该系列赛事的历史充满了占主导地位的车队,可以追溯到上世纪50年代,当时胡安·曼努埃尔·方吉奥驾驶一辆强大的梅赛德斯赛车赢得了比赛,有人认为它是史上最好的赛车。绝大多数一级方程式的冠军都在当时最好的赛车上获得了胜利。其他七家车队缺乏像梅赛德斯那样的车辆和财力来竞争前列,所以他们争夺的是第四名,也被称为“其他车队中最好的”。
要在这个比赛中取得任何成就,你必须愿意探索灾难的边界。 — 斯特林·莫斯
问题:在过去十年中,哪些车队和车手经历了最多的碰撞?

Hulkenberg在过去十年中经历了最多的碰撞(11次碰撞和7次事故),其次是Grosjean(12次碰撞和5次事故)、Perez(7次碰撞和3次事故)和Max Verstappen(4次碰撞和6次事故)。
F1赛车非常昂贵,可能容易发生碰撞的车手如果他们的表现不符合要求,对车队来说可能并不划算。看到Max Verstappen位列前四位是令人感到有趣的。这可能是由于他在职业生涯初期经验较少。尽管如此,最近他在超车时遭遇了碰撞。

威廉姆斯车队过去十年在F1中遭遇了最多的碰撞(33次:25次碰撞和8次事故),其次是法拉利(27次:16次碰撞和11次事故),托罗罗索(25次:16次碰撞和9次事故),麦克拉伦(23次:19次碰撞和4次事故)。
威廉姆斯表现不佳的原因之一可能是他们遭遇的碰撞比其他车队多得多。修复汽车对车队来说是一项非常昂贵的任务。像威廉姆斯这样的小团队的整体预算要比法拉利和麦克拉伦这样的大团队低。因此,对于小型车队来说,面对碰撞事件的负担变得更加沉重。
预算不平等
2018年预算按照2018年锦标赛排名顺序如下
梅赛德斯 — $4亿
法拉利 — $4.1亿
红牛 — $3.1亿
雷诺 — $1.9亿
哈斯 — $1.3亿
麦克拉伦 — $2.2亿
赛点车队 — $1.2亿
阿尔法罗密欧 — $1.35亿
托罗罗索 — $1.5亿
威廉姆斯 — $1.5亿
像梅赛德斯、红牛和法拉利这样的大团队的预算是威廉姆斯和托罗罗索等小团队的两倍以上。这种严重的不平等使得每次碰撞和随后的修复对于小型团队来说更加繁重。
2021年正在制定的另一项规则是预算限制,这将是F1历史上的第一次。具体数字一直是最大和最小俱乐部之间争议的焦点,关于如何执行仍需要回答。原则上,确定了1.75亿美元的数额,但是由于营销费用和驾驶员工资等例外,最佳车队的“真实”预算预计将远高于这个数。车队的收入主要来自于F1赛事收入,这是预算方程式的另一面。
2021年的奖金结构将更加成熟,冠军位置对资金流向的影响将更大。预算更大的车队继续赢得冠军,赚取更多的钱,并将这些资金用于推动他们的下一场比赛。较小的车队所占的份额较小,需要帮助来维持运营。
因此,对碰撞事故的分析可以帮助车队选择下一场大奖赛的车手,尤其是威廉姆斯和托罗罗索。
为了公平起见,他们不应该都开同一辆车吗?
在关于F1问题的辩论中,一个经常提出的理念是为了找到世界上最好的车手,每个人都应该得到相同的机械设备,以确定谁真正是最好的。这个理念在理论上是有道理的。
像法拉利这样的大厂商在该运动上投入了大量资金,以展示他们的发动机优于其他厂商。恩佐·费拉利利用F1来证明他的车辆和发动机是世界上最好的。当目前的梅赛德斯-奔驰董事会在斯图加特开会时,他们知道他们的品牌现在已经与将其F1车队推向统治时代的高质量相提并论。厂商们将没有太大的动机在单一规格系列中投资数百万美元,因为获胜的声誉将大大降低。
后果是显而易见的:如果没有知名的厂商,F1将难以吸引到如此庞大的赛程需求,系列赛的地位将降低,车手们会寻找更具诱惑力的比赛场地。它将只是另外一个没有所有这些的赛车系列。F1一直是赛车和技术的顶峰,团队一致希望保持这种方式,尽管程度有所不同。
问)谁是面临最多发动机故障的车手?

费尔南多·阿隆索过去十年面临的车辆故障次数最多(27次),其次是里克多(24次)、胡肯伯格(23次)和格罗斯让(20次)。众所周知,阿隆索在麦克拉伦效力期间并不满意麦克拉伦制造的赛车。尽管麦克拉伦是F1中最大的制造商之一,但它在F1赛车方面仍然面临许多工程问题。
这辆车的可靠性可能比前世界冠军更好,即使在可靠性较好的比赛中,本田引擎动力不足,整体速度较慢,容易被超越。费尔南多·阿隆索于2019年离开麦克拉伦,并作为阿尔派纳(Alpine)车队的一部分回归。发动机问题是决定发动机可靠性的一个重要因素。毕竟,你需要一辆快速可靠的车来驾驶。
因此,通过分析找出哪些车手面临最多的发动机问题,可以帮助决定车手如何选择即将到来的赛季的车队。
如果你不再抢攻存在的空隙,你就不再是个赛车手。- 艾顿·塞纳
Q) 过去十年里最危险的大奖赛是哪个?

F1是一项危险的运动,知道哪个大奖赛发生了更多事故将有助于确定哪个大奖赛需要更多的安全措施和规定。摩纳哥大奖赛是最危险的大奖赛,共发生了23次事故,其次是新加坡大奖赛(19次事故),英国大奖赛(17次事故)和比利时大奖赛(16次事故)。
摩纳哥大奖赛是世界上最负盛名的赛道之一。它与勒芒24小时耐力赛和印第安纳波利斯500赛一起组成了汽车运动三冠王。这个赛道狭窄,更危险,并且不遵循国际汽车联合会(FIA)规定的F1赛事的最低190英里比赛距离。
这个特殊赛道的历史与荣耀不应该成为安全规则和法规的例外。必须在这些赛道上实施额外的规则和安全措施,以确保车手的安全和福祉,并为其他大奖赛赛道树立榜样。
比赛在赛道上赢得。冠军在工厂中赢得。 – 奔驰(2019年)
Q) 制造商应该着重考虑哪些因素来提高F1赛车的可靠性?
无论一辆车有多快,如果不可靠就无法赢得比赛。
麦克拉伦过去十年面临最多的车辆故障(58次),其次是托罗·罗索(Toro Rosso)(57次),红牛(46次)和威廉姆斯(Williams)(43次)。

麦克拉伦面临最多的问题是变速箱故障,其次是发动机和动力单元故障。像麦克拉伦这样的大型车队应该能够生产可靠的赛车,否则他们将无法留住/招募那些有着稳定表现的重要选手。

托罗·罗索面临最多的问题是发动机问题,其次是悬挂和动力单元故障。这可能是为什么托罗·罗索过去十年表现平平的原因。

红牛面临最多的问题是发动机问题,其次是动力单元和电器故障。根据分析,不同制造商应该关注不同的因素来改善赛车的可靠性,而发动机问题是最紧迫的问题。
当我退休的时候,我知道我再也无法取代我驾驶F1赛车时所感受到的无比激动。- 杰森·巴顿
结论
马克斯·维斯塔潘(Max Verstappen)今年打破刘易斯·汉密尔顿(Lewis Hamilton)的统治时代,成为挑战者,并有望在未来几年保持良好的竞争对手地位。马克斯·维斯塔潘和刘易斯·汉密尔顿的竞争可能是未来十年中最好的竞争。梅赛德斯继续主导F1车队冠军,而红牛则迅速缩小两者之间的差距。2022年红牛能够获胜吗?
在过去十年里,胡肯伯格(Hulkenberg)是遭遇最多撞车的车手,而威廉姆斯(Williams)是过去十年里遭受最多撞车的车队。对于像威廉姆斯这样的小型车队来说,撞车更加麻烦,因为它们的预算较小。新的预算上限规定能否减少大型和小型车队之间的差距?
费尔南多·阿隆索(Fernando Alonso)过去十年里遭受了最多的车辆故障。这可能是为什么Mclaren无法留住这位前世界冠军的原因之一。阿隆索通过转投阿尔派能否成为明年更强大的竞争者呢?
摩纳哥大奖赛是F1中最危险的赛道,必须改善安全规定和规章制度以确保车手的安全。在2022年是否会对新的安全规定进行强制执行?
迈凯轮面临最多的发动机问题,其中变速器问题最突出。迈凯轮能否最终解决引擎问题,并成为值得全球最大制造商支持的竞争对手?
未来工作
天气是F1中的重要因素。它改变了车队的整体策略,包括他们如何利用停车,使用哪种轮胎以及车队能够达到的速度。降雨减小了大型和小型车队之间的差距,因为大型车队不能像没有下雨时那样快速行驶。超车变得更加危险,并使车手因水上滑而更容易发生撞车事故。
尼基·劳达(Niki Lauda)在纽伯格林发生的臭名昭著的撞车事故中严重烧伤了他的脸和身体,可能是由于下雨造成的。尼基·劳达曾要求停止比赛,提出了对雨天和缺乏足够的防火和安全措施的担忧,但仅以一票之差输掉了上诉,并被迫参赛。降雨使整个大奖赛比它本身更加危险。尽管F1由于赛车能以惊人的速度行驶而仍然是一项危险的运动,但也许未来的F1比赛将采取更多的安全措施,以改善车手的安全性,即使不能完全保证。
机器学习可以用来预测未来的比赛中谁将获胜。但需要考虑到车队的阵容变化,如经理、工程师、车手等。在进行预测时还应考虑到发动机的变化以及新的安全措施和规则的引入。