背景信息
当前,足球运动是最受欢迎的运动之一(也可以说没有之一)。在此万受瞩目的运动下,我打算针对足球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容:
- 左撇子适合踢足球吗?
- 哪个的俱乐部 / 国家拥有综合能力更好的球员(top10)?
- 足球运动员的号码是否与位置相关?
- 足球运动员的身价与薪水,违约金是否相关?
- 哪些技能会对足球运动员的综合能力造成较大的影响?
- 足球运动员的年龄与能力具有怎样的关联?
任务说明
依据收集到的2019年现役运动员的数据集,针对众多的足球运动员进行分析与统计,从而能够发现一些关于足球运动员的特征,解开之前的谜题。
数据集描述
数据集包含的是2019年现役的足球运动员。
列名含义如下:
数据清洗
对原始数据进行缺失值、异常值、重复值的处理。
左撇子适合踢足球吗?
首先从球员数量上进行一下统计,再从球员综合能力上进行衡量,可以看出虽然左撇子数量比右撇子少得多,但是左撇子一样适合踢足球。
由于在综合能力上体现不明显,我们现在通过每个位置,进行更细致的分析。
从结果可以清晰得知,左脚选手更适合RW(右边锋)的位置。
哪个的俱乐部 / 国家拥有综合能力更好的球员(top10)?
由于每个俱乐部/国家队人数不一,为了统计的客观性,只考虑人数达到一定规模的俱乐部/国家。
从这两张表可以看出:
知名俱乐部平均能力更好的球员,但并非球员平均能力越好,球队的成绩就越好。
一些知名足球国家,在球员的平均能力上可能并没有非常靠前,只是因为足球运动员较多,进而个别球员较知名而已。
足球运动员号码是否与位置相关?
足球运动员的号码与位置是相关的,例如,1号通常都是守门员,9号通常是中锋等。
身价与薪水,违约金是否相关?
因为身价、工资与违约金的单位既有M,也有K,我们统一K单位,同时,将类型转换为数值类型,便于统计。
转换成
足球运动员的身价与其薪水是紧密关联的,尤其是违约金,而与身高的关联不大。
哪些指标对综合评分的影响较大?
Reactions(反应)与Composure(沉着)两项技能对总分的影响最大。
年龄与评分具有怎样的关系?
首先直接对整个数据集做年龄与评分关系散点图,得到杂乱的散点,不能看出年龄与评分的关系。
所以先对球员的年龄进行分段,将连续值变成离散值,分别为"弱冠之年"(20岁以前), "而立之年"(20~30岁),"不惑之年"(30~40岁), "知天命"(40岁以后),再整合得到每个年龄段的平均分。
可以看到,随着年龄的增长,球员得到更多的锻炼与经验,总体能力提升,但三十几岁之后,由于体力限制,总体能力下降。
总结
- 左撇子相对于右撇子来说,并无明显劣势,其更适合右边锋的位置。
- 知名俱乐部平均能力更好的球员,但并非球员平均能力越好,球队的成绩就越好。
- 一些知名足球国家,在球员的平均能力上可能并没有非常靠前,只是因为足球运动员较多,进而个别球员较知名而已。
- 足球运动员的号码与位置是相关的,例如,1号通常都是守门员,9号通常是中锋等。
- 足球运动员的身价与其薪水是紧密关联的,尤其是违约金,与身高的关联不大。
- Reactions(反应)与Composure(沉着)两项技能对总分的影响最大。
- 随着年龄的增长,球员得到更多的锻炼与经验,总体能力提升,但三十几岁之后,由于体力限制,总体能力下降。