基于Python的足球团队合作评价模型及英文论文

2020 美赛 F 奖论文(一):摘要、绪论和模型准备

2020 美赛 F 奖论文(二)︰传球网络模型(PNM)的建立和影响因子分析

2020 美塞 F 奖论文(三)∶ 足球团队指标和基于机器学习的球队表现预测

2020 美赛 F 奖论文(四)︰模拟退火算法驱动的结构策略设计

2020 美赛 F 奖论文(五)︰结合团队动力学的模型拓展、模型评价

2020 美赛 F 奖论文(一):摘要、绪论和模型准备

足球团队合作评价模型

本文利用图论,概率论和微积分的方法,利用数据分析和建立机器学习模型,为足球教练的阵容安排和球员训练提供策略。

Firstly,根据图论,在球员之间建立传球网络,并建立单次传球的价值评价模型,用于评价两两球员间传球的配合程度,即传球网络的边权。建立在一定时间范围内所有参与比赛的 N 个球员的邻接矩阵,通过以 M 个点的子完全图边权之和为排序关键字找出若干组优秀的 M 元组合。同时建立基于时间尺度的价值模型,用于评价时间对传球效率的影响。

Secondly,我们将反映成功团队合作的绩效指标划分为静态指标和动态指标。静态指标包括球员位置安排和球队阵型(line-up),我们建立球员赛季热点模型和球员分布模型。动态指标包括 opponents,side,coach,passes,defence,attack and fail 等。对经过数据清洗动态指标之间通过可视化进行相关性分析后,以净胜球分类作为比赛样本标签,以随机森林分类器作为机器学习的模型,用网格搜索调优参数,建立动态指标评价模型,进行交叉验证,达到了 80% 的准确率。

Thirdly,通过上述中建立的模型进行观察分析,我们着重研究静态指标对球队的胜利起到的关键作用,综合考虑球员位置和技术数据评价模型,建立不同球员在不同位置价值评价模型。通过模拟退火算法,优化 11 人排列组合的考虑,在局部最优解的父级搜索树进行搜索全局最优解,最终给出价值最优的首发阵容阵型图。此外我们还考虑以下三个次要影响因素:球员间默契度,主客场影响和教练安排。给教练提出的综合建议。

Finally,我们用哈士奇球队的案例来解释群体动力学。并用哈士奇球队建立模型得到的结论来说明如何设计更有效的团队,并对团队绩效指标进行补充。

1 绪论 Introduction

1.1 背景 Background

Football has a long history. It has been loved all over the world since it was popularized. Football can be considered as the most popular sports in the world. Football, a seemingly simple sport, contains the secrets of individual ability and team cooperation. With the development of the times and the progress of science and technology, football players and coaches continue to improve in skills, showing the audience wonderful matches. As we all know, a wonderful football match is inseparable from the contributions of players and teams. By studying the actions of everyone in the team, coordinating the team relationship, reasonably arranging the minutes and line-up, we can score best.

1.2 问题重述 Problem Restatement

足球赛是一项老少皆宜的运动,自从其纳入国际赛事以来,人们就创造出各种各样的方法来评价整个比赛和整个赛季的团队动态,来帮助确定下个赛季可以改善团队合作的具体策略。我们需要使用 ICM 团队提供的数据建立模型来解决以下四个问题。

将每一个球员当做一个节点,创建传球网络来识别二元配置,三元配置和 多元配置。我们需要建立在传球网络下,单次传球的价值评价模型,以及时间结构指标的传球总数评价模型。
确定反映成功团队合作的绩效指标,我们需要考虑静态指标和动态指标。建立每个绩效指标对成功团队合作影响的模型,并用一个模型来囊括这四个子模型。
通过对问题1,2中建立的模型的观察分析,告诉教练什么样的结构策略适用于哈士奇球队。用模型分析的结果为教练提高球队的下个赛季的成功率给出建议。
用哈士奇球队的案例来解释群体动力学理论,用哈士奇球队建立模型得到的结论来说明如何设计更有效的团队,并对团队绩效指标进行补充。

2 模型准备 Preparation of the Models

2.1 预处理工具 Processing Tools

Tool Uses
Visual Studio Code 1.42 Coding, Visualization
IPython 3.6.8 Run Code
Visio Design Flowchart
Excel Arrange Dataset
GitHub Synchronization, Storing
MindMaster Plot Mind Map

2.2 数据清洗 Data Cleaning

若空白则为上一个相同

Data Name Processing Type Feature Name
Side Map + Dummy Side_1, Side_0
Coach Dummy Coach_1, Coach_2, Coach_3
Opponent Strength Analysis Oppo
Shots Count Attack
Dribbles
Touch
Corner
Offside
Tackle Count Defence
Dispossess
Aerial Won
Interception
Clearance
Blocks
Saves
Passes Count Pass
Possession Search + Integrate
Pass Success Calculate
Foul Count Fail
Loss of Possession Search + Count

2020 美赛 F 奖论文(二):传球网络模型(PNM)的建立和影响因子分析

3 传球网络模型(PNM)的建立和影响因子分析

为了构造结构化的传球网络,用来分析球员间传球配合的默契程度,应在不同多维度、状态变化情况下进行分析。例如从微观上两两球员之间的行为,到宏观上多个球员之间的行为;以及时间尺度从比赛中的单位时刻到整个赛季。

3.1 传球评价指标(PEI)

两人传球评价指数 PassValue ( p i , p j ) \text{PassValue}(p_{i}, p_{j}) PassValue(pi,pj),用于评价两人配合程度。在一场球赛中,宏观来看,球员相对于球场可以视为一个个节点,球场可以视为一个网络,每一次传球可以视为节点之间的连线。以两人之间每次传球累计评价 P assValue ( p i , p j ) P\text{assValue}\left( p_{i},\ p_{j} \right) PassValue(pi, pj)作为 2 人的传球评价指数。在多人传球评价体系中,将三个节点连接成闭合环路,边权之和即为 3 人传球评价指数。

PassValue ( p i , p j , p k ) = EdgeValue ( i , j ) + EdgeValue ( i , k ) + E dgeValue ( j , k )

通过生活经验和数据挖掘所发现的规律可以构建 PEI 计算模型:

1 Weight table of pass types:

α i is constant for i in Pass Types .

2 计算传球或接球时分别受到的防守压力 DefPress ( p i )

DefPress ( p i ) = 1 1/2 tan [ 11/6 × ( x p i/100 0.6 ) ]

其中,x 为球员到对方球门的横坐标,与受到的防守压力成负相关

3 两人之间的边权 EdgeValue ( i , j ),即单次传球评价,为此次传球类型的权重乘以防守压力加权平均数,量化为以下公式。

根据这一传球评价指数模型,统计出一定时间范围内所有参与比赛的 N N N 个球员的邻接矩阵数据 Arr \text{Arr} Arr。由 Arr [ i , j ] = P assValue ( p i , p j ) 得每两人之间所有传球价值评价总和图:

3.2 传球网络模型构建及识别网络模式

网络上两两球员之间的联系,宏观上体现为球员间传球的评价总和。筛选两人传球评价超过一定阈值的边,运用图论的方法选择性剔除交叉边,将基于传球评价指数构建的 line-up 传球网络可视化,用线的深浅表示 PassValue ( p i , p j ) :

从这一模型的可视化中,我们可以直观地分析传球配合频繁和默契地球员,还可以直观的看出主力球员中多人传球配合的组合。

N Players Score
2 M1 F2 342.4
M1 M3 338.6
D5 F2 213.4
3 M1 M3 F2 816.1
D5 M1 F2 727.8
4 D5 M1 M3 F2 1113.5

3.3 时间尺度上传球状态波动

传球频率会在时间尺度上进行波动。定义 Passe s ( 0 , t )

并以 Passes(0,t)作为球队实时状态的指标。球赛刚开始时,球员身体还未 warm up,导致传球概率密度较小,5—10 分钟过后,传球效率逐渐提高并大致趋于稳定,即:

随着时间推移,球员们体力消耗,传球密度降低,即传球数量的增速减缓(虽然一场球赛中成功传球次数仍在增加,但传球失败频率开始增加),此后传球密度呈现下降趋势,即:

纵观整个赛季中 38 场球赛球员们的传球频率密度,整体上看可以与单场球赛所展示出的频率密度变化趋势相同。以时间为横坐标,成功传球密度为纵坐标作图:

总体来说,传球的密度在时间尺度上相对稳定。若使用 Monte Carlo 方法对每次传球进行模拟,设定在上一次传球后下一次传球还需要的时间概率分布服从 N(θ,1),其中 θ 为统计的平均传球间隔时间,则在样本规模 N 满足 N≈2 时会近似与左图的分布;随着样本规模增加,当满足 N>4 后则会近似与右图的分布。因此我们可以认为每一个时间点发生传球事件的概率服从 N(0,1)。

2020 美赛 F 奖论文(三):足球团队指标和基于机器学习的球队表现预测

4 足球团队指标和基于机器学习的球队表现预测

足球队中成功团队合作有许多指标,通过数据分析和实际经验,我们主要考虑以下 indicators:静态指标和动态指标。首先,我们使用 Goal(Gi)
评价一场比赛的球队整体发挥,作为单场比赛表现标签,定义 Goal(Gi):

4.1 静态指标

为了考虑球员位置分布,我们采出每个球员在整个赛季中的位置坐标,做出球员运动位置的热点图,热力图每个点的值定义如下:

颜色越深则表示出现在此处的频率较大,越浅表示出现的频率越小。经过 Heatmappk[i,j]的计算,主力 11 人的位置热点图如下:

在一场球赛中,球队的阵型对团队协作起到重要作用,我们考虑在一场球赛中球员阵型,我们采取每一场比赛中每一位球员的运动坐标,采用坐标对时间积分的方法,找出每场球赛中,每一位球员平均坐标。将在数据中可以获取(球员出现在 Origin/Destination)的时间点作为新的横坐标,X 或 Y 坐标作为新的纵坐标,得出函数 X(t) and Y(t)。我们近似认为在任意两个有记录的时间点,球员在 X 或 Y 方向上匀速移动,这样就将离散型的数据集转换为了连续性的数据集(每个)。因此平均坐标,以 X 坐标为例,Y 坐标同理:

将这 11 位球员的位置标在图中绘制出每场球赛的阵型图,部分阵型图如下:

4.2 动态指标

动态指标包括了球队人为影响因素和在比赛里产生的技术数据:人为影响因素包括了教练、对手水平、主客场,技术数据包括了射门、传球、解围在内的各种 events 统计。原始的数据以单个事件作为样本的单位,而我们将其分类统计为以一场比赛为单位的动态类型数据,通过观察以新结构存储的数据,提取出其中的若干特征信息。

4.2.1 数据清洗和特征工程

在特征工程中,为了降低特征的维度,不仅使用 PCA 筛选并剔除影响不显著的特征,还可以使用 ChiMerge 这一特征分箱的方法,将 EventSubTypes 分为传球,进攻,防守和 Fail 四个方面,与教练、主客场、对手水平一起作为一场比赛的特征。通过标准化、哑变量、结合分析等方法处理统计后的数据来量化比赛的特征:

(1)统计型数据 Statistical data

(2)多事件结合分析型数据 Multi-event combined analysis data

(3)One-Hot 编码哑变量数据 One-Hot encoded dummy variable data

4.2.2 可视化分析

分析 Side(Gi) 对 于 对于 对于 Goal(Gi) and Ratings(Gi)影响:

Side(Gi)=0 时 Goal(Gi)=0 or 1 的分布更多,Ratings(Gi)分布更高,因此主场表现结果整体上比客场要好。

分析不同 Coach 的执教水平以及对于球队 Attack(Gi),Defence(Gi),Passes(Gi) and Fail(Gi)的指导成效:



从 boxen 图我们可以看出,在 Coach 3 指导下,球队 Goal(Gi),Attack(Gi)等数据较好,其次是 Coach 2 和 Coach 1。我们还可以得出教练们的执教风格,例如:教练 1 更具侵略性,防守就显得平庸;教练 2 强调强硬防守;教练 3 则较为平衡,战绩最佳。

分析 Attack(Gi)、Passes(Gi)对于 Goal(Gi)的贡献:

从图中我们可以看出,在不同净胜球数下,进攻和传球大体上为线性相关,斜率为正。

Goal(Gi)与 Passes(Gi) and Attack(Gi)呈正相关,且分布越集中, Passes(Gi) and Attack(Gi)的方差较小。我们可以得出结论:在一场球赛乃至整个赛季, Goal(Gi)越多,大概率有着更高的 Passes(Gi) and Attack(Gi)。

分析 Defence(Gi)、Fail(Gi)对于 Goal(Gi)的贡献:

Goal(Gi)与 Defence(Gi)呈正相关,与 ∣Fail(Gi)∣ 呈负相关,且分布越集中, Defence(Gi)and Fail(Gi)的方差较小。观察发现:图 2 左 1 的点分布在下方,因此防守不好会导致输球;右 1 左半边没有点,因此期望赢球则失误不能多。

以 Attack(Gi),Defence(Gi),Passes(Gi)作为考察球队整体表现的 positive 指标,结合 Passes(Gi),Oppo(Gi)指标进行多角度分析:

从左图中我们可以看出数据重心分布在右下角,认为整个赛季上 Attack(Gi)(进攻表现)显著优于 Defence(Gi)(防守表现)。从右图中我们可以看出不论是在主场还是客场,Passes(Gi)∝[αOppo(Gi)1+β],但主场更可能有较小提升;结论是对手水平越高,我方传球率越低。

综合所有处理得到的特征,通过 Pearson 相关系数的计算来估计出变量间两两特征相关性。

令矩阵 Arr[i,j]=rij,得:

4.2.3 model 建立 and 训练

我们以 Goal(Gi)作为每场比赛评价标签,希望学习后的模型能够基于处理后的数据对比赛进行分类,对应到 Goal(Gi)的标签。由于 M=10 个特征数量较多,且与标签相关性不一,不宜采用线性模型进行分类;且样本数据 N=38 数量极少,在尝试一些深度学习算法时容易有较大偏差。综上,我们选择随机森林模型建立 Goal(Gi)标签分类器。

随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。对于很多种资料,它可以产生高准确度的分类器;它可以在决定类别时,评估变数的重要性;在建造森林时,它可以在内部对于一般化后的误差产生不偏差的估计。建立随机森林分类器 Random
Forest Classifier 的方法如下:

1 输入特征数目 m m m,用于确定决策树上一个节点的决策结果 m < M 2 m < \sqrt[2]{M} m<2M;

2 利用 Bootstrap 取样,从 N N N 个训练用例中以有放回抽样的方式,取样 N N N 次,形成一个训练集,并用未抽到的用例作预测,评估其误差;

3 对于每一个节点,随机选择 m 个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这 m 个特征,计算其最佳的分裂方式;

4 每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后会被采用。

随机森林分类器的训练后,使用网格搜索 grid search 进行参数调优,选定

作为参数,利用 K 折交叉验证验计算其 accuracy score,用于评估模型准确率。

经过一定的数据调整和多次模拟结果,平均情况下得分为 65.8%,最好的数据情况下可以达到 8090% 的得分,在样本规模仅有 N=38 的情况下,我们可以接受这一模型通过动态指标对比赛净胜球情况进行预测的准确率。

2020 美赛 F 奖论文(四):模拟退火算法驱动的结构策略设计

5 模拟退火算法驱动的结构策略设计

结构策略影响着成功的团队合作,作为一名成功的教练应该具备较好的统筹规划,协调合作,人员安排能力。我们认为,具体的结构策略应该最主要体现在以下两个个方面:球员位置安排和球队阵型。此外,还应考虑球员间默契度,主客场影响,教练安排。

5.1 位置评价工程(PEE)

在考虑球员位置安排时,需要计算守门员,前锋,中场,后卫四个位置不同球员的贡献值。我们在数据集中采集哈士奇球队 30 位球员的 EventType,并以其为横轴,球员编号为纵轴,统计出每个球员在整个赛季中每个 EventType 次数,用颜色的深浅来表示次数的多少,以下分别为前锋,中场和后卫的 EventTypes 统计图:

由以上四个图,我们可以看出 F 中贡献最大的是 F2,其次是 F1,F6,F5,F4。M 中贡献最大的是 M1,其次是 M3,M4,M6。D 中贡献最大的是 D1,其次是 D3,D5,D4,D2,D7,D6,D8。

我们希望能有实际的模型来对不同球员球员在不同位置表现进行量化评价。此时需要结合实际知识,分析不同位置各自的重要数据,通过不同 EventTypes 权重分配、结合球员各种能力 performance,进行计算,作为 evaluation of 球队的 29 位球员(除守门员)分别在 G,F,M 位置上的表现情况。下图中,颜色越红表示越适合这个位置,反之越蓝则表示越不适合。

5.2 基于 SA 算法优化排列组合

我们分析整个赛季 38 场比赛中主力阵容/首发阵容 line-up,希望建立模型为教练建议最好的球队阵容该模型的目标是要找到一个最优的有序组合,使场上 11 人在各自位置的能力之和最大。把场上 11 个位置有序排列,用 11 位的 30 进制格雷码表示当前状态;例如格雷码 0A1GRD739KI 表示 11 个位置依次有第 0,10,1,16,26,13,7,3,9,11,18 号球员。在搜索树极为庞大、算力资源有限的情况下,我们选择模拟退火算法。模拟退火算法主要优点之一就是能以一定的概率接受目标函数值不太好的状态,且在迭代的过程中不断能够接受使目标函数向好的方向前进的解。模拟退火算法的具体步骤如下:

1 给定冷却进度表参数及迭代初始解 x0.以及 f(x0),其中冷却进度表参数包括:控制参数 T 的初值 T0,衰减函数,终值以及链长度 Lk;

2 参数 T=T(k)时,按照如下过程作 Lk 次试探搜索:

根据当前解 Xk的性质,产生一个随机偏移量 m,从而得到一个当前解邻域的新的试探点Xk;
产生一个在(0,1)区间上均匀分布的随机数 θ,计算出在给定当前迭代点Xk和温度Tk下与接受准则相对应的转移概率P:

试探搜索小于Lk次,返回步骤1,否则进入步骤3;

3 根据给定的温度衰减函数产生新的温度控制参数 Tk+1,及链长度 Lk+1,转入步骤 2,进入下一温度点的平衡点寻优。

在实际试探搜索中,我们很可能现入局部最优,需要进行判定以退出。当前解的优化程度小于当前最优解的优化程度的时候,新解被接受的概率为 100%,而当温度足够低的时候,较差解被接受的概率趋近于 0。依据最近的 K 次搜索中都没有优化程度更高的解出现这一特征,可以根据具体问题确定阐值而后判定搜索己经进入局部最优。

5.3 其他结构策略因素

考虑完主要策略后,我们考虑以下四个次要影响因素:球员间默契度,主客场影响和教练安排。

首先,选择默契度高的小分队有利于提高传球和进球的效率。默契度高的小组往往配合能力较强,有助于比赛的成功。传球效率较高的球员往往适应能力较强,与其他球员的配合度也较好。

主客场因素也是必须要考虑的,有的球员适应性较强,在主场和客场都能较好的发挥出原有的水平,而有些适应性较差的球员只在主场发挥出原有的水平,环境对他的表现有较大的影响。那么在主客场时,应该安排不同的球员上场。

最后,教练安排上,整个赛季中,Coach 1,Coach 2,Coach 3,分别指导了 9,5,24 场比赛,通过我们在第二题中的数据分析也可得出,Coach 3 的水平较高。

5.4 结构性策略总结

纵观整个模型,为了在下个赛季中提高球队成功率,我们团队给出的建议是,球队聘用 Coach
3 作为球队主教练,采用 442 的 line-up,将 F1,F6,F2,M3,M1,M6,D3,D1,D2,D5 作为主力球员,命名该阵容为 line-up0,他们的位置按下图安排:

根据赛季数据的评价,F2 球员作为一名前锋,拥有很强中场的能力,在尝试将他安排在中场时取得了显著的新最优解,这说明每个人的任一位置评价较为重要,侧面指明我们的模型因素考虑完善。

综上,该阵型的个人能力总分为 PersonalScore(lineup0)=94.43,团队配合得分为 CoordinationScore(lineup0)=90.17,按照

进行加权平均,最后得到综合评分为 TotalScore(lineup0)=93.152。实际比赛中与此相似的阵型取得很好的战果,也验了我们的评价模型和模拟退火算法的可行性和准确性。

2020 美赛 F 奖论文(五):结合团队动力学的模型拓展、模型评价

6 结合团队动力学的模型拓展

在对于哈士奇球队的研究中,我们了解到一些影响成功团队合作的因素,例如传球网络、个人能力、教练等等。这些因素可以和团队动力学进行联系,用来分析为什么这些足球方面的因素对球队的表现有贡献。以及我们可以探索考虑什么样的因素可以补充到我们解释优秀团体,并推广到社会上各种各样的团体。

6.1 团体动力学与足球队

团体动力学主要包括五个方面的内容:团体内聚力,群体压力和群体标准,个人动机和群体目标,领导与群体性能以及群体的结构性。

6.1.1 群体内聚力 group cohesiveness

群体内聚力可以指球队想赢的信念,群体压力是来自外界的压力。提高群体内聚力是提高球队赢球信念的良性循环。责任性行为体现在每个球员各司其职。成员之间的相互影响表现在球员间的相互鼓励,相互进步。

Huskies 在比赛中承担着对手的压力,同时也充满着求胜的斗志。在 Huskies 球队的数据分析中,每个人场均 acceleration、跑动距离和热点图的有效面积等数据都可以反映每个人在球场上的态度和努力。在落后、平局、领先的情况下,团队承受着不同的外在压力,球员反映态度的数据也会波动,若能在平局和落后的情况下依然有着不逊领先时候的 positive 数据,那我们可以认为群体内聚力强大。

6.1.2 群体标准和群体压力 Group standard and Group pressure

群体标准可以帮助球队和球员更有压迫感,相互竞争是提高个人能力,由此观之,适当的群体压力是有必要的,有竞争才会有发展。

在 Huskies 球队中存在出场时间的差异,核心球员和边缘球员的出场时间差距巨大,导致了边缘球员在球队中会受到核心球员技术、地位上的压力,但这也激励了他们努力获得出场时间来证明自己。可以分析每个球员每一场比赛评价的趋势,尤其是不能获得稳定出场时间的球员们,他们的评价若能在有限的出场中得到一定提升,则可以认为对内竞争带来的压力使他们进步。

6.1.3 个人动机和群体目标 Individual motivation and group goals

群体目标影响群体行为,当球队的目标和球员的目标达成一致时,球员会表现出最为强烈的求胜动机,努力为进球而拼搏。

球队每个位置的球员有不同的职责,而胜利则是所有球员都较为完美地完成了自己的任务。因此每个人在胜利的目标上是相同的,而且每个人对自己的职责存在一定的期望,当所有人同时为着自己任务完成的期望而努力,群体目标便达成一致。

6.1.4 领导与群体性能 Leadership and group performance

在球队中,领导者有两种,可以是为球员提供训练,赛前指导和赛后总结的教练,也可以是在赛场上鼓舞士气,树立榜样和调度指挥的队长。领导者的能力会影响球队的发挥和球队的进步。此外,教练和队长对球员的关照可以很好地鼓提高队内活力。

6.1.5 群体的结构性 Group structure

当一个球队在球员关系稳定时,拥有了一定的球队结构。稳定的结构有利于培养球员间默契,从而有更大的概率赢得球赛。可以认为团队不同高低的地位的人数服从上三角形型分布,而若地位极差太大或太小,都不利于团队的稳定性。此外,若球队某一位置竞争极大,而其他位置竞争极小,则会产生结构不平衡的问题,引发结构变化。

6.2 成功团队合作其他影响因素 Other influence factor of successful teamwork

团队之间还需要有密切、畅通的信息交流网。国际化球队需要确保球员之间的语言交流,能够在球场内外沟通顺畅;此外还要多进行联谊活动,提升队内融洽氛围。这样才能在比赛时做到有效的交流和配合。

领导和每一个人都应该尊重他人与自己间存在的不同,在保持群体目标和内聚力的情况下,通过接受人们之间的差异来改善团队氛围。

管理层要能清晰地认识团队内部的情况,并且有能力为现状变化做调整。

7 评价

7.1 优势 Strength

传球评价指标 PEI 的设计和传球网络模型 PNM 建立紧密相关。PEI 综合考虑了每一次传球的多个方面,量化了传球的好坏程度,能缩小与实际情况误差和方差;传球网络模型以图论作为基础,直观描述配合默契程度,有助于多元组合的搜索,并且可视化的效果能突出默契组合。

热力图生成模型对于离散型数据的近似连续化有很强的兼容性,能够应对坐标数据过少或稀疏的情况,基于可视化的数据分析球员站位与实际情况相符;对于 events 数据的清洗有效规避了数据异常和缺失所带来的影响,建立随机森林分类器模型在比赛样本数量仅为 38 的情况下不容易过拟合或偏差过大,参数调优后最高达到 80% 的准确率足以对比赛大致结果进行有效预测,what means 该模型可以基于近期数据为未来比赛做出预测并且给教练的训练和 line-up 作为参考。

将教练的静态结构策略转化为最优排列组合问题;大规模数据支持了评价指标的维度增加,降低了评价球员位置能力值偏差的期望;模拟退火算法在算力有限的情况下,依据实际经验设置启发策略,运用无法精准的个人能力评价指标来寻得 11 人球员排列组合的局部最优解,在准确度期望一定的情况下,可以在阈值范围内接受它为全局最优解。

上述的模型能够很容易地对应到 group dynamics 中的理论关键点,基于已有影响因素的额外方面也具有很大实际意义。

7.2 缺陷 Weakness

在模型中超参数较多,模型的参数调优有着极大的挑战。

每个时刻有数据的球员较少,对球员无球能力的考查无法进行,且难以从整体的站位和阵型评价进攻或防守。

输入随机森林分类器模型的比赛样本过少,训练结果波动较大。

模拟退火算法得出的最佳阵容仅能确保为局部最优解,不能保证为全局最优解。

猜你喜欢

转载自blog.csdn.net/newlw/article/details/131257696
今日推荐