实训第一周

第一天
 获取数据Csv文件
 分析数据预判胜利的队伍有多大的获胜概率
 比赛情况比赛特征+ELO等级分
 机器学习判断胜利预测

第二天：
阅读代码，记录基本流程，理顺资料1的思路
 关于最好的结果：能够更准确地验证2018年（测试集）的，准确率>70%，能够准确预测2019年，准确率>70
 问题1：同样的数据，同样的模型，如何适应差别很大的两年？
Maybe可以支持球员的调整（输入球员调整，例如<詹姆斯，湖人>，对数据表进行修改），在此基础之上预测
 问题2：数据组成是球队往年数据和球员，具体如何安排特征向量？是进行不同权重的组合，还是？
其实往年数据就是球员的整体数据，球员的新信息应该是变动（伤病，跳槽）带来的，应该是球员按照一定标准打分，再加入作为一个和ELO并列的向量/或者按一定的标准和ELO按不同权重组合得到新的数值进行回归。
 问题3：一定要用回归？用分类的方法可以吗
母鸡要查一查

第三天：无进展

第四天：
 自顶向下需求列举

 根据常规赛预测季后赛八支球队
 数据
 需要数据：
 三年常规赛：胜负数据包括胜负（got）,（ELO需要三个表，自己，对手，综合）（not），可验证数据（not）
 球员个人数据：各项指标
 数据处理：
选择数据的组合运用方式
 建模

 根据季后赛预测前八排名

 AI基本输出
请问本赛季是否有球员变动（伤病/改签）？y/n
请输入伤病的球员数：N
请输入伤病的球员名：XX YY
请输入改签的球员数：M
请输入改签的球员名和新签的球队：ZZ ABC
收到修改数据，AI现在开始预测
进入季后赛的东部前八是：
进入季后赛的西部前八是：
AI预测这十六支队伍的最后排名和可能性是：

整理自己的思路，确定影响最大的要素，列出目前所有的可能性（数据选取，模型选择）

 问题1：分类和回归在什么情况下使用，最大的区别是什么？各种分类方法的适合使用在什么环境。（建模问题）
分类解决离散问题，回归解决连续问题。


第五天：
搜集资料，扩充思路，找到更多的方法
开始写最基本的程序原型，写好之后调整，讨论，修改

总结：这一周整体来说进展很慢，反思一下，应该是工作方式有问题。早上来的晚，有效时间不到三个小时，中间没有活动和思维转换，效率很低。下午也是如此，七个小时的时间其实非常毛，强度很小。其实这个项目，一周足矣。关键是如何保证效率，一直问自己做到什么，能学到什么，耗费时间并不能达到目的，也不能学到东西。

关键词：了解背景，效率低，未开动，没有分工

猜你喜欢