大数据技术的十个关键点

第一课:
目前数据分析主流的是R、python,相信大部分不会用C++和julia这两个和java的那套体系的工程量太大,并且大部分都是业务逻辑写改删查抄。
C语言确实有点难,他和汇编类似,粒度到操作符级别,但是我认为编码必须学C++这个是一个编程基础。也是理解底层的基本功。
第二课:
线性回归、多元回归、多项式回归、非线性回归(倒数回归、对数回归)、多重共线性
第三课:
岭回归、第一课:概述与工具介绍、机器学习模型、机器学习的路线图、Python(含Scikit-learn)、R、MATLAB、Weka
第二课:线性回归、多元回归、多项式回归、非线性回归(含倒数模型、对数模型等)、多重共线性、R及Python回归实例
第三课:岭回归与LASSO、过拟合与正则化、TensorFlow初步、逻辑回归、分类任务及其评价(Accuracy, Precison, Recall, F1-Score)、基于Python的鸢尾花分类器实例
第四课:较大熵模型(Softmax)、感知机算法、TensorFlow手写数字识别实例
第五课:支持向量机(凸优化及KKT条件)、VC维、Python及MATLAB鸢尾花分类实例
第六课:聚类算法之k-means、k-median与期望较大化算法(EM)、Python及R聚类实例
第七课:密度聚类DBSCAN、kNN(含kd-tree、quad-tree)、Python及MATLAB实例
第八课:决策树1(Hunt, ID3)、Gini Index、信息增益、分类误差
第九课:决策树2(C4.5,CART)、Weka的使用
第十课:随机森林、Bootstrap与AdaBoost

猜你喜欢

转载自blog.csdn.net/yunxinan/article/details/85081890