机器学习之初步认识

     这段时间,我系统地学习了机器学习,由于涉及到很多的高数、最优化、凸集、线性代数和概率论等方面知识,确实是强大的数学在做支撑。

     学习计划上继续坚持:按部就班、按照月计划、周计划和天计划进行,每天进行总结分析。

    学习方法上继续坚持:自己阅读、查阅资料、视频学习、深入研究等相结合。

    主要有三点体会:

          (1)公式中,一般都是矩阵表示变量形式,复杂的理论无外乎都涉及到矩阵论为基础,改变以往看到变量就是数的狭隘观点。概率论中:中心极限定律、正态分布、贝叶斯公式等是基本。最优化理论是算法迭代的评价方法。数据是分析的前提,什么样的数据,采取什么样的模型,有那些假设也是一个数据专家的能力体现。

          (2)大数据思路,就是考虑大样本,讲概率,讲相关性,不讲绝对,讲相对。在计算中,距离产生美,距离是样本之间同质的基本衡量标准。绝大部分变换都给予在向量空间中变换。所以,矩阵变换体现得淋漓尽致。

             (3)导数是计算最优化问题的基础,损失函数、PCA求方差最大等都是建立在导数基础上,且是对矩阵多个变量进行求导,一次还是二次都是常见的。

             (4) 决策树、CART树回归、随机森林都是建立在树结构之上,建立在规则之上。

             (5)  最难的数学理论无外乎:SVM算法前前后后、SVD、PCA涉及到高深的矩阵变换,当然树的理论理解方便,但设计、构造、实现都比较苦难。

                 以上仅仅从算法实现角度看这些问题,因为真正理解算法本质,未来才能改进算法,真正理解如何正确高效地使用算法。

猜你喜欢

转载自blog.csdn.net/weixin_42039090/article/details/80533218