机器学习模型
1. 机器学习介绍
1.1 机器学习的概念
1.2 机器学习的框架
- 模型函数:数学工具
- 目标函数:对模型误差建模
目标函数 = 误差和 + 惩罚项
(结构风险) - 优化算法:求解目标函数的参数
2. 分类和回归:有监督学习
我们根据模型训练方式的不同,可以将机器学习的模型分为有监督学习和无监督学习两大类。而根据学习目标的不同,有监督的学习可以分为分类和回归两类方法。
2.1 线性回归
2.2 逻辑回归
2.3 支持向量机
2.4 决策树
2.5 朴素贝叶斯
3. 聚类:无监督学习
聚类距离的度量包括四个方法:
基于partition、基于hieratical、基于density和基于model,
但主最主要的是partition baesed 和 model based(另外两者都很慢),这两者典型例子分别是K-means和GMM。
3.1 K-means
机器学习算法/模型——有监督到无监督(聚类):由 KNN 到 K-menas
3.2 高斯混合模型(GMM)
高斯混合模型是基于高维高斯密度函数的一种聚类方法。假设一共有 个点要聚类,服从某种分布。我们要找到一组参数使得生成这些数据点的概率最大。
4. 降维:无监督学习
体会了机器学习的基本回归,分类,聚类到底是怎么回事后,该到了分析喂给这些算法的数据了,我们在之前介绍这些算法时,往往用到的数据都是已经预处理过的,比如做了归一化处理,做了降维处理等等。数据预处理做的好与坏,对我们最终问题的求解也是至关重要的,因此也是机器学习学习中的重要一个环节。
机器学习领域里讲的降维是指:采用某种映射方法,将原本高维空间中的数据样本映射到低维空间中。
降维的本质是学习一个映射函数 y=f(x),其中 x 表示原始的高维数据,y 表示映射后的低维数据。
3.1 主成分分析(PCA)
机器学习算法/模型——有监督到无监督(降维)主成分分析(PCA)
矩阵分解 PCA
奇异值分解(SVD)PCA
5. 集成学习
6. 阶段性总结
学习阶段总结:
机器学习模型/算法—— 阶段性总结(1)模型框架
机器学习模型/算法—— 阶段性总结(2)关键概念/技术
机器学习算法/模型—— 阶段性总结(3)面试考点
机器学习算法/模型——阶段性总结(4)更高层次
更深层次的理解:
假设:假设函数
模型泛化:偏差、方差、噪声
”距离“、”范数“和范数正则化
线性模型小结:还分不清线性回归和线性分类模型?
生成式模型还是判别式模型?
参数学习:LR 与 SVM的区别?
线性可分:线性(二分类)模型
分类损失函数(margin 损失函数)——以二分类为例
目标函数:经验损失(损失函数)和结构化损失(正则项)都做了些什么?
新知识点记录:
2020 机器学习知识点记录