1. 机器学习介绍

1.1 机器学习的概念

机器学习介绍
 机器学习介绍（进阶）

1.2 机器学习的框架

模型函数：数学工具
目标函数：对模型误差建模
目标函数 = 误差和 + 惩罚项
（结构风险）
优化算法：求解目标函数的参数

2. 分类和回归：有监督学习

我们根据模型训练方式的不同，可以将机器学习的模型分为有监督学习和无监督学习两大类。而根据学习目标的不同，有监督的学习可以分为分类和回归两类方法。

2.1 线性回归

机器学习算法/模型——线性回归

2.2 逻辑回归

机器学习算法/模型——逻辑回归

2.3 支持向量机

机器学习算法/模型——支持向量机

2.4 决策树

机器学习算法/模型——决策树

2.5 朴素贝叶斯

机器学习算法/模型——朴素贝叶斯分类

3. 聚类：无监督学习

聚类距离的度量包括四个方法：
基于partition、基于hieratical、基于density和基于model，
但主最主要的是partition baesed 和 model based（另外两者都很慢），这两者典型例子分别是K-means和GMM。

3.1 K-means

机器学习算法/模型——有监督到无监督（聚类）：由 KNN 到 K-menas

3.2 高斯混合模型（GMM）

高斯混合模型是基于高维高斯密度函数的一种聚类方法。假设一共有个点要聚类,服从某种分布。我们要找到一组参数使得生成这些数据点的概率最大。
在这里插入图片描述

4. 降维：无监督学习

体会了机器学习的基本回归，分类，聚类到底是怎么回事后，该到了分析喂给这些算法的数据了，我们在之前介绍这些算法时，往往用到的数据都是已经预处理过的，比如做了归一化处理，做了降维处理等等。数据预处理做的好与坏，对我们最终问题的求解也是至关重要的，因此也是机器学习学习中的重要一个环节。

机器学习领域里讲的降维是指：采用某种映射方法，将原本高维空间中的数据样本映射到低维空间中。

降维的本质是学习一个映射函数 y=f(x)，其中 x 表示原始的高维数据，y 表示映射后的低维数据。

3.1 主成分分析（PCA）

机器学习算法/模型——有监督到无监督（降维）主成分分析（PCA）

在这里插入图片描述

矩阵分解 PCA

奇异值分解（SVD）PCA

5. 集成学习

机器学习之集成学习

6. 阶段性总结

学习阶段总结：
机器学习模型/算法—— 阶段性总结（1）模型框架
 机器学习模型/算法—— 阶段性总结（2）关键概念/技术
 机器学习算法/模型—— 阶段性总结（3）面试考点
 机器学习算法/模型——阶段性总结（4）更高层次

更深层次的理解：
假设：假设函数
 模型泛化：偏差、方差、噪声
 ”距离“、”范数“和范数正则化
 线性模型小结：还分不清线性回归和线性分类模型？
生成式模型还是判别式模型？
参数学习：LR 与 SVM的区别？
线性可分：线性（二分类）模型
 分类损失函数(margin 损失函数)——以二分类为例
 目标函数：经验损失（损失函数）和结构化损失（正则项）都做了些什么？

新知识点记录：
2020 机器学习知识点记录

7. 代码

7.1 积累

机器学习代码实践——数据——如何快速获取所需的实验数据

7.2 sklearn

机器学习——Sklearn学习笔记——总章

机器学习算法/模型——总章

机器学习模型