机器学习论述学习

一、机器学习的定义

机器学习是一门从数据中研究算法的多领域交叉学科，研究计算机如何模拟或实现人类的学习行为，根据已有的数据或以往的经验进行算法选择、构建模型，预测新数据，并重新组织已有的知识结构使之不断改进自身的性能。

二、机器学习的分类

1、有监督学习SL（Supervised Learning）

用已知某种特性的样本(x,y)做为训练集，建立一个数学模型，求解f:x->y，预测未知样本。

1）判别式模型（Discriminative Model）

对条件概率p(y|x)进行建模，如线性回归、决策树、SVM、KNN、神经网络等。

2）生成式模型（Generative Model）

对联合概率p(x,y)进行建模，如HMM、Naive Bayes、GMM、LDA等。

2、无监督学习UL（Unsupervised Leaning）

扫描二维码关注公众号，回复： 10601799 查看本文章

训练集数据只有x没有标签y，目的是试图提取数据中隐含的结构和规律，常见的算法有K-means、降维、文本处理（特征抽取）等。

无监督学习一般作为有监督学习的前期数据处理，功能是从原始数据集中抽取出必要的标签信息。

3、半监督学习SSL（Semi-Supervised Learning）

前两者的结合，利用少量标注了的样本和大量未标注的样本进行训练和测试。SSL的三种基本假设：

1）平滑假设（Smoothness Assumption）：位于稠密数据区域的两个距离很近的样例的类标签类似。

2）聚类假设（Cluster Assumption）：当两个样例位于同一聚类簇时，它们在很大概率下有相同的类标签。

3）流形假设（Manifold Assumption）：将高维数据嵌入到低维流形中，当两个样例位于低维流形中的一个小局部邻域内时，它们具有相似的类标签。

4、强化学习RL（Reinforcement Learning）

系统（autonomous agent）通过从环境States到行为Actions映射的学习，以使强化信号Rewards函数值达到最大，即改进行动方案Policy以适应环境。

RL 与SL、UL的一个重要区别是：后两者需要满足数据是服从独立同分布的，而RL则不满足这个条件，因为Agent和环境交互过程中状态是不断变化的，RL本质是对连续序列做决策的过程。

课堂笔记：

导数：

环境：