机器学习论述学习

一、机器学习的定义

机器学习是一门从数据中研究算法的多领域交叉学科,研究计算机如何模拟或实现人类的学习行为,根据已有的数据或以往的经验进行算法选择、构建模型,预测新数据,并重新组织已有的知识结构使之不断改进自身的性能。

二、机器学习的分类

1、有监督学习SL(Supervised Learning)

用已知某种特性的样本(x,y)做为训练集,建立一个数学模型,求解f:x->y,预测未知样本。

1)判别式模型(Discriminative Model)

对条件概率p(y|x)进行建模,如线性回归、决策树、SVM、KNN、神经网络等。

2)生成式模型(Generative Model)

对联合概率p(x,y)进行建模,如HMM、Naive Bayes、GMM、LDA等。

 

2、无监督学习UL(Unsupervised Leaning)

扫描二维码关注公众号,回复: 10601799 查看本文章

训练集数据只有x没有标签y,目的是试图提取数据中隐含的结构和规律,常见的算法有K-means、降维、文本处理(特征抽取)等。

无监督学习一般作为有监督学习的前期数据处理,功能是从原始数据集中抽取出必要的标签信息。

 

3、半监督学习SSL(Semi-Supervised Learning)

前两者的结合,利用少量标注了的样本和大量未标注的样本进行训练和测试。SSL的三种基本假设:

1)平滑假设(Smoothness Assumption):位于稠密数据区域的两个距离很近的样例的类标签类似。

2)聚类假设(Cluster Assumption):当两个样例位于同一聚类簇时,它们在很大概率下有相同的类标签。

3)流形假设(Manifold Assumption):将高维数据嵌入到低维流形中,当两个样例位于低维流形中的一个小局部邻域内时,它们具有相似的类标签。

 

4、强化学习RL(Reinforcement Learning)

系统(autonomous agent)通过从环境States到行为Actions映射的学习,以使强化信号Rewards函数值达到最大,即改进行动方案Policy以适应环境。

RL 与SL、UL的一个重要区别是:后两者需要满足数据是服从独立同分布的,而RL则不满足这个条件,因为Agent和环境交互过程中状态是不断变化的,RL本质是对连续序列做决策的过程。

 

课堂笔记:

导数:

 

 

 

环境:

 

 

 

 

猜你喜欢

转载自www.cnblogs.com/SZZZ/p/12661580.html