机器学习笔记01——机器学习简介

1. 什么是机器学习

机器学习是人工智能的一个分支,它业是一类算法的总称。这些算法能够根据提供的训练数据按照一定的方式来学习,最终用于预测或者分类。更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化能力。

1.2发展历程

在这里插入图片描述

1.3 机器学习一般步骤

邹博老师将机器学习的流程比作西红柿炒鸡蛋
在这里插入图片描述

1.4 机器学习类型

监督学习:根据已有的数据集(可以叫做训练数据既有特征又有标签),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。
监督学习举例
回归:对已经存在的点(训练数据)进行分析,拟合出适当的函数模型y=f(x),这里y就是数据的标签,而对于一个新的自变量x,通过这个函数模型得到标签y。 例如利用过去的房价来预测当前和未来的价格。
在这里插入图片描述
分类:针对离散型的,输出数据属于哪个类别
在这里插入图片描述

无监督学习: 我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。比起监督学习,无监督学习更像是自学,让机器学会自己做事情
如下图所示,在无监督学习中,我们只是给定了一组数据,我们的目标是发现这组数据中的特殊结构。例如我们使用无监督学习算法会将这组数据分成两个不同的簇,这样的算法就叫聚类算法。
在这里插入图片描述
强化学习: 通过不断与环境交互,利用环境给出的奖惩来不断的改进策略(即在什么状态下采取什么动作),以求获得最大的累积奖惩。
简言之:通过不断激励与惩罚,达到最终目的。
举个例子:对于一个正在学走路的小屁孩,他一不小心摔倒了,如果他一摔倒就哭,那妈妈就会打他小屁屁,如果他摔倒了会自己爬起来,那妈妈很高兴,就奖励他喝一口奶。这样小屁孩就学会了摔倒了要自己爬起来,然后就可以喝很多很多奶。
在上述问题中,奖就是喝奶,惩就是打屁屁,在摔倒状态下,是选择哭还是爬起来,不同的动作会有不同的奖惩;初始的策略是哭和爬起来都有可能。但根据奖惩,小屁孩学到了摔倒之后爬起来是一个更好的策略,因此之后都会选择这个策略,这样就可以最大化累积奖惩—喝很多很多奶。

强化学习与极度学习的区别:

(1)监督学习有反馈,无监督学习无反馈,强化学习是执行多步之后才反馈。
(2)强化学习的目标与监督学习的目标不一样,即强化学习看重的是行为序列下的长期收益,而监督学习往往关注的是和标签或已知输出的误差。
(3)强化学习的奖惩概念是没有正确或错误之分的,而监督学习标签就是正确的,并且强化学习是一个学习+决策的过程,有和环境交互的能力(交互的结果以惩罚的形式返回),而监督学习不具备。

参考链接:

https://blog.csdn.net/gongxifacai_believe/article/details/91355237
https://blog.csdn.net/songyunli1111/article/details/80657500
https://www.jianshu.com/p/682c88cee5a8
https://blog.csdn.net/qq_25867649/article/details/78029849

原创文章 32 获赞 42 访问量 5283

猜你喜欢

转载自blog.csdn.net/sinat_40875078/article/details/105739598