1. 什么是机器学习

机器学习是人工智能的一个分支，它业是一类算法的总称。这些算法能够根据提供的训练数据按照一定的方式来学习，最终用于预测或者分类。更具体的说，机器学习可以看作是寻找一个函数，输入是样本数据，输出是期望的结果，只是这个函数过于复杂，以至于不太方便形式化表达。需要注意的是，机器学习的目标是使学到的函数很好地适用于“新样本”，而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力，称为泛化能力。

1.2发展历程

在这里插入图片描述

1.3 机器学习一般步骤

邹博老师将机器学习的流程比作西红柿炒鸡蛋
在这里插入图片描述

1.4 机器学习类型

• 监督学习：根据已有的数据集(可以叫做训练数据既有特征又有标签），通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。
监督学习举例
回归：对已经存在的点（训练数据）进行分析，拟合出适当的函数模型y=f(x)，这里y就是数据的标签，而对于一个新的自变量x，通过这个函数模型得到标签y。例如利用过去的房价来预测当前和未来的价格。
在这里插入图片描述
分类：针对离散型的，输出数据属于哪个类别

• 无监督学习: 我们不知道数据集中数据、特征之间的关系，而是要根据聚类或一定的模型得到数据之间的关系。比起监督学习，无监督学习更像是自学，让机器学会自己做事情
如下图所示，在无监督学习中，我们只是给定了一组数据，我们的目标是发现这组数据中的特殊结构。例如我们使用无监督学习算法会将这组数据分成两个不同的簇，这样的算法就叫聚类算法。
在这里插入图片描述
• 强化学习: 通过不断与环境交互，利用环境给出的奖惩来不断的改进策略（即在什么状态下采取什么动作），以求获得最大的累积奖惩。
简言之：通过不断激励与惩罚，达到最终目的。
举个例子：对于一个正在学走路的小屁孩，他一不小心摔倒了，如果他一摔倒就哭，那妈妈就会打他小屁屁，如果他摔倒了会自己爬起来，那妈妈很高兴，就奖励他喝一口奶。这样小屁孩就学会了摔倒了要自己爬起来，然后就可以喝很多很多奶。
在上述问题中，奖就是喝奶，惩就是打屁屁，在摔倒状态下，是选择哭还是爬起来，不同的动作会有不同的奖惩；初始的策略是哭和爬起来都有可能。但根据奖惩，小屁孩学到了摔倒之后爬起来是一个更好的策略，因此之后都会选择这个策略，这样就可以最大化累积奖惩—喝很多很多奶。

强化学习与极度学习的区别：

（1）监督学习有反馈，无监督学习无反馈，强化学习是执行多步之后才反馈。
（2）强化学习的目标与监督学习的目标不一样，即强化学习看重的是行为序列下的长期收益，而监督学习往往关注的是和标签或已知输出的误差。
（3）强化学习的奖惩概念是没有正确或错误之分的，而监督学习标签就是正确的，并且强化学习是一个学习+决策的过程，有和环境交互的能力（交互的结果以惩罚的形式返回），而监督学习不具备。

参考链接：

https://blog.csdn.net/gongxifacai_believe/article/details/91355237
https://blog.csdn.net/songyunli1111/article/details/80657500
https://www.jianshu.com/p/682c88cee5a8
https://blog.csdn.net/qq_25867649/article/details/78029849

Jagger-Q

原创文章 32 获赞 42 访问量 5283

关注私信

机器学习笔记01——机器学习简介

目录

1. 什么是机器学习

1.2发展历程

1.3 机器学习一般步骤

1.4 机器学习类型

参考链接：

猜你喜欢