监督学习和无监督学习

监督学习（Supervised Learning）和无监督学习（Unsupervised Learning）是在机器学习中常被提到的两个重要的学习方法，下面举例说明以加深理解：

假如有一堆桃子和梨混在一起的一堆水果，我们需要设计一个机器对这堆水果按桃子和梨分类，但这个机器现在还不知道桃子和梨是什么样子的，所以我们需要给这个机器看一堆桃子和梨的照片，让它去学习桃子和梨的样子。经过多次学习（训练过程）之后，这个机器就已经可以对照片中的水果做出分类了，因为它已经学习到了桃子和梨的特征，已经对这些特征有了自己的定义。这个时候我们再让机器对这堆混杂的水果进行分类，它就可以准确地按类别将其分开。这就是一个监督学习过程。

如果我们一开始没有给这个机器看桃子和梨的照片，没让它进行系统的学习，机器也就不知道桃子和梨是什么样子的，直接让它去分类，那么机器只能凭“直觉”去对这堆水果进行准确分类。这就是一个无监督学习过程。说明机器自己总结出了桃子和梨的特征。

1. 监督学习

简单定义：提供一组输入数据和其对应的标签数据，然后搭建一个模型，让模型在经过训练后准确地找到输入数据和标签数据之间的最优映射关系，在输入新的数据时，模型能够通过之前学到的最优映射关系，快速地预测出这组新数据的标签。

1）回归问题

回归问题就是使用监督学习的方法，使搭建的模型在经过训练后建立起一个连续的线性映射关系，划重点：

利用提供的数据训练模型，让模型得到映射关系并能对输入的新数据进行预测。
得到的映射模型是线性连续的对应关系。

线性回归的使用场景是，我们已获得一部分有对应关系的原始数据，并且问题的最终答案是获得一个连续的线性映射关系，其过程就是使用原始数据对建立的初始模型不断地进行训练，让模型不断拟合修正，最后得到想要的线性模型，这个模型能够对之后输入的新数据准确地进行预测。

2）分类问题

分类问题，就是使搭建的模型在经过监督学习之后建立起一个离散的映射关系。分类问题和回归问题在本质上有很大的不同，它也需要使用提供的数据训练模型，让模型得到映射关系，并能对新的输入数据进行预测，但是最终得到的映射模型是一种离散的对应关系。

通过监督学习的方法对已有数据进行训练，得到一个分类模型，若分类模型最终输出的结果只有两个，则将其称为二分类模型。

分类模型的输出结果也可以不止两个，可以是多个，多分类问题与二分类问题相比更复杂。

2. 无监督学习

简单定义：提供一组很有任何标签的输入数据，放到搭建好的模型中进行训练，随整个训练过程不做任何干涉，最后得到一个能够发现数据之间隐藏特征的映射模型，使用这个映射模型能够实现对新数据的分类。

无监督学习主要依靠模型自己寻找数据中隐藏的规律和特征，人工参与的成分远远少于监督学习的过程。使用无监督学习实现分类的算法又叫做聚类。

总结

监督学习与无监督学习的主要区别：

通过监督学习能够按照指定的训练数据搭建想要的模型，这个过程需要很多精力处理原始数据，需要紧密的人为参与，最后得到的模型更符合设计者的需求和初衷。
通过无监督学习过程搭建的训练模型能够自己寻找数据之间隐藏的特征和关系，更具创造性，有时候还会挖掘到数据之间让我们意想不到的映射关系，当然最后的结果也可能向不好的方向发展。

监督学习和无监督学习各有利弊，用好这两种方法对于我们挖掘数据的特征和搭建强泛化力模型是必不可少的。

除了上面提到的监督学习和无监督学习，实际中还有半监督学习和弱监督学习等更具创新性的方法出现，例如半监督学习结合了监督学习和无监督学习各自的优点，是一种更先进的方法。我们需要深刻理解各种学习方法的优缺点，只有这样才能知道在每个应用场景中具体使用哪种学习方法才能更好地解决问题。

Dorothy_Xue

发布了115 篇原创文章 · 获赞 33 · 访问量 4万+

私信关注

深度学习——PyTorch实战计算机视觉1

监督学习和无监督学习

1. 监督学习

1）回归问题

2）分类问题

2. 无监督学习

总结

猜你喜欢