监督学习与非监督学习的区别

在机器学习中,监督学习和非监督学习算法是非常重要的,但是二者应该如何区分开来呢? 要向对二者进行区分,首先就要对训练的数据进行检查,看一下训练数据中是否有标签,这是二者最根本的区别。监督学习的数据既有特征又有标签,而非监督学习的数据中只有特征而没有标签。 监督学习是通过训练让机器自己找到特征和标签之间的联系,在以后面对只有特征而没有标签的数据时可以自己判别出标签,监督学习可以分为两大类:回归分析和分类,二者之间的区别在于回归分析针对的是连续数据,而分类针对的是离散数据 非监督学习由于训练数据中只有特征没有标签,所以就需要自己对数据进行聚类分析,然后及可以通过聚类的方式从数据中提取一个特殊的结构。 然而在监督学习与非监督学习之间还存在着一种半监督学习,对于半监督学习而言,其训练数据的一部分是有标签的,另一部分是没有标签的,而没标签的数据量远远大于有标签的数据量。隐藏在半监督学习下的基本规律在于数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。

猜你喜欢

转载自www.cnblogs.com/guibin180517/p/9212554.html