机器学习中多分类与聚类的区别

版权声明:创作不易,转载请留出处。 https://blog.csdn.net/qq_39072607/article/details/89185125

机器学习中多分类与聚类的区别

在机器学习中,常常有人分不清分类和聚类。分类与聚类是机器学习中基础但却很重要的概念。下面就让我们看看分类和聚类的区别吧。

分类

在日常生活中,我们见到西瓜就知道它是一种水果,见到冬瓜便知道它是一种蔬菜。
这是人们硬性规定好的我们已经知道的常识。那么我们是如何知道的呢?可能是父母
或者老师或者其他人告诉你们这个东西就是这么叫的。想想我们小时候几乎每家都有    
一个儿童认知表,上面画着水果蔬菜各种动物等。有人告诉你事物的分类,并训练你 
认知他们并将它们分类,这就是分类的本质。

在机器学习中,分类是根据一些给定类别的样本,训练某种学习机器(即得到某种目标函数),使它能够对未知类别的样本进行分类。这属于supervised learning(监督学习)。

聚类

在生活中,有其他人告诉你或规定这个东西是什么属于哪一类的,我们才知道它是什
么属于哪一类。那么如果出现了个新东西,或者没人告诉你,你怎么才能区分他们
呢?你可能会根据他们的外表,颜色等特征来区分它们,你根据特征将相似的东西归
在一起,这就叫做聚类。

在机器学习中,聚类是机器将一些未知分类的样本,从中总结出它们个体间相似的部分个体并将相似的个体归为一类的过程。

分类与聚类的比较

分类就是在已知分类有意地训练机器区分数据属于哪一类。
聚类就是在未知分类,让机器自己找出哪些数据相似,并将相似的数据归为一类。
就像是武侠小说中门派弟子和散修一样的区别。门派弟子有师傅告诉如何修炼是正确的,并引导你走向正确的修炼道路。而散修只能自己总结摸索正确的修炼道路。

猜你喜欢

转载自blog.csdn.net/qq_39072607/article/details/89185125