为什么聚类不能用来作分类算法?

关于常见的聚类算法的详解可以参见K均值聚类和高斯混合聚类一文。
本文内容仅适于机器学习初学者

可能刚接触机器学习过后都知道,聚类属于无监督学习的范畴,而分类问题是有监督学习里常见的任务,二者都有个划分类别的过程,为什么聚类方法不能用于分类呢?


我们做分类任务的时候首先需要一批已标注好的样本,这里的标注除了一个标签值以外,还需要的一个信息就是,标签,即坐标轴所代表的意义,比方说 垃圾邮件分类任务里标签的意义就是垃圾邮件, 猫狗大战里标签的意义就是是猫还是狗。 而聚类中不一样的是,它的类别只包含我们按照某种特征聚类方法得到的标签值,但究竟这个值所代表的类别,它对应的含义,是没有解释的。

猜你喜欢

转载自www.cnblogs.com/siberiawind/p/9550166.html
今日推荐