机器学习十大算法(十一)聚类算法

KMeans(基于划分的)

1 算法描述

(1)随机选择k个中心。

(2)遍历所有样本,把样本划分到距离最近的一个中心。

(3)划分之后就有k个簇,计算每个簇的平均值作为新的质心。

(4)重复步骤2,直到达到停止条件。

停止条件:

(1)达到迭代次数。

(2)每一类中心在每一次迭代变化不大为止。

2 优点

(1)算法容易理解,聚类效果不错。

(2)具有出色的速度

3.缺点

(1)需要自己确定K值,k值的选定是比较难确定。

4.效果评价

   从簇内的稠密程度和簇间的离散程度来评估聚类的效果。

猜你喜欢

转载自blog.csdn.net/zonglinzonglin/article/details/81989655