KMeans(基于划分的)
1 算法描述
(1)随机选择k个中心。
(2)遍历所有样本,把样本划分到距离最近的一个中心。
(3)划分之后就有k个簇,计算每个簇的平均值作为新的质心。
(4)重复步骤2,直到达到停止条件。
停止条件:
(1)达到迭代次数。
(2)每一类中心在每一次迭代变化不大为止。
2 优点
(1)算法容易理解,聚类效果不错。
(2)具有出色的速度
3.缺点
(1)需要自己确定K值,k值的选定是比较难确定。
4.效果评价
从簇内的稠密程度和簇间的离散程度来评估聚类的效果。