机器学习算法-----K-means 聚类

K-means 聚类(k聚类)

提前知道:

分类中的类

所以k聚类,就是发现给定数据集中k个簇的算法。(k是用户定义的)

基础的聚类算法

**k-means:**它试图发现k个不同的簇,并且每个簇的中心采用簇中所含值得均值计算而成。
**层次聚类:**它试图再不同层次对数据集进行划分,从而形成树形的聚类结构
**DBSCAN:**基于密度聚类算法,簇的个数由算法自动地确定。低密度区域中的点被视为噪声而忽略,因此DBSCAN不产生完全聚类

作用(应用领域):

分类。

有无监督

无监督学习

步骤:

  1. 确定k值,即分类的类别数
  2. 根据k值,随机选取k个点,作为中心点。分别计算其余各个点到着k个点的距离。对于每一个非中心点,找到离它最近的中心点,并归为一个簇。
  3. 计算每个簇中所有节点的平均值,作为新的中心点,并重复上述操作,再次计算每个非中心点到新的中心点的距离,找到距离非中心点最近的中心点归为一个簇。
  4. 如果最后中心点不变,或者簇不再发生变化,就完成了最终的聚类。

优点

简单,易理解。运算速度快

缺点

仅仅可应用于连续的数据

需手工指定分为几类

原创文章 9 获赞 5 访问量 312

猜你喜欢

转载自blog.csdn.net/un_lock/article/details/105972503