机器学习之k均值算法(K-means)聚类 - 代码天地

机器学习之k均值算法(K-means)聚类

其他 2020-02-22 16:01:18 阅读次数: 0

简介

聚类：一种无监督学习，是先不知道类别，自动将相似的对象归到同一簇中
根据欧式距离选择较近的几个点判断类别
欧式距离计算公式

其中K是事先给定的，这个K值的选定是非常难以估计的，事先并不知道给定的数据集应该分为多少个类别才算合适（ISODATA算法通过类的自动合并和分裂，得到较为合理的类型数目K）
K-Means算法需要用初始随机种子点，这个随机种子点很重要，不同的随机种子点会得到完全不同的效果（K-Means++算法可以用来解决这个问题，可以有效的选择初始点）

K-Means步骤

从数据中选择k个对象作为初始聚类中心
计算每个聚类对象到中心的距离来划分类
重新计算每个聚类中心点
计算标准测度函数，直到达到最大迭代次数，则停止，否则继续操作
确定最优的聚类中心

常见错误

中心数量不正确n_cluster
数据偏差，造成分类错误
样本方差不一致cluster_std
样本数量不一致

半监督学习，用小的数据训练，来预测较大的数据

应用实例

import sklearn.datasets as dataset
from sklearn.cluster import KMeans
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

x_train,target = dataset.make_blobs(n_samples=200,centers=3)

kmn = KMeans(n_clusters=3)
kmn.fit(x_train)
y_new = kmn.predict(x_train)

centers = kmn.cluster_centers_


plt.figure(figsize=(16,9))
plt.subplot(221)
plt.scatter(x_train[:,0],x_train[:,1],c=y_new) #预测分类
plt.scatter(centers[:,0],centers[:,1],c='r',s=100,alpha=0.6)
plt.subplot(222)
plt.scatter(x_train[:,0],x_train[:,1],c=target)
plt.savefig('k.png')

猜你喜欢

转载自www.cnblogs.com/focusTech/p/12340069.html

机器学习之K均值算法（K-means）聚类

机器学习算法与Python实践之（五）k均值聚类（k-means）

ML-61: 机器学习之K均值(K-Means)聚类算法+代码

机器学习-聚类之K均值(K-means)算法原理及实战

机器学习算法之_K-均值聚类（K-means）

机器学习之k均值算法(K-means)聚类

机器学习之K均值聚类算法K-Means（python代码实现）

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

机器学习之聚类算法k-means

机器学习聚类算法之K-means

K均值聚类算法(K-Means) K均值聚类算法(K-Means)

机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法

机器学习算法原理总结系列---算法基础之(11)聚类K均值(Clustering K-means）

机器学习：原型聚类-k均值算法k-means(附代码实现)

Python机器学习算法实践——k均值聚类（k-means）

机器学习——K-均值聚类（K-means）算法

机器学习（二）——K均值聚类算法（K-means）

机器学习（二）——K-均值聚类（K-means）算法

机器学习 K-均值聚类算法(K-Means)

机器学习实战：K-Means（K-均值）聚类算法

[机器学习][K-Means] 无监督学习之K均值聚类

机器学习之K均值(K-Means)算法

机器学习之K-Means（k均值）算法

机器学习——K-means算法（聚类算法）

机器学习 - 算法 - 聚类 K-MEANS 算法

K-means(K-均值)聚类算法

K-均值聚类算法(K-Means)

【ML】K均值聚类算法 (K-means Clustering)

K-均值聚类（K-means）算法

K均值聚类算法(K-Means)

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)