k-means与GMM优劣对比

企业开发 2023-07-02 02:29:36 阅读次数: 0

1、代码

import numpy as np, matplotlib.pyplot as mp
from sklearn.cluster import KMeans 
from sklearn import datasets 
from sklearn import mixture

np.random.seed(8)  # 设定随机环境
# 创建随机样本
X, _ = datasets.make_blobs(centers=[[0, 0]])
X1 = np.dot(X, [[4, 1], [1, 1]])
X2 = np.dot(X[:50], [[1, 1], [1, -5]]) - 2
X = np.concatenate((X1, X2))
y = [0] * 100 + [1] * 50
# KMeans
kmeans = KMeans(n_clusters=2)
y_kmeans = kmeans.fit(X).predict(X)
# 绘图
for e, labels in enumerate([y, y_kmeans], 1):
    mp.subplot(1, 2, e)
    mp.scatter(X[:, 0], X[:, 1], c=labels, s=40, alpha=0.6)
    mp.xticks(())
    mp.yticks(())
mp.show()
# GMM
gmm=mixture.GaussianMixture(n_components=2,covariance_type='full')
y_gmm=gmm.fit(X).predict(X)
# 绘图
for e, labels in enumerate([y, y_gmm], 1):
    mp.subplot(1, 2, e)
    mp.scatter(X[:, 0], X[:, 1], c=labels, s=40, alpha=0.6)
    mp.xticks(())
    mp.yticks(())
mp.show()

2、效果

GMM比K-Means在处理数据形状方面更灵活（数据集可以是任何椭球形状，而不是限于球形。），所以如图，GMM的聚类效果刚好。同时，GMM使用概率，每个数据点可能会被划分成多个簇，尤其是数据点位于两个重叠的簇中间。

K-Means

GMM

猜你喜欢

转载自blog.csdn.net/m0_57491181/article/details/129777763

k-means与GMM优劣对比

EM算法、k-means、GMM

GMM & K-means 高斯混合模型和K-means聚类详解

【转】GMM与K-means聚类效果实战

fuzzy c-means 与 k-means实验对比

机器学习算法原理与实践（五）、GMM与K-means的那些事机器学习算法原理与实践（五）、GMM与K-means的那些事

k-means与k-NN的区别对比

K-Means(K均值)、GMM(高斯混合模型)，通俗易懂，先收藏了！

K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比

K-means

k-means算法

Clustering: K-Means

clustering k-means

K-means 算法

K-Means详解

K-Means初探

K-means系列

K-MEANS及改进

sklearn k-means

KNN与K-Means

K-Means与KNN

2.28 k-means

K-means优化

K-means Clustering

并行K-Means

K-means以及K-Means++

K-Means、K-Means++

k-means算法和c-means算法对比实例

K-Means算法（K-Means Clustering）

K-MEANS聚类

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)