ML之K-means：关于Clustering和DR那些哈哈事之详细攻略 - 代码天地

ML之K-means：关于Clustering和DR那些哈哈事之详细攻略

企业开发 2018-10-10 15:19:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_41185868/article/details/79644509

1、关于K-means

K-means原理的理解可视化：让你更加容易它的算法过程

https://www.naftaliharris.com/blog/visualizing-k-means-clusteringniu/

K-means的一个应用是分类手写数字。这种算法可以在数字识别上得到相当好的结果，

参阅：http://ieeexplore.ieee.org/document/6755106/?reload=true

假设我们有用像素亮度的长向量表示的数字的图像。假设这些图像是黑白两色的，大小为 64×64 像素。每个像素代表一个维度。那么这些图像就生活在一个有 64×64=4096 个维度的世界里。在这个 4096 维的世界里，K 均值聚类让我们可以按接近程度对这些图像分组，并且假设这些靠得很近的图像都是同一个数字。

2、关于Hierarchical clustering

参阅：https://home.deib.polimi.it/matteucc/Clustering/tutorial_html/hierarchical.html

更多有关Hierarchical clustering的详细信息，可参阅这个视频：https://www.youtube.com/watch?v=OcoE7JlbXvY

3、关于PCA

减少复杂度（即这里的维度），同时保留结构（方差）

动态化演示参阅：https://www.mathsisfun.com/data/cartesian-coordinates-interactive.html

更多知识请推荐参阅Samer 写的论文，介绍了使用 PCA（以及扩散映射等技术）试图理解维基解密披露的电报：

http://mou3amalet.com/cargocollective/675_xuesabri-final.pdf

4、关于SVD

根据Andrew Gibiansky 写的关于 SVD 的文章中代码：

http://andrew.gibiansky.com/blog/mathematics/cool-linear-algebra-singular-value-decomposition/

可以发现，如果我们根据大小排序这些奇异值（矩阵 Σ 的值），那么前 50 个奇异值将包含整个矩阵 Σ 的大小的 85％。根据这个事实，我们可以丢弃后面的 250 个值（即将它们设为 0），仅保留这张小狗图像的「rank（秩）50」版本。值的数量差不多少了 5 倍，但质量却下降很少。上述计算的原因是当我们执行 UΣ'V 运算时，U 和 V 矩阵中的一部分因为乘 0 也被丢弃（其中 Σ' 是 Σ 的修改后版本，其中仅包含了前面的 30 个值）。

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/79644509

ML之K-means：关于Clustering和DR那些哈哈事之详细攻略

ML之Clustering：关于Clustering进阶的那些不可告密的事

【ML】K均值聚类算法 (K-means Clustering)

Clustering: K-Means

clustering k-means

K-means Clustering

Py之Data Base：Python和数据库的那些嘻嘻哈哈事详细攻略

Mahout: K-means clustering

Clustering：K-means Extention

Clustering: Fuzzy K-Means

K-Means Clustering 简介

k-means clustering algorithm

k-means算法之

K-Means算法（K-Means Clustering）

ML-61: 机器学习之K均值(K-Means)聚类算法+代码

聚类算法之K-Means，K-Means++，elkan K-Means和MiniBatch K-Means算法流程

机器学习算法原理总结系列---算法基础之(11)聚类K均值(Clustering K-means）

机器学习算法之 KNN和K-Means

Mahout: Fuzzy k-means clustering

Parallel K-Means Clustering Based on MapReduce

Mahout K-means clustering 入门

漫谈 Clustering (1): k-means

A Tutorial on Clustering Algorithms - K-means【翻译】

K-means clustering is not a free lunch

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

ML之K-means：基于DIY数据集利用K-means算法聚类(测试9种不同聚类中心的模型性能)

机器学习算法之K-means

机器学习之k-means

聚类算法之K-Means

聚类之k-means

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)