数据挖掘-聚类分析 - 代码天地

数据挖掘-聚类分析

其他 2019-12-22 17:01:19 阅读次数: 0

本节内容：

0：数据挖掘的常用方法

1：什么是聚类----聚类是无监督学习

2：聚合和分类的区别---事先定义的类型标记

3：聚类结果的影响有哪些---量纲、行为准则、距离

4：聚类分析的分类--根据x或特征值

5：聚类分析的一般步骤

6：聚类分析的案例

7：聚类的原理--距离和相似度才划分聚类

0：数据挖掘的常用方法

一、什么是聚类

聚类也称为聚类分析（某些应用中也称数据分割），指将样本分到不同的组中使得同一组中的样本差异尽可能的小，而不同组中的样本差异尽可能的大。
聚类得到的不同的组称为簇（cluster）
早在孩提时代，人就通过不断改进下意识的聚类模式才学会如何区分猫和狗、动物和植物

"物以类聚，人以群分"。对事务进行分类，是人们认识事务的出发点，也是人们认识世界的一种重要手段。

无监督学习也称聚类分析，无监督学习源于许多研究领域，受到很多应用的推动。如：

在复杂网络分析中，人们希望发现具有内在紧密联系的社团
在图像分析中，人们希望将图像分割成具有类似性质的区域
在文本处理中，人们希望发现具有相同主题的文本子集
.....
这些情况都可以在适当的条件下归为聚类分析。

二、聚类和分类的区别

无监督学习和分类不同，没有事先定义的类型标记。

--聚类所说的类不是事先给定的，而是根据数据的相似度和距离来划分

--聚类的数目和结构都没有事先假定

聚类分析的用途：

可作单独的数据分析工具
可作为其他方法的预处理手段

聚类方法的目的是寻找数据中

【1】潜在的自然分组结构 a structure of "natural" grouping

【2】感兴趣的关系 relationsship

三、聚类结果的影响有哪些

1：量纲（一般我们需要对数据进行标准化）

2：聚类的行为准则

3：距离测度

四、聚类分析的分类

根据样本的的X进行分类，或者是根据对X的n个特征值进行分类

五、聚类分析的一般步骤

六、聚类分析的案例

七、聚类的原理

原理：距离、相似度

明视距离：

欧式距离
曼哈段距离

相似度：

二元相似度
向量相似度

猜你喜欢

转载自www.cnblogs.com/hero799/p/12080173.html

数据挖掘-聚类分析

数据挖掘（聚类分析）

数据挖掘——聚类分析总结

数据挖掘-聚类分析【2】

数据挖掘之聚类分析（R语言）

python 数据挖掘（11）-- 聚类分析

数据挖掘之聚类分析详解（一）

数据挖掘之聚类分析详解（三）

数据挖掘之聚类分析详解（三）

数据挖掘之聚类分析详解（二）

数据挖掘之聚类分析（Cluster Analysis）

【Python数据分析】数据挖掘建模——聚类分析

数据挖掘之聚类分析学习笔记(1)

数据挖掘之聚类分析学习笔记(3)

数据挖掘之聚类分析学习笔记(2)

【数据挖掘】使用R语言进行聚类分析

数据挖掘-聚类分析（Python实现K-Means算法）

<数据挖掘导论>读书笔记9聚类分析

<数据挖掘导论>读书笔记10聚类分析续

数据挖掘聚类分析-手肘法

国科大数据挖掘期末复习——聚类分析

吴裕雄数据挖掘与分析案例实战（14）——Kmeans聚类分析

[源码和文档分享]python数据分析（7）——挖掘建模（2）聚类分析

毕业设计之 ---- 基于大数据挖掘分析的客户细分 (k-means 聚类分析)

《数据分析与挖掘实战》总结及代码练习---chap5 挖掘建模---聚类分析关联模型离群点检测

【python数据挖掘课程】二十四.KMeans文本聚类分析互动百科语料

数据挖掘学习——聚类分析(k-均值聚类、DBSCAN、AGNES)、python代码

数据仓库与数据挖掘课程设计【基于Apriori算法关联规则和K-Means算法聚类分析的杂货店销售数据挖掘】

数据挖掘读书笔记--第九章：聚类分析：基本概念和方法

慕课笔记-数据科学导论-第六章数据挖掘-数据挖掘流程/技术/典型数据挖掘系统/对象/价值/定义/关联分析/Apriori/FP-growth/分类分析/决策树/最近邻/聚类分析

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)