推荐：如何正确选择聚类算法？ - 代码天地

推荐：如何正确选择聚类算法？

其他 2020-02-25 10:18:36 阅读次数: 0

聚类算法十分容易上手，但是选择恰当的聚类算法并不是一件容易的事。

数据聚类是搭建一个正确数据模型的重要步骤。数据分析应当根据数据的共同点整理信息。然而主要问题是，什么通用性参数可以给出最佳结果，以及什么才能称为“最佳”。

本文适用于菜鸟数据科学家或想提升聚类算法能力的专家。下文包括最广泛使用的聚类算法及其概况。根据每种方法的特殊性，本文针对其应用提出了建议。

四种基本算法以及如何选择

聚类模型可以分为四种常见的算法类别。尽管零零散散的聚类算法不少于100种，但是其中大部分的流行程度以及应用领域相对有限。

基于整个数据集对象间距离计算的聚类方法，称为基于连通性的聚类（connectivity-based）或层次聚类。根据算法的“方向”，它可以组合或反过来分解信息——聚集和分解的名称正是源于这种方向的区别。最流行和合理的类型是聚集型，你可以从输入所有数据开始，然后将这些数据点组合成越来越大的簇，直到达到极限。

层次聚类的一个典型案例是植物的分类。数据集的“树”从具体物种开始，以一些植物王国结束，每个植物王国都由更小的簇组成（门、类、阶等）。

层次聚类算法将返回树状图数据，该树状图展示了信息的结构，而不是集群上的具体分类。这样的特点既有好处，也有一些问题：算法会变得很复杂，且不适用于几乎没有层次的数据集。这种算法的性能也较差：由于存在大量的迭代，因此整个处理过程浪费了很多不必要的时间。最重要的是，这种分层算法并不能得到精确的结构。

猜你喜欢

转载自blog.csdn.net/jxq0816/article/details/104397171

推荐：如何正确选择聚类算法？

基于用户聚类的推荐

蜂群算法聚类问题的协同过滤推荐

推荐算法分类：协同过滤、聚类、分类

深入推荐引擎相关算法 - 聚类

推荐算法

推荐算法之好友推荐

推荐算法-基于模型的推荐

【推荐】Twitter推荐算法架构

5类系统推荐算法

5类推荐算法

【推荐算法入门】推荐系统之推荐算法概述

【推荐系统】推荐系统基础算法-基于协同的推荐算法

【推荐系统】推荐系统基础算法-基于内容的推荐算法

阿里移动推荐算法大赛——推荐算法

推荐算法：基于UCF的电影推荐算法

推荐算法：基于特征的推荐算法

slopeOne推荐算法：最基础的推荐算法

推荐算法-协同过滤推荐算法

第 3 部分: 深入推荐引擎相关算法 - 聚类

使用聚类算法来对用户进行兴趣小组推荐

STC2聚类算法用于中文文本推荐

【推荐系统】详解基于内容的推荐算法

推荐算法之相似性推荐

推荐算法之基于内容的推荐

基于内容的推荐算法（推荐系统）（一）

基于内容的推荐算法（推荐系统）（三）

基于内容的推荐算法（推荐系统）（二）

【推荐系统】协同过滤推荐算法

推荐算法——基于内容的推荐CB

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)