一、什么是聚类分析
聚类分析是研究分类问题的一种多元统计方法。所谓类,就是指相似元素的集合
聚类分析的研究目的 把相似的东西归成类,根据相似的程度将研究目标进行分类。
聚类分析的研究对象
R型分析----对变量(指标)进行分类
Q型分析----对样品进行分类 聚类分析
研究的主要内容
如何度量事物之间的相似性? 怎样构造聚类的具体方法以达到分类的目的?
二、距离和相似系数
1、相似性的测度
距离:测度样品之间的亲疏程度。将每一个样品看作 维空间的一个点,并用某种度量测量点与点之间的距离,距离较近的归为一类,距离较远的点应属于不同的类。
相似系数:测度变量之间的亲疏程度。
2、常用的距离
扫描二维码关注公众号,回复:
2806980 查看本文章