模糊聚类分析——浅谈(1)

    模糊数学是用数学方法研究和处理具有“模糊性”现象的数学。

    模糊正如其字面意思,就是不清晰。比如:“年轻人”这一名词,它的范围难以准确定义。若要判断20岁的张三或80岁的李四是否是“年轻人”,答案自然是明确的!但要判断28岁——35岁左右的人是否属于“年轻人”的集合, 就不那么好确定了。

     了解学习模糊算法,必须向杰出的先辈致敬,他就是美国控制论专家 L.A.Zadeh

1定义:用模糊数学的方法来处理聚类问题;模糊聚类可得到样本属于各个类别的不确定性程度,表达了样本类属的中介性, 更能客观地反映现实世界, 从而成为聚类分析研究的主流。

2基本思想:把经典集合中的隶属关系加以扩充,使元素对集合的隶属程度由只能取01这两个值推广到可以取单位区间[0,1]中的任意一数值。

3应用领域:模式识别、图像处理、信道均衡、矢量量化编码、神经网络的训练、参数估计、医学诊断、天气预报、食品分类、水质分析等。

4方法:

一、是基于模糊关系(矩阵)的聚类分析方法;

二、基于目标函数的聚类分析方法, 称为模糊C均值(FCM)聚类算法(或称为模糊ISODATA聚类分析法)


本讲介绍第一类方法, 基于模糊关系(矩阵)的聚类法                   

       基于模糊关系的聚类分析的一般步骤: 

(1)数据标准化;

(2) 构造模糊相似矩阵; 

(3) 模糊聚类。

第一步,数据预处理(也叫数据标准化)

标准化方法:

(1)平移-标准差变换(标准化公式)

(2)平移—极差变换(也叫极值标准化公式)

(3)对数变换。

第二步:标定(建立模糊相似矩阵)

计算相似程度的方法:

(1) 相似系数法

1数量积法;2)夹角余弦法;3)相关系数法;4)指数相似系数法;5)最大最小法;6)算术平均最小法;7)几何平均最小法.

(2) 距离法

1)绝对值倒数法;2)绝对值指数法;3)海明距离法;4)欧氏距离法;5)切比雪夫距离法.

(3) 其他方法

主观评定法等等。

第三步:模糊聚类

模糊传递闭包法 ( 最适合编程 ) 、直接聚类法、最大树法和编网法等。


欲知后事如何,请听下回分解微笑吐舌头安静







猜你喜欢

转载自blog.csdn.net/yuwenfanyu/article/details/80343446
今日推荐