2.2.2相似测度:
测度基础:以两矢量的方向是否相近作为考虑的基础,矢量长度并不重要:
1.角度相似系数(夹角余弦)
注意:坐标系的旋转和尺度的缩放是不变的,但对一般的线性变换和坐标系的平移不具有不变性。
2.相关系数
它实际上是数据中心化后的矢量夹角余弦。
注意:相关系数范围是(-1,1),-1是基本不相关,1是几乎相关。
2.2.3匹配测度
当测度只有两个状态(0,1)时,常用匹配测度。0表示无此特征,1表示有此特征。故称之为二值特征。
对于二值n维特征矢量可以定义如下相似性测度:
(1)Tanimoto测度
举例:
(2)Rao测度:
注意:(1-1)匹配特征数目和所选用的特征数目之比。
举例:
(3)简单匹配系数
注意:上式分子为(1-1)匹配特征数目与(0-0)匹配特征数目之和,分母为所考虑的特征数目。
举例:
(4)Diec系数
(5)Kulzinsky系数
2.3类的定义:
对于一个待分类的集合S,要求分类后的各类S1,S2,S3,SN满足:
定义1:
定义2:
定义3: