数据挖掘---度量数据的相似性和相异性

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_40042143/article/details/82954142

相似性和相异性都称为邻近性 proximity.

数据矩阵:对象-属性结构

相异性 dissnilarity matrix :对象-对象结构

标称属性的邻近性度量

二元属性的邻近性度量

数值属性的相异性:闵可夫斯基距离 

在计算距离之前应该规范化数据,涉及变换数据,使之落入较小的公共值域[-1,1]或【0,1】

 

 

 

 

余弦相似性

 

 

猜你喜欢

转载自blog.csdn.net/weixin_40042143/article/details/82954142