余弦相似度与正规化的欧氏距离的某种等价性


给一个集合V, V={x|x∈Rn} , 和一个点u∈Rn   , 依次计算 u V 中各个点的距离, 然后按照从近到远排序, 就可以得到一个 序列A=<x1,x2,...>
距离函数可以取
  • cosine similarity 
    值域[-1,1], 越大表示越相近.
  • Euclidean distance 
    值域 [0,+∞], 越小表示越近.

在二维空间中, 余弦距离是夹角, 欧氏距离是远近. 很明显二者各自得出的序列AA 是不同的. 
但要是对uuVV中的点作归一化呢? 得到的两个AA 是否就相同了呢? 因为在二维空间中容易得到直观的这个推测.

真是的答案是 Yes! 
cosine similarity is identical to l2-normalized euclidean distance someway.

For -normalized vectors x,y 



we have that the squared Euclidean distance is proportional to the cosine distance, 



从式中可以看出, 夹角越大, 欧氏距离的平方就越小, 这就是想要的证明!

参考

  1. stack-exchange, is-cosine-similarity-identical-to-l2-normalized-euclidean-distance

原文地址:https://blog.csdn.net/chuchus/article/details/78213957

猜你喜欢

转载自blog.csdn.net/u011089523/article/details/80168230
今日推荐