［推荐算法］Pearson Correlation Similarity 的python实现 - 代码天地

［推荐算法］Pearson Correlation Similarity 的python实现

其他 2018-11-01 10:21:44 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/aFeiOnePiece/article/details/47624465

皮尔逊相似度是推荐算法中常见的计算相似度的方法，其公式如下：

从公式可以看出该算法有几个缺点：

1，如果用户A对所有item的评分都一样，那么将无法计算别人跟A的相似度（分母为0）；所以该算法不适用于 boolean preference类型的推荐

2，如果用户A只对1个item进行了评分，那么也无法计算别人跟A的相似度（分母为0）；所以对于数据量较小，或者矩阵非常之稀疏的数据都不太好用

3，如果2个人有200个common item，尽管ratings并不总是一样，但她们的相似度可能好于2个只有2 commen item的人的相似度（这个我不能直接从公式看出来，哪位大神指点一下）

下面是python实现：

#!/usr/bin/python

import sys

# input 2 vector array
# output pearson correlation score
def PearsonCorrelationSimilarity(vec1, vec2):
	value = range(len(vec1))

	sum_vec1 = sum([ vec1[i] for i in value])
	sum_vec2 = sum([ vec2[i] for i in value])

	square_sum_vec1 = sum([ pow(vec1[i],2) for i in  value])
	square_sum_vec2 = sum([ pow(vec2[i],2) for i in  value])

	product = sum([ vec1[i]*vec2[i] for i in value])

	numerator = product - (sum_vec1 * sum_vec2 / len(vec1))
	dominator = ((square_sum_vec1 - pow(sum_vec1, 2) / len(vec1)) * (square_sum_vec2 - pow(sum_vec2, 2) / len(vec2))) ** 0.5

	if dominator == 0:
		return 0
	result = numerator / (dominator * 1.0)

	return result

vec1 = [5.0, 3.0, 2.5]
vec2 = [2.0, 2.5, 5.0]

print PearsonCorrelationSimilarity(vec1, vec2)

猜你喜欢

转载自blog.csdn.net/aFeiOnePiece/article/details/47624465

［推荐算法］Pearson Correlation Similarity 的python实现

Correlation in Python

相似性 similarity | 相关性 correlation | 距离 distance

person correlation,spearman correlation and kendall's t的算法(python,算法来自ＦＲＭ－market risk )

Python三种方法计算皮尔逊相关系数（Pearson correlation coefficient）

Hackerrank Day 7: Pearson Correlation Coefficient I

SSIM（structural similarity）算法原理

皮尔逊相关系数丨Pearson’s correlation coefficient

【ML基础】皮尔森相关系数(Pearson correlation coefficient)

[Statistics] Comparison of Three Correlation Coefficient: Pearson, Kendall, Spearman

PCC值average pearson correlation coefficient计算方法

Kernelized Correlation Filters (KCF) Tracking算法

python Mean Squared Error vs. Structural Similarity Measure两种算法的图片比较

Python中的相关分析correlation analysis

Python calculate and plot correlation between multiple variables

互相关（cross-correlation）及其在Python中的实现

转载《互相关（cross-correlation）及其在Python中的实现》

[leetcode] 734. Sentence Similarity @ python

CLIP score：Text-image similarity 以及image-image similarity 评估代码实现

机器学习特征工程之皮尔森相关系数 pearson correlation of features

皮尔森相关系数、皮尔逊相关系数（Pearson correlation coefficient）的存在性问题

双目深度算法——基于Correlation的方法（DispNet / iResNet / AANet）

Learning Semantic Textual Similarity from Conversations 论文实现

损失函数SSIM (structural similarity index) 的PyTorch实现

PAT甲级1063 Set Similarity (25分)|C++实现

NLP常用损失函数代码实现——SoftMax/Contrastive/Triplet/Similarity

TOPSIS（Technique for Order Preference by Similarity to Ideal Solution）算法及代码

Correlation and Convolution

python基于余弦相似度（Cosine Similarity）的检索系统

用户推荐算法 pearson（皮尔逊）相似度

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)