推荐系统2

其他 2018-12-26 00:50:17 阅读次数: 0

协同过滤

协同过滤就是根据实体之间的一些相似性，过滤到所有实体中的一些实体。

例如：下面是一个关于几个用户对几部电影的评分表格。竖着的表头表示不同的用户，横向表头表示不同的电影。

假如，我们想知道Claudia Puig这位童鞋给《Lady in the Water》这部电影评分多少。

那么，我们首先就要找到，谁和Claudia Puig这位童鞋具有相似的喜好。

对于计算用户的相似性的方法，我们一般有以下几种：

1.计算欧氏距离。

2.计算用户之间的余弦相似性。

欧氏距离

我们就每一部电影，将Claudia Puig这位童鞋与其他童鞋评分进行计算。其中，没有评分的不参与计算。最终发现，Lisa Rose与Claudia Puig是最接近的，我们就将Lisa Rose对于《Lady in the Water》这部电影评分作为Lisa Rose对于这部电影的评分进行预测。

但是这里存在这样的问题：

A和B虽然对于同一部电影的观影感受是一样的，但是他们的评分的严厉性是不一样的，那么就会导致我们的估计是不可行的。

我们将优化这个算法：

首先计算每个人的观影评分的平均值：

其次，我们计算对于每部电影的评分，与平均评分的差异（实际值-平均值）：

再根据每个人对于不同电影评分与自己评分平均值的差异按照上述的欧式距离的算法，计算不同用户之间的差异。

我们发现，最终还是Lisa Rose和Claudia Puig是最接近的，此时，我们对于Claudia Puig评分预测不再直接根据Lisa的评分直接估计。而是：

Lisa对于《Lady in the Water》的评分比她对于所有电影评分均值低了0.5分。恰好低了8%。按照这样，我们计算Claudia Puig对于《Lady in the Water》的评分：

3.5*(1-0.5/3) = 2.91

我们发现，仅仅靠找到一个最接近的用户的评分习惯对想要预测的用户的评分习惯进行估计是不准确的，应该找到多个用户（K个），对其值进行加权平均，这样会更科学一些。

余弦相似性

在上表中，我们发现。虽然两个人的观影感受（对于Movie1的评分比Movie2和Movie3的评分要低）是一致的，但是评分的习惯是不同的（对于每部电影的评分不尽相同）。

单纯的用欧氏距离计算是不科学的：

余弦相似性的计算方法：

我们按照上表的数据，解释一下公式的使用：

1.A和B是特征向量，例如，A =（1，2，2），B = ( 2 , 4 , 4 )

2.计算A·B:

A·B = (1*2+2*4+2*4)=18

3.计算分母:

4.计算相似性：

18/18 = 1

我们按照给定的公式计算余弦相似性：

1.计算平均评分，并计算对于各个电影评分与平均评分的差：

2.计算向量乘积（A·B）

3.计算各个分量的平方：

4.计算最终结果：

这里需要选定K个用户的评分进行加权平均对未知用户的评分进行预测。

看似Toby与目标用户最为相似，但是他不提供目标电影的评分，所以，我们只能参考其他用户的评分了。

计算评分：

方法一：

方法二：

此问题包含的超参数：

1.与目标用户相似的用户数目确定

2.电影评分参考最佳的部数

3.加权计算的时候采取的方法（采用百分比，还是绝对差值）

算法误差计算（可根据实际进行选择）

1.通过计算所有测试集上的均方误差MSE

2.计算用户在下一次购买商品的时候，购买到的推荐商品的数量

猜你喜欢

转载自blog.csdn.net/Day_and_Night_2017/article/details/84673571

推荐系统2

推荐系统（2）

推荐系统-task2

基于Spark的电影推荐系统（推荐系统~2）

推荐引擎-（2）推荐系统的实验方法。

推荐系统入门（七）：新闻推荐实践2（附代码）

推荐系统实战2——EasyRec 推荐框架环境配置

淘宝的推荐系统计算之道2A

推荐系统与知识图谱(2)

明大推荐系统导论笔记 week 2

用于推荐系统评估的概念与指标（2）

【机器学习课程-华盛顿大学】：1 案例研究 1.5 推荐系统（2）音乐推荐系统

【推荐系统系列2】基于用户行为数据的推荐系统方法

【番剧推荐系统设计】基于 Flask 与 MySQL 实现番剧推荐系统（Python代码）（2）

【基于协同过滤算法的推荐系统项目实战-2】了解协同过滤推荐系统

机器学习笔记 - 构建推荐系统(2) 深度推荐系统概览

推荐系统从入门到入门（2）——简单推荐系统构建（无框架、Tensorflow）

推荐系统(内容推荐)

推荐系统-内容推荐

推荐系统

《推荐系统》+《推荐系统实践》

【推荐系统】推荐系统概述

推荐--（2）

基于Spark的推荐系统设计及实现阅读2

推荐系统实践-用户行为数据-阅读笔记2

七月推荐系统实战第 2 课

【推荐系统】知乎live入门2.细节补充

推荐系统（四）Graph Embedding之Node2Vec

实用常用操作命令2 - Linux系统（推荐）

推荐系统从无到有（2）—— Zookeeper

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)