协同过滤算法的原理详解 - 代码天地

协同过滤算法的原理详解

其他 2019-04-25 09:51:08 阅读次数: 0

1994年，明尼苏达大学双城分校计算机系的GroupLens研究组设计了GroupLens的新闻推荐系统，并首次提出了协同过滤思想。

维基百科上对协同过滤分别给了广义和狭义两个定义

广义定义：协同过滤是使用涉及多个代理，视点，数据源等之间的协作的技术来过滤信息或模式的过程。

狭义定义：协同过滤是一种通过从许多用户收集偏好或品味信息（协作）来自动预测（过滤）关于用户兴趣的方法。协同过滤方法的基本假设是，如果一个人A在一个问题上与一个人B具有相同的意见，那么A更可能在其他问题上与B意见的相似度高于随机的人。

协同过滤的分类

基于用户的推荐(通过共同口味与偏好找相似邻居用户，K-邻居算法，你朋友喜欢，你也可能喜欢)
基于项目的推荐(发现物品之间的相似度，推荐类似的物品，你喜欢物品A，C与A相似，可能也喜欢C)
基于模型的推荐(基于样本的用户喜好信息构造一个推荐模型，然后根据实时的用户喜好信息预测推荐)

协同过滤推荐步骤

（1）收集用户偏好。例如评分、投票、转发、保存、书签、标记、评论、点击、浏览时间、购买、分享以及收藏等。

（2）数据数字化。对数据进行减噪与归一化操作，得到一个用户偏好的二维矩阵，一维是用户列表，另一维是物品列表，值是用户对物品的偏好，一般是 [0,1] 或者 [-1, 1] 的浮点数值。

减噪：通过数据挖掘算法过滤数据中的噪音，是一个数据预处理的过程，使得对数据之后的分析更为精确。
归一化：将各个行为的数据都统一到一个相同的取值范围，例如用各类数据除以此类中的最大值，从而使得归一化的数值在[0,1]之间，这是一种最简单的归一化处理

（3）找到相似的用户和物品。构造相似度计算式来衡量用户与用户（物品与物品）之间的相似度。

（4）计算出来的相似度作为基于用户、项目的协同过滤推荐。

猜你喜欢

转载自blog.csdn.net/qq_24852439/article/details/89300696

协同过滤算法的原理详解

协同过滤算法详解

协同过滤推荐算法的原理及实现

基于用户的协同过滤算法详解

协同过滤算法

协同过滤推荐算法

协同过滤算法概述

协同过滤算法实战

基于用户的协同过滤推荐算法原理和实现

机器学习算法原理解析——协同过滤推荐

94 R-推荐算法协同过滤原理演示

推荐算法-协同过滤推荐算法

推荐算法 - 协同过滤算法

推荐系统-原理及实现（协同过滤）

推荐系统-协同过滤原理与实现

协同过滤(ALS)的原理及Python实现

基于用户的协同过滤推荐算法

[推荐系统]--协同过滤算法

协同过滤算法之基于item

协同过滤算法学习笔记

推荐算法之协同过滤实战

推荐算法之协同过滤

协同过滤算法，python实现

协同过滤——基于用户的推荐算法

4.2 Hadoop-协同过滤算法

协同过滤推荐算法及应用

协同过滤推荐算法概述

基于物品的协同过滤推荐算法

基于用户的协同过滤算法

推荐算法之协同过滤实例

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)