［机器学习］协同过滤，LFM（隐语义）算法 - 代码天地

［机器学习］协同过滤，LFM（隐语义）算法

其他 2018-11-01 10:21:43 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/aFeiOnePiece/article/details/47675685

本文内容属于 Andrew Ng的《机器学习》公开课笔记，大部分截图均来自Andrew Ng的课件

对于本节所讲的算法，Andrew Ng称为 Collaborative filtering（协同过滤），或者low rank matrix factorization（xx矩阵分解），项亮博士《推荐系统实践》那本书里叫做 LFM（隐语义模型）

上一篇博客说道基于内容的推荐，但是内容矩阵怎么来？一种方法就是用大量的人力去填。而Collaborative filtering 正是这样一种代替人工的方式。

回顾一下，基于内容的推荐，是已知y和X，求theta。如果我们已知y和theta，就可以求X。

于是，如果给theta一个初始化很小的值，可以来回利用上面两个式子，对X和theta进行求解。

我们伟大的前辈发现了一种更好的方法，就是把两个 linear regression合并，如下图

合并后，我们的最优化目标就从

J（theta）和 J（X）变成了 J（theta，X）

算法描述如下

在这里，我们不需要 k = 0的特殊情况了，因为我们不需要手动添加 x＝1这个元素。如果需要x＝1，协同过滤算法会自己算出一个 x＝1。算法描述到此为止。

1，为什么该算法也叫做矩阵分解算法呢。见下图

我们把 Y矩阵，转换成了 Theta和X两个矩阵的乘积

2，怎么找到与 movie i最相似的5个movie呢？

计算距离

这个距离可能很大。更好的计算距离或者说相似的的方法有皮尔逊相似度，余弦相似度，欧拉距离相似度等等，这些相似度的取值范围都在－1～1之间

3，如果一个用户是新来的，没有任何评分记录，怎么给他推荐？

Andrew Ng推荐 mean normalization 方法

如果一个用户没有评分记录，那么用 CF方法算出来的评分都是0。没什么价值，还不如给他一个平均值。具体实现见下图

计算出每部电影的评分平均值。然后把所有的评分都减去平均值进行计算。算出来的结果再加上平均值。

这样做其实对有评分记录的用户是多余的。但是却可以把没有评分记录的用户给统一进来！

－－－－－－－－－－－－－割－－－－－－－－－－－－－

节目预告：下一节要讲 logistic regression 和 regulization。因为是复习，所以没按大纲走

猜你喜欢

转载自blog.csdn.net/aFeiOnePiece/article/details/47675685

［机器学习］协同过滤，LFM（隐语义）算法

机器学习-SVD(隐语义模型)协同过滤

协同过滤（隐语义模型）

推荐系统--完整的架构设计和算法(协同过滤、隐语义)

推荐系统——协同过滤与隐语义模型详解

机器学习：协同过滤算法实战

机器学习协同过滤算法

机器学习：协同过滤推荐算法

快速学习-机器学习(隐语义模型(LFM))

LFM隐语义模型的算法简介

隐语义模型（LFM）-----------电影推荐算法

机器学习入门--协同过滤算法[推荐算法]

机器学习基础 - 推荐系统之协同过滤算法

【机器学习】Matlab_推荐系统协同过滤算法

机器学习算法原理解析——协同过滤推荐

机器学习部分：基于用户的协同过滤算法

关联规则与基于用户/物品协同过滤（隐语义模型）

隐语义模型LFM

隐语义模型：LFM

快速学习-机器学习(协同过滤)

机器学习相关——协同过滤

协同过滤算法

协同过滤算法学习笔记

协同过滤推荐算法学习

机器学习部分：基于用户的协同过滤和基于商品的协同过滤

机器学习-隐语义模型

机器学习之奇异值分解SVD及应用于协同过滤推荐和LSA潜在语义分析

吴恩达机器学习（十四）推荐系统（基于梯度下降的协同过滤算法）

协同过滤算法的实现——机器学习斯坦福大学吴恩达老师

机器学习-【10】推荐系统（协同过滤算法模型）【手抄笔记】

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)