读书笔记《推荐系统实战》| 好的推荐系统

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_40006058/article/details/82955686

1、长尾理论是指,只要产品的存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大,即众多小市场汇聚成可产生与主流相匹敌的市场能量。

2、几乎所有的推荐系统应用都是由前台的展示页面、后台的日志系统以及推荐算法系统3部分构成。

3、电子商务——>亚马逊
最主要的应用有个性化商品推荐列表和相关商品的推荐列表。
在这里插入图片描述
推荐结果的标题、缩略图以及其他内容属性—>告诉用户给他们推荐的是什么。
推荐结果的平均分—>平均分反应了推荐结果的总体质量,也代表了大部分用户对这本书
的看法。
推荐理由—>根据用户的历史行为给用户做推荐,因此如果它给你推荐了一本金庸
的小说,大都是因为你曾经在亚马逊上对武侠方面的书给过表示喜欢的反馈。

*基于物品的推荐算法(item-based method) ,该算法给用户推荐那些和他们之前喜欢的物品相似的物品。
*基于好友的个性化推荐界面同样由物品标题、缩略图、物品平均分和推荐理由组成。就是按照用户在Facebook的好友关系,给用户推荐他们的好友在亚马逊上喜欢的物品。
*相关推荐列表。当你在亚马逊购买一个商品时,它会在商品信息下面展示相关的商品。亚马逊有两种相关商品列表,一种是包含购买了这个商品的用户也经常购买的其他商品,另一种是包含浏览过这个商品的用户经常购买的其他商品。这两种相关推荐列表的区别就是使用了不同用户行为计算物品的相关性。打包销售(折扣)

该系统让每个用户都能拥有一个自己的在线商店,并且能在商店中找到自己感兴趣的商品

4、电影和视频网站——>Netflix

电影的标题和海报。
用户反馈模块—>包括Play( 播放)、评分和Not Interested( 不感兴趣) 3种。
推荐理由—>因为用户曾经喜欢过别的电影。

基于物品的推荐算法。

5、个性化音乐网络电台——>Pandora、Last.fm、豆瓣电台

个性化推荐的成功应用需要两个条件。第一是存在信息过载,因为如果用户可以很容易地从所有物品中找到喜欢的物品,就不需要个性化推荐了。第二是用户大部分时候没有特别明确的需求,因为用户如果有明确的需求,可以直接通过搜索引擎找到感兴趣的物品。

*Pandora的算法主要基于内容。其音乐家和研究人员亲自听了上万首来自不同歌手的歌,然后对歌曲的不同特性(比如旋律、节奏、编曲和歌词等)进行标注,这些标注被称为音乐的基因。然后, Pandora会根据专家标注的基因计算歌曲的相似度,并给用户推荐和他之前喜欢的音乐在基因上相似的其他音乐。
*Last.fm记录了所有用户的听歌记录以及用户对歌曲的反馈,在这一基础上计算出不同用户在歌曲上的喜好相似度,从而给用户推荐和他有相似听歌爱好的其他用户喜欢的歌曲。同时, Last.fm也建立了一个社交网络,让用户能够和其他用户建立联系,同时也能让用户给好友推荐自己喜欢的歌曲。和Pandora相比, Last.fm没有使用专家标注,而是主要利用用户行为计算歌曲的相似度。

扫描二维码关注公众号,回复: 3644349 查看本文章

6、社交网络——>Facebook和Twitter

利用用户的社交网络信息对用户进行个性化的物品推荐;
信息流的会话推荐;
给用户推荐好友。

Facebook最宝贵的数据有两个,一个是用户之间的社交网络关系,另一个是用户的偏好信息。因此, Facebook推出了一个推荐API,称为Instant Personalization。该工具根据用户好友喜欢的信息,给用户推荐他们的好友最喜欢的物品。

7、个性化阅读——>Google Reader,鲜果网,Zite和Flipboard

个性化阅读同样符合前面提出的需要个性化推荐的两个因素:首先,互联网上的文章非常多,用户面临信息过载的问题;其次,用户很多时候并没有必须看某篇具体文章的需求,他们只是想通过阅读特定领域的文章了解这些领域的动态。

*Google Reader是一款流行的社会化阅读工具。它允许用户关注自己感兴趣的人,然后看到所关注用户分享的文章。
*和Google Reader不同,个性化阅读工具Zite则是收集用户对文章的偏好信息。在每篇文章右侧, Zite都允许用户给出喜欢或不喜欢的反馈,然后通过分析用户的反馈数据不停地更新用户的个性化文章列表。
*Digg首先根据用户的Digg历史计算用户之间的兴趣相似度,然后给用户推荐和他兴趣相似的用户喜欢的文章。

8、基于位置的服务——>Foursquare

随着移动设备的飞速发展,用户的位置信息已经非常容易获取,而位置是一种很重要的上下文信息,基于位置给用户推荐离他近的且他感兴趣的服务,用户就更有可能去消费。基于位置的服务往往和社交网络结合在一起。比如Foursquare推出了探索功能,给用户推荐在附近的行为。

9、个性化邮件——>Tapestry

就是一个个性化邮件推荐系统,它通过分析用户阅读邮件的历史行为和习惯对新邮件进行重新排序,从而提高用户的工作效率。

通过协同过滤筛选信息。

10、个性化广告——>Facebook

CPM  收费最科学的办法是按照有多少人看到你的广告来收费。按访问人次收费已经成为移动广告平台的惯例。CPM(千人成本)指的是广告投放过程中,听到或者看到某广告的每一人平均分担到多少广告成本。传统媒介多采用这种计价方式。在移动广告平台上,CPM取决于“印象”尺度,通常理解为一个人的眼睛在一段固定的时间内注视一个广告的次数。比如说一个内置广告横幅的单价是1元/CPM的话,意味着每一千个人次看到这个Ban-ner的话就收1元,如此类推,10,000人次访问的主页就是10元。至于每CPM的收费究竟是多少,要根据以手机应用的热门程度(即浏览人数)划分价格等级,采取固定费率。国际惯例是每CPM收费从5美元至200美元不等。  CPC  以每点击一次计费。这样的方法加上点击率限制可以加强作弊的难度,而且是宣传的最优方式。但是,此类方法就有不少人觉得不公平,比如,虽然浏览者没有点击,但是他已经看到了广告,对于这些看到广告却没有点击的流量来说,广告成了白忙活。有很多手机应用不愿意做这样的广告,据说,是因为传统媒体从来都没有这样干过。  CPA  CPA计价方式是指按广告投放实际效果,即按回应的有效问卷或定单来计费,而不限广告投放量。CPA的计价方式对于网站而言有一定的风险,但若广告投放成功,其收益也比CPM的计价方式要大得多。据我所知7天酒店在投放网络广告的时候,有一部分就是这么干的,按照每注册一个会员,给网站付20元。说道收费方式CPM 、CPC 、CPA三种收费方式只能比较出哪个更适合你而已。

广告是互联网公司生存的根本。很多互联网公司的盈利模式都是基于广告的,而广告的CPC、CPM直接决定了很多互联网公司的收入。

个性化广告投放和狭义个性化推荐的区别是,个性化推荐着重于帮助用户找到可能令他们感兴趣的物品,而广告推荐着重于帮助广告找到可能对它们感兴趣的用户,即一个是以用户为核心,而另一个以广告为核心。目前的个性化广告投放技术主要分为3种。
 上下文广告 通过分析用户正在浏览的网页内容,投放和网页内容相关的广告。代表系统是谷歌的Adsense。
 搜索广告 通过分析用户在当前会话中的搜索记录,判断用户的搜索目的,投放和用户目的相关的广告。
 个性化展示广告 我们经常在很多网站看到大量展示广告(就是那些大的横幅图片),它们是根据用户的兴趣,对不同用户投放不同的展示广告。雅虎是这方面研究的代表。

11、好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但却不那么容易发现的东西。同时,推荐系统还要能够帮助商家将那些被埋没在长尾中的好商品介绍给可能会对它们感兴趣的用户。

12、一般来说,一个新的推荐算法最终上线,需要完成上面所说的3个实验。
 首先,需要通过离线实验证明它在很多离线指标上优于现有的算法。
 然后,需要通过用户调查确定它的用户满意度不低于现有的算法。
 最后,通过在线的AB测试确定它在我们关心的指标上优于现有的算法。

13、评价指标
*用户满意度:只能通过用户调查(问卷调查)或者在线实验(购买率、点击率、用户停留时间和转化率等指标度量用户的满意度)获得。
*预测准确度度量一个推荐系统或者推荐算法预测用户行为的能力。这个指标是最重要的推荐系统离线评测指标。评分预测的预测准确度一般通过均方根误差(RMSE)和平均绝对误差(MAE)计算。TopN推荐的预测准确率一般通过准确率(precision) / 召回率(recall)度量。
在这里插入图片描述
在这里插入图片描述
*覆盖率
在这里插入图片描述
在这里插入图片描述
*多样性
在这里插入图片描述
在这里插入图片描述
*新颖性
*惊喜度
二者的区别:
在这里插入图片描述
*信任度
在这里插入图片描述
*实时性
推荐系统的实时性包括两个方面。首先,推荐系统需要实时地更新推荐列表来满足用户新的行为变化。比如,当一个用户购买了iPhone,如果推荐系统能够立即给他推荐相关配件,那么肯定比第二天再给用户推荐相关配件更有价值。很多推荐系统都会在离线状态每天计算一次用户推荐列表,然后于在线期间将推荐列表展示给用户。实时性的第二个方面是推荐系统需要能够将新加入系统的物品推荐给用户。这主要考验了推荐系统处理物品冷启动的能力。
*健壮性(即robust,鲁棒性)指标衡量了一个推荐系统抗击作弊的能力。
*商业目标
在这里插入图片描述
在这里插入图片描述
14、一个推荐算法,虽然整体性能不好,但可能在某种情况下性能比较好,而增加评测维度的目的就是知道一个算法在什么情况下性能最好。这样可以为融合不同推荐算法取得最好的整体性能带来参考。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_40006058/article/details/82955686