推荐系统实践---第五章:利用上下文信息

下面简单介绍书中提到的问题以及有哪些解决办法,方便大家对正本书有个整体的把握,同时我也会上传这本书的高清PDF版,本来想不用积分下载,但是系统最少2个,要是哪位没有积分,可以私信我。下载链接如下:

http://download.csdn.net/download/wtt561111/10163609

其他章节内容

推荐系统实践---第一章:好的推荐系统

推荐系统实践---第二章:利用用户行为数据

推荐系统实践---第三章:推荐系统冷启动问题

推荐系统实践---第四章:利用用户标签数据

推荐系统实践---第五章:利用上下文信息

推荐系统实践---第六章:利用社交网络数据

推荐系统实践--第七章:推荐系统实例 第八章:评分预测问题


无论是基于用户动作行为数据还是用户标签行为数据,都忽略了一个很重要的内容:用户当时所处的上下文。用户访问系统所处的时间、地点、心情等,对推荐结果影响很大。心情的获取,可以让用户登录系统的时候,让其选择,根据选择的心情为其进行推荐。本章主要考虑时间和地点上下文。

5.1    时间上下文信息

时间信息对用户兴趣的影响:用户兴趣是变化的(年龄段、职业等);物品也是有生命周期的(电影,新闻等);季节效应(夏天更爱吃冰淇淋)。

系统的时间特性:在给定时间信息后,推荐系统从一个静态系统变成了一个时变的系统,而用户行为数据也变为时间序列。在给定一个系统的数据集后,可以通过统计一下信息研究系统的时间特性:数据集每天独立用户数的增长情况(确定系统的增长情况);系统的物品变化情况(确定物品的生命周期);用户访问情况(同一用户是否经常访问该网站);

度量物品的生命周期:物品平均在线天数(如果一个商品在一天内,被一个用户动作过,就算当天在线);相隔T天后物品流行度向量的平均相似度。

推荐系统的实时性:要求每个用户在访问系统是,都根据用户在这个时间点前的行为实时计算推荐列表;推荐算法需要平衡用户的近期行为和长期行为;

时间上下文推荐算法---最近最热门:在获得用户行为的时间信息后,最简单的非个性化推荐算法就是给用户推荐最近最热门的物品。给定时间T,物品i最近的流行度Ni(t)=1 /(1+alpha(T-t))累加。其中t表示训练集中物品i被动作的时间,alpha是时间衰减参数。

时间上下文推荐算法---ItemCF和UserCF:  在之前的CF算法基础上,加上时间因素,具体公式看书去。

时间上下文推荐算法---时间段图模型。该模型定义了边的权重。

5.2    地点上下文信息

与地点相关的数据分为三种:(用户,用户位置,物品,评分);(用户,物品,物品位置,评分);(用户,用户位置,物品,物品位置,评分)。

基于只有用户位置信息的数据进行推荐:金字塔模型。位置信息是一个树状结构,从上到下可以为国家、省、市、县等。到了叶子节点,就是与目标用户u在同一个位置的用户。第一种做法就是根据叶子节点的用户进行ItemCF为目标用户进行推荐。但是这种方法会导致每一个用户的数据比较稀疏。第二种方法就是从根节点开始到目标用户u所在的叶子节点,每到一个节点就生成一个推荐列表,最后将所有列表加权。

对只有物品位置信息的数据进行推荐:先忽略商品的位置信息,通过ItemCF的方法计算用户u对商品i的分数,然后最位置做出惩罚。惩罚项就是:用户u历史评价过的商品距离商品i的位置的平均值(或者最小值)。让Pu(u,i)-Penalty(i)作为最后的分数。这里的位置不是欧式距离,而是经纬度距离,或者利用交通信息得到的实际路程。

对同时具有物品位置信息和用户位置信息的数据进行推荐:可以先忽略用户的位置信息,按照第二种方法进行推荐,然后给用户推荐距离其位置最近的物品。

猜你喜欢

转载自blog.csdn.net/wtt561111/article/details/78893689