推荐--企业模型-汽车之家推荐系统

参考:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247497757&idx=1&sn=fe521ea5a746be9ba0aa208506d716b8

用户理解包含用户属性、行为收集及行为的表示,资源的刻画包括自身的属性及外部赋给资源的特征

用户和资源的匹配(召回和排序有非常多的方法或模型,是推荐系统的核心工作,追求更好更优的匹配,是推荐系统不断演进的动力所在。召回是尽可能多的找到用户喜欢的资源,排序是对找到的资源再做一次优选

推荐架构

排序模型

LR 模型是 CTR 预估领域早期最成功的模型,主要经历了 LR、XGBoost、FM、DeepFM、DeepFM Online Learning 等

还实验了如 Wide&Deep、DCN、LSTM、GRU 等模型。

在线学习

排序服务是以 API 的形式提供

特征及训练样本

1. 特征介绍

模型的输入一般包括:用户画像特征、item 特征,上下文特征,交叉特征、位置特征和序列 item 特征,其中:

用户画像特征有:用户自身属性,如性别、年龄、职业、地域等;用户行为,如不同时间窗口的浏览时长、点击、搜索、发贴、收藏、点赞等行为;基于行为所产生的兴趣偏好,如车系、标签偏好等;基于行为的衍生统计指标,如用户 ctr、活跃度等。

Item 特征有:item 自身属性,如标题、正文字数、图片个数等;基于 item 挖掘的特征,如内容分类、关键词、情感、内容专业度、内容丰富度、作者影响力等;item 被用户赋予的行为,如 uv、pv、ctr、收藏、点赞、回复等。

交叉特征有:item 标签与用户标签的匹配度

2. 特征处理

直接使用原始特征不易于模型拟合,所以传入模型后还需要进一步处理,具体包括:异常值处理、归一化和等频分桶。

3. 特征表达

大规模的稀疏特征和多种形式的向量表达。如基于 item 内容分类的 Bert embedding,基于 item 图像和视频的 embedding,基于行为的 Graph embedding、LSTM embedding 等。

汽车之家,Base 北京

发布了156 篇原创文章 · 获赞 28 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/serenysdfg/article/details/104603299