【数据挖掘】新闻推荐比赛 Task2 特征工程

1. 多路召回定义

所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用
在这里插入图片描述

例如新闻推荐,召回规则可以是“热门新闻”、“作者召回”、“关键词召回”、“主题召回“、”协同过滤召回“等等。

2. 读取模式

  1. debug模式
    抽取小数据集进行训练
  2. 线下验证模式
    利用train数据集进行训练,利用test数据集进行验证
  3. 线上模式
    利用train+test数据集进行训练

猜你喜欢

转载自blog.csdn.net/pigpigpig64/article/details/121677541
今日推荐