携程--出行产品未来14个月预测

这次比赛是使用了规则和模型两部分来进行融合。

规则部分是在一个朋友的建议下写出来的。具体思路是这4种的加权。第一种是去年同月的销量,第二种是去年的年平均销量,第三种是过去连续几个月靠近预测月的权重给大一些,离得远的给小一些,第四种是去年同月的月销量和年平均销量的差值。

接下来是模型部分。我用的是xgb和随机森林的加权融合。整体指导思想是,利用过去一年的销量来预测未来的14个月。提取的特征有:每款产品过去的12个月每个月的销量,过去5 7 9 11个月的销量均值,每款产品的基本属性(赛题提供),每款产品的当月订单数,同样处理出来均值特征,每款产品的月销量金额,同样处理出来均值,之后是对应的差值。

模型部分的特征:

1:

ave_5:过去5个月的平均销量
ave_7
ave_9
ave_11
2:出行产品的基本属性(对于缺失值大的,直接忽略)
'railway':是否接近铁路
'airport':是否接近飞机场
'citycenter':是否在城市中心
等等
3:
 
 
order_ave_5:过去5个月的 平均订单量
order_ave_7
order_ave_9
 
 
order_ave_11
4:
month_price_zong:月总销售价钱
month_price_zong_ave_5:过去5个月的月总销售价钱
month_price_zong_ave_7
month_price_zong_ave_9
month_price_zong_ave_11
5:
产品的评分差值 ,做法是选取几个月的 评分,然后求差值
6:
startdate_change:产品的上市日期
更新日期、和携程的合作日期
 
 

最后的结果是0.3倍的规则结果加权 + 0.4倍的随机森林加权 + 0.3倍的xgb加权

猜你喜欢

转载自blog.csdn.net/a1066196847/article/details/73866278