关于单量预测和动态定价的一些思考

问1:单量预测模型怎么演进的?
答1:1)背景:对低敏感度的用户加配送费(单量损失少),对高敏感度的用户减配送费(单量增加多),在保证收入的前提下,提高单量
2)具体这个模型构建其实经理了3个阶段
2.1)第一个阶段,预测目标是每个配送区每天的单量,使用特征包括配送区优惠力度,是否工作日,使用的算法是线性回归。每个配送区一个模型
2.2)第二个阶段,预测目标是每个配送区每天的单量,使用特征为历史1天、3天、7天、15天单量,配送费,uv,优惠力度,使用算法为随机森林,线性回归。多个配送区一个模型。
2.3)第三个阶段,预测目标是单量变化比例,使用特征为配送费变化,uv变化,优惠力度变化,使用算法是半对数模型。每个城市一个模型,相似城市公用一个模型。



问2:以上三个模型有什么区别?
答2:1)模型3是最终使用的模型,模型1和模型2在我们的场景下无法使用
2)首先,模型1来说,前期预测效果不错,后期预测效果变坏。原因是:
2.1)前期单量近似线性增长,优惠力度也程线性增长,两者间呈线性关系,我们用线性模型拟合,效果好
2.2)后期单量仍然存在自然的线性增长,优惠力度不增长,甚至某些区域出现下降,两者间不存在线性关系,所以拟合效果不好
2.3)所以前期其实是伪线性关系,被学习到了;而随着业务变化,这种伪线性关系不存在
3)其次,对于模型1来说,还存在一个问题,配送费对单量的影响很小
3.1)在整个优惠力度的角度来看,配送费加减一块钱对其影响很小
3.2)对于用户来说,配送费增加一块钱很敏感,但菜品增加一块钱很可能都无感
3.3)由于上述两点,所以配送费通过优惠力度来预测单量,体现不出配送费的真实影响力,所以需要把配送费单独作为一个特征
4)对于模型2,预测效果是可以的,但配送费的权重很低,对单量影响很小
4.1)我们的场景来说,即使绝对的单量预测特别准,也没法用;我们更关注配送费对单量的影响
4.2)原因是:历史单量是由竞对、优惠力度、配送费、服务、商家质量等多种因素综合决定的,权重会很大;配送费作为单量某一侧面的反应被综合特征替换掉了
4.3)模型使用随机森林,所以特征方面没有进行很多特征选择
5)模型3是我们最终使用的模型
5.1)它的核心是使用配送费明显变化前后各一周的数据进行建模
5.2)这样,对于每一个配送区来说,由于在极短时间内,竞对、市占、商家供给、服务等影响单量的特征不会突变,
5.3)对于单量变化来说,可以认为这些特征是一个常数;对于单量来说,是很重要的特征
5.4)uv、配送费、优惠力度是变的,其他的是衡量




问3:模型怎么评估的?
答3:1)模型指标:R^2,F值,t值
2)测试集上进行测试:cross validation。虽然更经常是用于超参数的选择,但这里是进行模型评估。ME、MAE、MSE、RMSE
3)abtest线上测试:能够保证只有配送费的差异




问4:R^2,F值,t值,ME、MAE、MSE、RMSE定义分别是什么?
答4:1)R^2:模型对观测值的拟合程度,在0~1之间,越接近1拟合程度越高
2)t值:评估在其他解释变量不变的前提下,解释变量X对被解释变量Y的影响,越接近0越显著
3)F值:各解释变量联合起来,对被解释变量Y的影响,越接近0越显著
4)有偏性(ME):AVG(yi'-yi)
5)平均绝对差值(MAE):AVG(|yi'-yi|)
6)均方误差(MSE):∑(yi'-yi)^2/n
7)均方根误差(RMSE):sqrt(∑(yi'-yi)^2/n)




问5:还有什么可优化的地方?
答5:1)一部分城市进行模型训练,大多数城市根据是运营根据经验选取相似城市使用相同策略,其实可以通过聚类的方法,更自动化
2)在应用过程中,降价效果仅仅是涨价效果的一半,究其原因是需要C端推广配合,否则无法触达用户
3)从定价理论角度来看,更高级的方式应该针对用户提供差异化服务,提供不同价格,这里差异化服务可以是不同配送时长,或者是相同服务的不同包装形式






问6:怎样在线上应用的?
答6:1)工程架构是这样的:价格敏感度模型是离线的,计算出不同场景的敏感度系数
2)另外一个同事完成调价模块,根据敏感度系数,在一定的收入约束下,以单量增长为目标,确定各场景的具体配送费伸缩系数,并导入mysql库
3)客户下单时,会根据不同场景乘以不同的伸缩系数
4)第一步是用R实现,第二步用python实现,第三步用java实现




问7:配送费基础价格是如何确定的?
答7:1)根据配送区的平均配送费
2)每单的配送耗时占配送区平均耗时的比例
3)每单耗时=由商家的历史取餐时长+预估的配送时长+所在位置的交付时长求




问8:模型如何在线定期更新?
答8:1)主要是构建在线的训练样本集
2)可以通过抽取abctest进行,5%加价,5%等比例减价,90%不变,可以保证在不影响收入单量的前提下获取训练样本

发布了21 篇原创文章 · 获赞 37 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/zhixiongzhao/article/details/73302182