概要
1、背景
• O2O行业及美团简介
2、算法应用
• 机器学习在用户端的应用
• 机器学习在商户端的应用
3、总结
• 算法应用八大“坑”
1、背景
什么是O2O?
O2O(OnlinetoOffline)=本地服务(LBS)+ 线上连接
O2O行业应用图谱
来源:TalkingData及品途网 2014 O2O移动应用行业报告
垂直 vs 水平(平台)
美团简介
O2O的特点
1、O2O vs 网络电商
共同:双边市场
差异:LocaEon based,
消费距离受限
2、懒人经济:质优价廉
低价格 高品质
低成本 高效率
低毛利 高科技
移动化
场景化、即时化
O2O平台
传统模型:边际收益递减
平台模型:双边市场的网络效应 >= 边际收益递增 >= 平台价值
平台:用户端
平台:商户端
2、算法应用
机器学习@美团
用户端:运营拉新
背景:首购-‐>留存,吸引已注册用户完成首购
目标:少花钱,多办事
方法:新用户画像 SVM分类
• 准确率:75%
• 召回率:68%
效果
• 拉新单位成本下降35%
单位用户营销成本=总花销/总新客数
• 总开支节省30%
用户端:推送引导
背景:对不活跃用户发个性化推送消息,提升访问及购买
目标:提高用户转化,减少打扰用户
方法:
效果:有效降低了对用户的打扰。
用户端:流量转化
推荐和搜索框架的统一
服务架构演进
基于spark的离线训练平台
美团搜索
搜索系统实践
查询分析
查询分析面临的问题
1、用户意图多元化
• 精确/模糊查询
• 领域多:寻找吃喝玩乐,购物,旅游,住宿…
2、用户查询自然语言化
3、检索基于字面匹配,缺乏语义扩展
4、语义漂移
意图识别
搜索意图歧义示例及解决方案
团单品类细分
品类内差异对用户造成的困扰
人工定义体系+SVM学习,构建覆盖全面合理的品类类目,更好满足用户精确品类检索的意图
美团频道筛选
频道筛选实践
重排序:特征
重排序:框架
数据实时化
• 预测结果随数据更新而变化
- 2小时销量数据
- 2小时内数据预测用户实时偏好
- 进入列表页请求用户地理位置,下单率提升3%
- 模型天级更新
• Online
- learning继续尝试中
美团推荐
推荐系统实践
http://tech.meituan.com/mt‐recommend‐pracEce.html
用户冷启动
• 行为少,找不到有意义的相似用户
• LocaEon,locaEon,locaEon
• 基于地理位置计算用户相似性:作为替补策略,效果一般
• 浏览地附近热单,作为上下文信息使用
加入context
用户端:流量转化
商户端:不仅是算法挑战
团购单销售额预估
背景:在线deal数量众多,需要关注deal的质量
目标:评估deal的质量
方法:
分解问题
• 以销售额来代表质量
• 再分解销售额
根据问题特征/模型并迭代
效果:
1. 访购率预测准确率(R2):0.8
2. 价格特征权重符合产品预期
http://tech.meituan.com/mt‐mlinacEon‐how‐to‐ml.html
电影票房预测
- 背景:电影票房预测数据可以指导片方发行/院线排片
- 目标:得到可用票房预测
- 机遇:
猫眼30%+市占的数据
用户其他行为及消费记录 - 挑战:
东西方人情世故不同
演员/导演的名气不靠谱
度量搜索/社交媒体效果不理想
3、总结
学习算法应用八大 “坑”
确实需要上算法么?
星际可以穿越,但特征不能!
算法一定要酷炫
算法准确率不到90%就是耍流氓?
重算法、轻速度(响应速度/迭代速度)
上线就是大功告成
线上AB定一切
统计分析实时化