【转】机器学习@美团 ——吃喝玩乐中的算法问题

概要

1、背景
• O2O行业及美团简介
2、算法应用
• 机器学习在用户端的应用
• 机器学习在商户端的应用
3、总结
• 算法应用八大“坑”


1、背景

什么是O2O?

O2O(OnlinetoOffline)=本地服务(LBS)+ 线上连接
这里写图片描述

O2O行业应用图谱

这里写图片描述
这里写图片描述
来源:TalkingData及品途网 2014 O2O移动应用行业报告

垂直 vs 水平(平台)

这里写图片描述

美团简介

这里写图片描述

O2O的特点

1、O2O vs 网络电商
共同:双边市场
差异:LocaEon based,
消费距离受限

2、懒人经济:质优价廉
低价格 高品质
低成本 高效率
低毛利 高科技
这里写图片描述

移动化

这里写图片描述

场景化、即时化

这里写图片描述

O2O平台

传统模型:边际收益递减
平台模型:双边市场的网络效应 >= 边际收益递增 >= 平台价值
这里写图片描述

平台:用户端

这里写图片描述

平台:商户端

这里写图片描述


2、算法应用

机器学习@美团

这里写图片描述

用户端:运营拉新

背景:首购-­‐>留存,吸引已注册用户完成首购
目标:少花钱,多办事
这里写图片描述
方法:新用户画像 SVM分类
• 准确率:75%
• 召回率:68%
效果
• 拉新单位成本下降35%
单位用户营销成本=总花销/总新客数
• 总开支节省30%
这里写图片描述

用户端:推送引导

背景:对不活跃用户发个性化推送消息,提升访问及购买
目标:提高用户转化,减少打扰用户
方法:
这里写图片描述
效果:有效降低了对用户的打扰。

用户端:流量转化

这里写图片描述
这里写图片描述

推荐和搜索框架的统一

这里写图片描述

服务架构演进

17

基于spark的离线训练平台

18

美团搜索

19

搜索系统实践

20

查询分析

查询分析面临的问题
1、用户意图多元化
• 精确/模糊查询
• 领域多:寻找吃喝玩乐,购物,旅游,住宿…
2、用户查询自然语言化
3、检索基于字面匹配,缺乏语义扩展
4、语义漂移
21

意图识别

搜索意图歧义示例及解决方案
22

团单品类细分

品类内差异对用户造成的困扰
23
人工定义体系+SVM学习,构建覆盖全面合理的品类类目,更好满足用户精确品类检索的意图

美团频道筛选

24

频道筛选实践

25

重排序:特征

26

重排序:框架

27

数据实时化

• 预测结果随数据更新而变化

- 2小时销量数据
- 2小时内数据预测用户实时偏好
- 进入列表页请求用户地理位置,下单率提升3%
- 模型天级更新

• Online

- learning继续尝试中

28

美团推荐

29

推荐系统实践

30
http://tech.meituan.com/mt‐recommend­‐pracEce.html

用户冷启动

• 行为少,找不到有意义的相似用户
• LocaEon,locaEon,locaEon
• 基于地理位置计算用户相似性:作为替补策略,效果一般
• 浏览地附近热单,作为上下文信息使用

加入context

31

用户端:流量转化

32

商户端:不仅是算法挑战

33

团购单销售额预估

背景:在线deal数量众多,需要关注deal的质量
目标:评估deal的质量
方法:
分解问题
• 以销售额来代表质量
• 再分解销售额
根据问题特征/模型并迭代
34
效果:
1. 访购率预测准确率(R2):0.8
2. 价格特征权重符合产品预期
http://tech.meituan.com/mt‐mlinacEon‐how­‐to‐ml.html

电影票房预测

  • 背景:电影票房预测数据可以指导片方发行/院线排片
  • 目标:得到可用票房预测
  • 机遇:
    猫眼30%+市占的数据
    用户其他行为及消费记录
  • 挑战:
    东西方人情世故不同
    演员/导演的名气不靠谱
    度量搜索/社交媒体效果不理想

3、总结

学习算法应用八大 “坑”

确实需要上算法么?
星际可以穿越,但特征不能!
算法一定要酷炫
算法准确率不到90%就是耍流氓?
重算法、轻速度(响应速度/迭代速度)
上线就是大功告成
线上AB定一切
统计分析实时化
35

转载自 【美团技术沙龙】 有需要的可自行联系

发布了77 篇原创文章 · 获赞 55 · 访问量 13万+

猜你喜欢

转载自blog.csdn.net/langhailove_2008/article/details/82588716