项目背景
• 用户行为分析需要分析哪些内容?
你是谁?
非注册用户 注册用户
你从哪里来?
• 免费流量
• 直接打开网页
• 好友推荐
• 微信/微博/QQ
• 友情链接
• 搜索引擎自然流量
• 付费流量
• 上网导航
• 广告直通车
• 搜索引擎SEM
• 为何要分析用户来源?
• 不同流量质量存在差异!
你要到哪里去?
• 在浏览的过程中会留下各种行为数据!
访问路径 ,各个页面停留时间
页面行为
你要到哪里去?
• 终极目标:促使用户形成转化效果
• 购物类:淘宝、京东、小红书、拼多多 • 促进购买
• 理财类:陆金所、蚂蚁财富 • 促进投资
• 新闻类:今日头条 • 提升阅读量
• 视频类:爱奇艺、腾讯视频 • 提升观看量 • 购买会员
行为数据价值
• 作为评价指标 1. 哪个页面访问人数最多 2. 哪个商品最有价值
• 构建画像 1. 用户属性画像 2. 用户行为画像
• 促进转化率 1. 构建渠道分析模型 2. 构建广告点击模型 3. 构建商品推荐模型
• 风险控制 1. 识别羊毛党 2. 团伙欺诈
数据指标
流量指标
- PV: Page View 网页页面访问数
- UV: Unique Visitor 网站页面访问用户数
- PVUV: Page View Per User 平均每位用户访问页面数
- PR : PR PageRank 搜索引擎用来量化网页等级的指标
客户价值指标
- 获客成本: 获得一个客户需要付出多少成本
- 存留率 : 经过一段时间后仍然继续访问网站的用户比例
- 消费金额:消费总金额,平均消费金额
- 消费频次: 指一段时间内,平均一个消费者发生消费的频次
行为指标
- 停留时间 :浏览页面逗留时间
- 点击收藏次数: 商品被收藏次数
- 在线支付次数: 在线支付次数
- 加入购物车次数 :点击加入购物车次数
- 下单次数 :提交订单次数
- 点击热图 : 热衷关注的页面区域
- 跳出率 : 进入网站后跳出的百分比
- 转化率: 多个不同的事件按照一定顺序依次触发的比例
营销指标
- 新增访问数: 营销活动所带来的新增访问数
- 总访问数: 营销活动所带来的总访问数
- 订单数: 营销活动所带来的相关订单数量
- 转化率: 访客变成客户的比例
- ROI: 投资回报率:通过投资而应返回的价值
数据搜集
• 所有的访问行为均以日志的形式记录
• 日志文件离散存储
• 日志文件非结构化
• 记录数量巨大:TB级每日
• 数据孤岛
• 文件
• 访问日志
• 行为日志
• 数据库:MySQL/Oracle
• 业务数据