——————
思考:
-
用户画像的最佳实践还是在互联网或者电信这种有用户各行动环节浏览记录的企业,对于线下B端企业,对于用户画像确实是难以做到的。即使是银行保险类企业,用户画像的数据源也需要与电信类企业合作。因此用户画像的能力需要平台赋能才能真正实现。
-
用户画像目前基本等同于用户标签,主要有两个作用:
-
作为上游数据源,为推荐、广告、搜索等下游产品线提供处理后的标签信息
-
辅助产品、运营、决策人员,做决策判断
-
——————
一、用户画像概览
-
用户画像目的
-
个性化推荐
-
精准广告
-
精准运营:找到运营活动的目标人群
-
辅助产品设计:了解用户,识别不同用户的不同需求
-
辅助决策:行业趋势、竞对分析、地域分析、排名统计等
-
-
用户画像的维度
-
人口属性:性别、年龄、常驻地、籍贯、身高、血型等
-
社会属性:婚恋状态、受教育程度、资产情况、收入情况、职业等
-
兴趣偏好:摄影、运动、吃货、爱美、服饰、旅游、教育等
-
消费能力:消费能力(可以细分到对某个品类的消费能力,如宅男对衣服品类消费能力低,但是对动漫、周边、游戏消费能力高)与RFM等
-
意识认知:消费心理、消费动机、价值观、生活态度、个性等,是内在的和最难获取的。举个例子,消费心理/动机。用户购物是为了炫耀,还是追求品质,还是为了安全感,这些都是不一样的
-
-
用户标签的类型(参:https://mp.weixin.qq.com/s?__biz=MzU4NzM2NTQ0Nw==&mid=2247483913&idx=1&sn=2b819b3da396b181895a0527f5bb4da9&chksm=fdec6f21ca9be637357ac5db31f2df8dfd035f19d7dca9a06b26e7914f0df082fa7bbc4103cd&scene=21#wechat_redirect;https://mp.weixin.qq.com/s?src=11×tamp=1531800641&ver=1003&signature=BY9spMTKNymz2yOrjr8kYc0H979*5HC-Pf1IN9gKyyAEdBn1ws*mJ0ZaB935N9grH6jzowJxRVqUnXKhwPXbDuh10t2OgYu39nj3pArru7Sk6TjrSqmxWmaNJNGs9KA6&new=1)
-
事实标签:直接从原始数据中提取,例如性别、年龄、住址、上网时段等等
-
模型标签:需要建立模型进行计算,例如美妆总体偏好度
-
统计型画像:是客观存在的,多为兴趣偏好。比如,用户每天都在看汽车新闻、搜索汽车相关的内容,基于这种行为,我们判断这个用户对汽车感兴趣
-
算法型画像:需要通过用户行为做预测,像用户的性别预测,尤其是挖掘人的内心态度。比如,用户在消费时,是激进的,还是保守的。这里包含有监督和无监督模型,有监督通过人工标注少量标签的方式进行拓展;无监督通过聚类然后命名的方式打标签
-
-
预测标签:通过预测算法挖掘,例如试用了某产品后是否想买正品、流失概率等
-
-
用户标签提取方法
-
原始数据基本提取方法
-
兴趣偏好
-
通过访问网页的域名、title等结构化信息
-
通过访问网页的正文内容抽取(参eBay案例:https://blog.csdn.net/u013382288/article/details/80385814)
-
-
性别
-
身份证等确定信息
-
浏览记录、购物信息建模
-
通过姓名预测性别:考虑到中文中偏旁具有性别的识别能力(如嬛等女字旁文字),因此可以用 姓名+五笔编码 作为特征输入模型,如女V+罒L+一G+衣E = VLGE (参:https://mp.weixin.qq.com/s?__biz=MzI2MzM3MzkyMg%3D%3D&mid=2247484433&idx=1&sn=f30a6a3585becc1a500772aaa78fd937&scene=45#wechat_redirect)
-
-
-
-
行为成本越高,标签权重越高(如购物>收藏>浏览)
-
行为越接近现在,标签权重越高(引入衰减因子解决,标签权重=Σ衰减因子*时间间隔*某时刻标签权重)
-
归一化
-
-
标签间关系
-
树状关系:尽可能的遵循MECE原则(相互独立、完全穷尽),尤其是一些有关用户分类的,要能覆盖所有用户,但又不交叉。比如:用户活跃度的划分为核心用户、活跃用户、新用户、老用户、流失用户,用户消费能力分为超强、强、中、弱,这样按照给定的规则每个用户都有分到不同的组里(参:https://mp.weixin.qq.com/s?__biz=MzU4NzM2NTQ0Nw==&mid=2247483913&idx=1&sn=2b819b3da396b181895a0527f5bb4da9&chksm=fdec6f21ca9be637357ac5db31f2df8dfd035f19d7dca9a06b26e7914f0df082fa7bbc4103cd&scene=21#wechat_redirect)
-
网状关系:
-
标签间关系的识别:简单地如共现,复杂的如标签embedding
-
标签传播
-
-
-
标签质量评估
-
用户分层评估:针对于重点人群进行评估,不同人群分层进行评估
-
全局评估:不要只局限于样本集合的评估,参看一些全局统计数据。例如,人口属性的分布和统计局的结果是否相符
-
应用反馈效果:将标签直接应用于使用场景中检验效果。例如,进行营销的定向投放,测试点击率
-
利用其它数据佐证:使用其他行为数据来验证标签的有效性。例如,在电商环境中后续的行为差异来评估显著性
-
多源交叉检验:多源生成的标签,检验是否一致(如不同数据源生成的性别标签)
-
-
用户画像流程总结
-
明确画像服务的业务目的
-
明确可以获取的数据字段
-
建立用户画像维度框架
-
用最简单的方法得到画像标签,投入业务使用,获得反馈
-
优化标签,提高效果
-
-
其它要点:
-
不能简单看画像分布,要做对比,如TGI
-
二、用户画像实践案例
case1 顺丰数据画像
-
目的:面向C端,做品牌维护和精准营销
-
数据源:
-
内部:快递数据、金融数据、电商数据、O2O数据
-
外部:向第三方购买的数据、自己爬取的数据
-
-
会员标签维度:用户ID、基本属性标签、快递类标签、金融类标签、电商类标签、O2O标签
-
会员画像维度(通过标签的组合实现):客户价值(基于用户的寄快递行为以及社区行为,如“寄快递少但是出于寄快递网络的核心节点”)、购买力、营销响应、品牌态度、客户忠诚
-
业务实践效果:无介绍
case2 58同城
-
目的:
-
Face API:实时查询标签
-
离线画像数据:用户统计分析、建模,如搜索、推荐、推送、广告、金融、用户身份识别、安全
-
Smart 网站:
-
推送筛选:帮助运营人员选定目标人群
-
人群分析:以标签为维度,生成报表,方便产品和运营人员使用
-
-
-
数据源:各子产品的日志、简历库、帖子库、用户信息库、商家库、认证信息库等
-
会员画像维度:人口属性、业务偏好、设备偏好等
case3 友盟超级用户
-
企业选定自己的“超级用户”,上传超级用户列表。友盟根据用户画像做超级用户的lookalike得到放大后的目标人群,然后对目标人群进行细分、确定营销方案、投放广告触达
case4 电信用户画像用户e9套餐升级营销活动
-
背景:某省电信运营商e8套餐(宽带+固话)升级e9(宽带+固话+手机)的主要业务目标为针对e8客户加装电信C网号码并购买手机,升级为e9融合套餐或e9自主套餐用户。即,通过电信的自身的宽带客户资源,进行精准电话营销,促使用户购买手机,从而提升电信在手机市场的占有率。
-
目标:
-
找到目标投放人群
-
目标投放人群细分,设计针对性的营销方案
-
-
数据源:电信内部已经有比较完善的数据体系,并且有已经转换的用户数据。因此建立有监督模型即可
-
过程:
-
特征选择与合并:
-
分类器:由于主要需求是指定营销方案,因此采用单棵决策树作为分类器
-
-
结论
-
目标用户群:
-
用户细分命名:
-
case5 基于用户画像的腾讯大数据防刷架构
案例地址:http://bbs.qcloud.com/thread-10745-1-1.html
-
目标:区别刷单用户与普通用户,对于疑似刷单用户采取二次验证的方式检验
-
用户画像维度:
-
网络属性:代理IP、VPN IP、网关IP、服务器IP
-
地域属性:国外IP、IP归属地、高危地区
-
业务属性:登录腾讯业务、登录的腾讯用户量
-
恶意属性:DDOS IP、肉鸡IP、腾讯业务作弊IP
-
case6 美团外卖用户画像实践
案例地址:https://zhuanlan.zhihu.com/p/25731678
-
目标:
-
新客运营:新客在哪?偏好如何?消费力如何?
-
场景运营:公司/家 * 饭点/下午茶/夜宵 * 周末/工作日
-
流失预测:流失概率标签,以及流失原因分析
-
case6 用户画像在金融领域应用
-
目标:银行、保险、证券,找到目标用户;并参考用户画像,设计营销方案
-
数据源:
-
社交媒体信息
-
呼叫中心
-
垂直论坛:汽车、母婴等
-
移动轨迹信息:住宅区、消费地区、工作地区等,同时可以作为对用户信息的检验(是否是真实的高收入人群?)
-
APP使用信息:与运营商、推送SDK公司等合作
-
-
用户画像主要维度:
-
人口属性:能定位到用户是谁的信息。包括姓名、性别、电话号码、邮箱、家庭住址等
-
信用属性:描述收入和收入潜力情况的信息。包括职业、收入、资产、负债、学历、信用评分等
-
消费特征:描述消费偏好,用户找到高频和高价值客户。包括差旅人群、境外游人群、旅游人群、餐饮用户、汽车用户、母婴用户、理财人群等
-
兴趣爱好:用户定向营销活动。包括旅游爱好者、科技发烧友、健身爱好者、奢侈品爱好者等
-
社交信息:用户的社交媒体评论,用于了解到用户的近期需求,如在哪旅游、是否正要买车
-
caseN 小案例
-
宝马广告投放:宝马X1今年刚上市,他们把去年购买X1的用户都上传上来,我们会分析这样的用户在哪些方面是有特性的,比如年龄段、地域分布、收入、偏好。有了这样的分析后,我们可以选择相应的人群,基于历史的偏好、特征,然后再去投放;如果中间我们会发现人群量不够,最初选择10万人可以放大到100万人。最后输出到媒体、RTB等渠道商。做预算,看效果,将效果数据回流,再去迭代,以进一步提高投放的精准率(参:https://mp.weixin.qq.com/s?src=11×tamp=1531800641&ver=1003&signature=BY9spMTKNymz2yOrjr8kYc0H979*5HC-Pf1IN9gKyyAEdBn1ws*mJ0ZaB935N9grH6jzowJxRVqUnXKhwPXbDuh10t2OgYu39nj3pArru7Sk6TjrSqmxWmaNJNGs9KA6&new=1)
-
餐饮店:
-
用户画像学生为主:寒暑假为营业淡季,需要调整策略;九月份需要做顾客重召回
-
用户画像白领为主:价格不敏感;考虑办公室饮食场景;考虑减肥餐以及包月餐等
-