数仓建模—ID Mapping(上)

ID Mapping

ID Mapping 就如同它的名字一样,我们要做的就是将一系列的ID 关联起来,从而可以更加准确完善的分析一个用户。

选取合适的用户标识对于提高用户行为分析的准确性有非常大的影响,尤其是对用户画像、推荐、漏斗、留存、Session 等用户相关的分析功能。其实对于任何分析都是一样的,如果我们不能准确标识一个用户,那么我们的计算结果就没有准确性可言,其实对于数据服务方而言,数据的准确性是我们的第一要务,我们宁愿不出数据,也不要出错误的数据。

ID Mapping 的背景

网络身份证

假如没有网络身份证,那么每个商家(App)只能基于自己的账号体系标识用户,并记录用户的行为。而有了统一的网络身份证之后,各个商家之间的数据就可以打通了,天猫不仅知道用户A在淘宝系的购物数据,也能了解到该用户在社交网络的行为,以及旅游的喜好,等等。

在现实的数据中,由于,用户可能使用各种各样的设备,有着各种各样的前端入口,甚至同一个用户拥有多个设备以及使用多种前端入口,就会导致,日志数据中对同一个人,不同时间段所收集到的日志数据中,可能取到的标识个数、种类各不相同;

比如用户可能使用各种各样的设备,其次是不同设备有不同的操作系统,设置是软件本身的版本也会影响我们对用户的标识,

  1. 手机、平板电脑、PC
  2. 安卓手机、ios手机、winphone手机
  3. 安卓系统有各种版本 ( 5.0 6.0 7.0 8.0 9.0 )

猜你喜欢

转载自blog.csdn.net/king14bhhb/article/details/118960115