如何搭建数据指标体系

1.为什么要搭建数据指标体系

  • 可以形成对业务的全面了解与数据监控,利用数据驱动业务:有一个全面的数据指标体系能让我们在‘‘是什么”的层面对业务现状有清晰的了解。
  • 出现问题时能够及时进行报警、定位和分析,方便排查问题:全面的数据指标体系基本上覆盖了核心的业务场景,我们能够针对一些关键指标设立预警机制及时报警发现问题,同时问题出现后,比较全的指标体系也能够支持我们多维度分析和排查问题,找到“为什么”以及“如何做”的方向。

关于预警指标举个例子:比如日活一般是业务方比较关心的指标,如果某一天的日活出现大幅度变化,可能是产品发生了一些严重的bug,可以把日活设为预警指标,出现问题时及时报警发现问题修正问题。

2.搭建数据指标体系的思路

1.梳理业务场景及产品核心流程,同时跟业务方沟通数据指标需求

a.一个全面、完整的数据指标体系都会包含不同业务场景或者不同流程的指标,比如一个在线教育app的数据指标体系,可能包含渠道部分的数据指标、产品功能使用相关的数据指标、课程订单的数据指标等。一个产品的数据指标体系通常是涉及到全部业务场景的,因此有时候也是比较杂乱的,按照业务场景来梳理会比较清晰一些。

以B站为例,我们该怎样考虑这个产品的数据指标体系呢?
首先,B站是一个视频类内容产品,关于内容产品就要考虑内容的生产、分发、消费,可以按照这个思路先划分出三大核心场景,其次,B站的付费业务是大会员和会员购,这部分又是一个场景,同时动态部分也是内容社区,可以搭建社区相关的评估指标。
场景的划分基于对业务和产品的全面了解,当然也可以按照公司自己的业务线来划分业务场景,比如直播业务线、游戏业务线等。

b.不同类型的产品的业务目标、产品流程不同,数据指标体系也不一样。比如一个C端和一个B端的产品关注的数据指标体系不一样,一个工具类型的产品和一个社交类型的产品数据指标体系也有很大差异。因此在搭建指标体系之前,建议先画一个流程图完整的梳理出当前产品的流程图或者说用户在产品内的操作路径,结合流程图来完善数据指标体系。

同样以B站为例,关于视频部分我们怎样在梳理流程后搭建指标体系呢?
粗略梳理的流程如下:
视频生产-分发-曝光-用户点击-观看-退出观看/点赞、评论、关注、收藏、转发、投币等,关于用户观看这个行为,可以梳理的指标有:观看人数、观看时长、人均观看时长、视频完播率、退出率等

c.明确了业务逻辑和产品流程之后,你会有一个初步的指标体系,但是前期跟业务方的沟通是必不可少的,因为数据指标的最终应用是希望可以辅助业务、驱动业务,因此一定要关注业务方的需求是什么,业务目标是什么,这就明确了数据指标体系到底该包含哪些部分,以及要细化到什么程度。

1)明确包含哪些部分指的是我们初步梳理的场景和流程是否涵盖了业务方的需求,如果没有包含的需要再扩充进来。
2)细化到什么程度这个时候是在跟业务方确认需要完善的指标维度到底有哪些。比如视频的观看时长,需要的维度要细化到每类视频的观看时长、每个频道下的视频的观看时长、不同省份的用户的观看时长等,那类型、频道、省份就是我们后面需要完善的指标维度。

2.结合业务场景和业务方需求,按照不同划分方式搭建指标体系

  • 前面我们已经确定了核心的场景和流程,这个时候就需要按照一定的划分标准或者说思路尽量覆盖全这些需求来搭建指标体系。
  • 举例介绍几种常用的划分方式,来让指标体系更结构化更有主次。

1)在线教育类产品,有教师端、学生端、家长端,可以将一级的业务场景划分为这三端,再去拆分二级指标体系,比如教师端再细化为教师的上课情况、作业批改情况、与学生互动情况等。同样o2o类产品都可以先分端再分场景,比如滴滴可以分为司机端和用户端。
2)社交类产品,比如soul,在搭建指标体系时,可以结合正向指标和负向指标来完善指标体系。
3)有些指标也会按照过程指标和结果类指标划分,也可以按照这个标准来思考自己的指标体系是不是覆盖全面。

3.明确数据指标的定义、完善分析维度、时间粒度以及数据的实时性、取数逻辑

  • 指标的定义包括业务描述、数据口径和计算公式

以日活为例:
1)业务上的描述是:每天活跃的用户数
2)数据口径是:每天启动/打开app的用户数
3)计算公式:因为日活是一个原始的单次指标不是复合指标,所以这里没有计算公式,一般转化率等复合指标,需要明确计算公式
你可能会问,为什么要明确这些?再说一下,不同的产品、不同的业务可能对日活的定义是不一样的,比如B站用户量已经很大了,也可以用每天真正点击视频观看的用户数作为每天真正活跃的用户数,因为这些看视频的用户相对于仅打开app逛一下就走的用户是更有价值的。

所以,笔者想说的是,数据指标的定义很关键。

在应用层面,数据指标定义的规范和统一可以让大家对这个数据都有一样的理解,沟通交流更方便,其次,统一的口径更利于数据指标体系在整个公司层面应用起来。还有,根据笔者经验,一个公司如果数据口径不统一不规范,大部分时间不是在利用数据分析数据,而是各部门各个业务线之间在对数据diff。因为数据口径不统一,大家各有各的说法,你不信我的数据结果,我也不服你的数据结果,这就丧失了搭建数据指标体系的初衷。

  • 维度指的是每个数据指标可以从哪些角度来细化

梳理清楚指标的维度可以帮助我们更好的了解一个指标到底可以从哪些方向下钻分析。这对于后续业务的深入分析、数据问题定位都非常有用。同时我们看指标也不单单是只看一个总指标,为了深入了解业务,一定要对各个细分指标都清楚。

  • 时间粒度指的是数据指标是按照秒、分钟、小时、天、月、年等粒度来查看。有些数据指标没必要精确到秒,有些数据指标我们只看月度就可以,因此时间粒度也需要明确好。同时这也涉及我们后续能不能实现这个时间粒度的问题,比如某些数据指标业务需要看秒级别的,但是目前数据采集方面技术无法实现,那就不能把这个指标放进来。
  • 数据的实时性指的是数据是实时的还是离线的,实时的数据是实时上报的,数据产生了我们就可以取数看到数据,离线的数据比如今日的数据次日可以看到。
  • 取数逻辑其实也就是我们的数据指标的定义,定义清楚了我们就知道怎么取了,但是这里单独拿出来是因为,涉及到具体的字段、具体的表还是需要一一明确的。同时在这个环节也需要确认目前数据库或者数据平台存储的数据是否满足搭建的指标体系的需求,这个环节要取数验证所建立的指标体系是不是都有数据,保证数据的准确性和完整性。

多说一句如果数据不完整、数据质量差怎么办?

其实公司数据资产多了之后数据质量差是比较常见的,很难保证你建立的所有指标都能完美的取到数据,比如某个埋点属性缺失了,那你的指标就少了一个分析维度,比如某个指标之前的口径和现在的不一致,之前的字段无法再利用等,这些都是比较常见的问题

因此,在这个阶段,其实不仅仅是明确取数逻辑这件事,你还需要做的是,验证一下数据是不是都能准确的取到,注意一定是准确的取到。如果发现有问题的地方,记录下来,让负责相关数据库或者底层数据表的部门来完善数据字段,保证后续数据的可用性、准确性、完整性。

3.搭建数据指标体系的过程中注意事项

  • 跟业务方多沟通,毕竟业务方才是最终的应用者,建立的指标体系数据看板等都是为了辅助业务、驱动业务。同时多和业务方沟通,分析师自己也会有业务输入,可以更了解业务。
  • 有全局意识,确保数据指标能够在公司层面应用起来,这就要求搭建指标体系时要尽量保证指标口径统一,数据准确完整,能让大家沟通使用更边界高效。
  • 如果自己公司有数据平台或者数据产品,最好是把数据指标体系建立为自动化的数据看板,能节省取数做报表的时间,省时省力。
  • 数据指标体系也是不断完善和迭代的,比如新增加了业务或者某些产品功能迭代掉了,那就需要及时更新数据指标体系。

猜你喜欢

转载自blog.csdn.net/HanhanhanTOTORO/article/details/113139671