第2章 源:6段由来过程
一、数据资产发展的4个阶段
1.1 数据资产1.0:构建消费者信息库
1.1.1 数据侧与业务侧的初次接触
数据侧为业务侧打造的第一个数据解决方案一定要成功,必须在首次合作中为业务人员把数据项、数据加工逻辑、数据使用方式、数据赋能下过等全链路内容设计到位,保障业务人员低门槛地使用数据方案。
深入业务一线的数据产品经理会持续将业务部门的数据需求回传给数据部门,数据部门根据这些数据需求就可以构建起数据资产的0.1版本。
1.1.2 激发业务人员使用数据的兴趣
数据产品经理给业务人员设计一些更具有业务气息的统计类标签,如“最常上网时间段”、“购买周期”等,这些标签通过统一函数加工运算实现。在业务人员逐渐熟悉标签,对标签的兴趣被大大激发后,业务侧会主动提出一些算法类标签的要求,eg:“预测性别”、“预测年龄”等需要通过大量行为预测的基本状况属性标签。这些属性标签逐渐深入到人的核心本质层面,也更贴近业务端对消费者画像洞察的要求。数据侧提供的标签信息带动和激发了业务侧的数据场景想象力。
只有价值线和数据线共频共振,互相迭代,企业的数据资产体系才能真正构建起来。标签小组持续不断地与广告部门同事梳理已有可用标签,制定新标签的开发计划,保质保量完成标签生产上线,并以第一优先级的资源供给给保障广告核心引擎使用数字资源的通畅性。
1.2 数据资产2.0:ID-Mapping打通数据
- ID-Mapping技术在广告领域中的一个里程碑意义在于:从此精准营销确立了从数据接入→客户识别→人群圈选→透视分析→定向投放→回流优化的完整闭环链路;同时这种营销链路具备了与外部数据资源对接、共享数资源的能力;从数据层面论证了广告联盟生态的可行性,对广告生态系统产生了重要的额推动作用和印象。
- 通过消费者标签库对数据价值的不断验证以及ID-Mapping技术持续打通不同板块间的数据,数据合作和收购的进程不断加快。
1.3 数据资产3.0:全集团数据共享共荣
- 双方各司其职:数据部门做好数据资源的统一管理和调用性能的稳定保障,而业务部门则可专注于业务场景优化和打磨数据创新引用。数据融合必须达到1+1>2的效果。随着消费者标签库的数据来源越来越多,数据体量越来越大,标签的完备率和准确率也随之提高。当“在数据中心之外,找不到比这更好更全的数据资产”这句话变成事实时,客户就会将自己的数据后背交给你。
- 在数据资产3.0阶段,致力于打造数据联盟生态圈。
- 数据联盟生态形成了稳定的自助循环:各业务数据系统都插有数据回流的接口,数据源按周期调度并与数据中心同步,实现数据资源更新和数据资产的自动化加工,按需配置的数据服务被各业务系统平稳有序地调用和运行。
1.4 数据资产4.0:更广泛领域的数据实践
仔细推敲,增加标签的场景、时空维度,使标签能真实还原出任意场景中的立体对象,或该对象身上任意切片的全光谱信息。数据资产版本4.0,对象概念有了初步的提炼和扩展,并且在标签的颗粒度处理上游了思维认知的提升。
二、方法论抽象的2个阶段
2.1 方法论 0.1:方法梳理
2.1.1 先梳理标签还是对象
梳理数据资产涉及方法论的过程中,第一件事情并不是直接关注“标签”,而是把注意力放到标签的核心本质——“对象”身上。只有把一家企业经营流程中涉及的所有对象都整理和筛选出来,才算确立了标签生长的根基。
2.1.2 对象到底有哪几类
不能在原有“场景”概念上进行修饰,因为“场景”和“关系”是截然不同的两个概念。将对象的最新定义及时同步给数据产品经理,建议他们在了解最新的对象定义后,在梳理或修改已有的数据资产设计。
2.1.3 标签类目体系雏形
标签是数据资产的载体,要实现某一对象的完整刻画,就需要将标签充分梳理出来。当标签达到一定数量时,就需要有一种标签的分类管理方法,即合理设置的标签体系。标签的目的是统一标准,让标签设计师们少走弯路,保障数据资产设计的质量和效果。这些规范原则都提炼自过去几年在资产设计全环节各部门提出的各种建议和要求以及数据部门自身的经验教训,已经是比较全面的标签规范集锦。
2.2 方法论1.0:原理研究
2.2.1 基础理论的重要性
有了基础定义,才会有后续的演绎推导,很多争论和怀疑就自然消解了。在具体行动之前,要先了解清楚定义和基本原理,这非常重要。
2.2.2 以树为原型的理论框架
标签类目体系的基本原理框架:数据资产树的基本结构、生长原理、栽种与使用模式。“树形结构的标签树”可以很好地推演出标签树的类目结构、生长和凋零的仿生学过程,以及种树与用树的区别及联系。
2.2.3 不断丰富完整的过程
标签类目体系方法论正式进入1.0阶段,涵盖了由来、原理、方法、实践落地等基本要素,经理了大量复杂项目的适用性考研。以标签为载体的数据资产构建模式在各行业头部企业中被广泛传播并重点引入。方法论的优化迭代穿插在热火朝天的客户现场、塑造价值的数据生成车间和安静自律的研究桌案之间。
2.3 标签在数据系统中的定位
2.3.1 标签在数据资产中的位置
从广义上讲,企业拥有的所有数据资源,包括原始数据、中间数据、临时数据、数据类目体系、标签类目体系、标签、标签类目体系方法论等都是数据资产。
从精准定义上讲,数据资产是指由企业拥有或控制的、能够直接为企业带来经济利益的数据资源。以标签形式组织的数据资源就是数据资产的最佳呈现方式。以标签形式组织的数据资产就是数据资产的最佳呈现方式。由于标签是业务导向的组织方式、通过元标签信息能够让数据资源变得可阅读、易理解;同时标签态的数据组织方式是最小使用和管理单元,能让数据资源兼具好使用、有价值的核心特点。通过标签对数据资源进行转化和组织,才能最佳实践数据资产看、选、用、治、评的完整运营链路。
以标签为组织载体的数据资产具有以下8个显著而独特的重要特征:
(1)能确权
所有的数据资产都应该是由某企业或机构合法取得或有效管理的数据源清洗加工而来,否则不能称为资产。
在大型集团公司中,会划分拥有数据资产归属权、管理权、使用权的角色:数据源采集、提供部门拥有数据资产的归属权;数据资产的设计、加工、管理、运营部门拥有数据资产的管理权;数据资产的使用、消耗部门拥有数据资产的使用权。
(2)可阅读
通过数据标签化,将难以触碰的数据信息转化为前段业务可获取的标签信息,实现对象类型可筛选,类目体系可折叠查看,标签列表可阅读:数据人员或业务人员可按需调取任一标签的所属类目、标签名称、标签定义、标签逻辑、标签取值等基本信息,同时在标签详情中科看到该标签适用的数据应用场景、历史业务端服务调用情况、数据资产消费方的评价反馈等使用信息。标签化使得数据可阅读,推动了业务侧参与数字化转型的建设过程。
(3)易理解
在将数据标签化的同时,利用元标签将难以理解的数据术语转化为通俗的业务术语,并通过标签创建、设计时的规范操作使元标签信息都得以完整记录。从数据到标签的转化,不仅实现了数据术语向业务术语的转化映射,而且在标签设计的过程中,标签方法论要求每个标签设计师都按照规范填写《标签详细设计文档》。
(4)好使用
标签化的数据资产建数据可用单元切割到最小粒度。使用标签的思路也向业务端靠拢:将数据最小可复用单元封装成“商品”。标签创新了一种数据使用模式:将数据打散到最小粒度单元,每次使用时,以搭积木的方式灵活选取所需零件,通过工具或平台支撑快速完成某一数据服务或数据应用的装配。
(5)可计量
某一项标签数据的搜索量、浏览量、申请量、调用量等都可以被系统记录和计量。可计量的特性有利于标签的优化和运营,帮助控制标签的安全使用,评估标签的业务使用价值。
(6)有定价
数据资产一定存在可衡量的价值裁定。在数据价值探索的商业世界中,必须关注成本支持与利润回报;数据资产有采集、生产、管理、运营等成本,数据资产的使用方需要为数据资产的使用“记账”或“买单”,同时数据管理方必须从价值的考量出发,不断优化和更新数据资产的最佳配置。
(7)可管控
数据资产必须是可控制的,否则会有巨大的安全风险和管理成本。标签化的数据资产可以通过标签管理系统进行全生命周期的运营管理,包括元标签信息管理、标签标准管理、标签安全管理、标签质量管理、标签成本管理、标签价值管理等。
(8)可增值
数据资产是一种越用越多的特殊资产,只要按照标准动作规范建设数据资产,并以数据价值为导向运营数据资产,其价值就会不断迭代,具有不可限量的增值空间。
2.3.2 标签在数据中台中的位置
(1)什么是数据中台
- 从架构角度看,数据中台承上启下数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。
- 从实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案。
(2)标签在其中的重要位置
- 数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。通过数据中台对底层复杂技术能力的抽象封装,前段业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。
- 在数据中台内部,具体又分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块。原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断地治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可学习的,但数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。
- 数据资产和数据服务中最核心的是标签:数据资产身份以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。
2.4 关键术语的定义和解释
(1)数据
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合。
(2)数据资产
由企业拥有或控制的,能直接为企业带来经济利益的数据资源。
(3)数据中台
数据中台是一套可持续“让企业数据用起来”的机制。
(4)标签
标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。
(5)元标签
元标签是标签的标签,即对标签的属性信息(特别是业务化属性信息)梳理。
(6)类目体系
类目体系指对某一类item(事物)的分类、架构、组织方法。
(7)数据类目体系
数据类目体系是将企业原始拥有饿数据字段,采用类目体系的方式进行梳理所形成的目录结构。
(8)标签类目体系
标签类目体系是将企业业务上所需的标签,采用类目体系的方式进行梳理所形成的目录结构。
(9)对象
现实世界中所需要研究的目标。
(10)人
会主动发起行为动作的对象。
(11)物
行为动作中的被动对象。
(12)关系
人和物、任何人、物和物等两个对象间发生的某种连接。
(13)场景
某环境下,具体对象(人、物、关系)在时空中的表现。
(14)后台类目体系
后台类目体系面向数据资产管理人员,是企业数据资产的全集, 较为稳定,按照统一的分类方式进行标签的挂载、查看、管理。
(15)前台类目体系
可以根据场景需求,将标签按照前台场景组织新类目,形成前台类目体系。