标签类目体系(面向业务的数据资产设计方法论)-读书笔记4

第4章 道:4个核心原理

一、业务与数据的链接发展

(1)V1.0:使能

用平台工具提升数据处理的操作效率、降低技术操作门槛,这是一种让技术人员将数据使用起来的层次。

(2)V2.0:更快

将技术、数据、文化这三个要素在数据中台中进行统一,提升企业业务应对变化的能力(数据中台战略核心是让业务人员利用可重复的技术方法快速试错),这是一种让企业人员更快地使用数据、试错的层次。

(3)V3.0:智能

让数据智能有效地用起来,一方面数据操作系统更智能地理解含义,自动操作数据全链路;另一方面在数据应用上不断创新和深挖,这是一种让数据自己生产起来、繁衍生息的层次。

标签类目体系方法论的第一性原理是“树形结构的标签树”,这一基础原理可通过4个核心二级理论来具体阐述:

  • 根、枝干、叶/花
  • 能量、养分和凋零
  • 分形结构与资产树栽种模式
  • 资产树使用模式推演

二、根、枝干、叶/花

2.1 树的根决定了这是一棵什么树

设计标签类目体系需要从“根目录”开始梳理。“根目录”所对应的数据粒度为“对象”。对象分为实体对象和关系对象。因此存在两大类标签类目树:实体树和关系树。

2.2 树的树干对应标签分类

树的枝干部分对应的是标签类目体系中的类目,即标签分类。类目是一种分形结构,可不断分化下去;也可根据场景需要,截取任意一个子系统作为独立的标签类目使用。类目是对标签的分类,而非对对象的分类。

2.3 树的叶/花部门指向标签

树的叶/花部分对应的就是对象的各种属性,即标签。标签在数据库表中映射为字段,是经过大量数据应用实践验证的最合适的数据资产粒度。将根、枝干、叶/花串联在一起就构成了一棵标签树的基本结构。

2.3.1 叶和花就像动态标签、静态标签

(1)动、静标签的区别:动、静标签的区别在于某一对象个体在该标签下的标签取值是否会经常变化。

(2)动、静标签的联系:静态标签的取值可能会影响动态标签的取值。如性别取值为女,很可能会影响一些行为动作类标签取值。由大量动态标签的取值可以推测和推算出静态标签的取值。如通过大量的消费、浏览、收藏类标签取值可反过来推测性别标签取值。

2.3.2 叶和花似基因,影响群体形状

类目树上的叶/花就像基因片段一样,一一映射、影响着种群个体的属性表现,取之不一;而种群中正常个体的基因类型都一样多,标准统一。

2.3.3 标签类目体系实质上是对对象属性的模式设计

某一类对象的标签类目体系设计实际上完成了对该类对象属性的模式设计。设计好的标签类目体系就像模具一样,能将该类对象下具体个体的形象特征快速地刻画出来。

2.3.4 打标签和标签设计的区别

打标签类似于对具体实例树的某一片叶子涂上颜色,即标注标签值或计算标签值;而标签设计则是在模板层面的形状设计,两者不在同一纬度。

2.3.5 元标签

叶/花本身是对对象的属性刻画,同时也存在一些属性是对叶/花进行属性刻画,这些用来刻画标签的标签称为元标签。

标签体系设计师一种对对象统一进行本质刻画的数据描述办法:把个体观察升级为群体观察,而非过去对个体现象的归纳,更具有面向未来的场景化适应能力。

三、能量、养分和凋零

3.1 实体树之间通过关系树连接

关系树连接不同实体树,但动态标签不能简单地直接从关系树上摘下叶子粘贴到实体树上。需要经过对象角度的转化和统计形式的转化。

3.2 从实体树叶子回溯打开关系树森林

实体对象的动态类别标签往往经过统计或算法计算,是对一系列明细行为数据再加工所得。因此从实体对象树上的一片“有颜色”动动态叶往往可回溯出一大片具体的明细行为叶,甚至打开一片具体的关系实体树森林。

3.3 关系树向实体树赋予能量

实体对象的标签会随着与之相关的关系对象的增多而相应地增加和丰富起来。每新增一种动作、行为、连接,即关系树,就会在实体树上映射转化出一片新类型的叶子。

3.4 业务使用是对标签树的养分供给

如标签在业务中被广泛使用,则价值地位非常稳固,且会在数据资产体系中得到相应的服务保障,如数据治理、资源优先、运营营销等;但如果标签只被使用一两次就被搁置,或完全没有业务使用,则会因为营养不足而凋零下架。将没有复用价值的标签下架是必须考虑的标签生命周期过程,否则企业很容易面临数据资产爆炸的风险,即数据项越来越多,管理运营成本巨大。

3.5 最终梳理出一片森林而非一棵树

每一种实体对象、关系对象都会形成一棵独立的类目树,对企业数据资产用标签类目体系的方法梳理后,一般会整理出非常多的树结构。关系树结构一旦形成就会比较稳定,而不太会发生形态变化,而实体树结果会随着关系树的新增、消亡而发生相应的树形变化。

企业需要重点维护的就是使用频繁、具有复用价值的实体树,业务关系是现象,而实体往往是商业本质。

四、分形结构与资产树栽种模式

标签类目树和生命进化树一样,受到能量、环境影响而不断分化、形成丰富的标签簇,标签簇会经历优胜劣汰,自然选择。按照建设数据资产的目的和节奏不同,有两种模式可供参考借鉴。

4.1 完整规划,由浅入深

如果企业构建资产的目的是形成数据资产的完整规划,指导数据收集、整理、加工、挖掘等各阶段工作,并愿意花费较长时间来实施数据资产的整体规划,那么可选用这种模式

  • 选取对象经典类目树中最基础的枝干部分,在基础枝干类目下,按需添加标签,形成1.0版本的消费者标签类目体系。
  • 根据业务发展需求,进行中圈、大圈等全面扩展,此时类目树逐渐成长,类目众多,标签丰富。
  • 当现有基础数据或业务发展比较单一,或某一业务发展迅速、滋养某一类的标签快速发展时,也可能会出现单侧扩展。

无论采用那种方法,都需要从根部到基础树干,到细分枝干,再到树叶,体现的是一种整体规划思路。

  • 优点:全面规划、面向未来、可知道企业在数据端的全面布局
  • 缺点:建设周期长、见效慢,因此遇到的阻力大,必须作为一把手工程才能最终完成全面数据集资产从规划到落地实施的全流程。

4.2 纵深打穿,从局部直接截取

如企业构建资产的目的是支持业务场景,特别是使多个业务场景间能快速复用标签资产,需要快速减到数据成效,那么可选择该模式。

直接从对象经典类目树上任务部分截取所需的部分分支,拼装上根与叶子即可。因为标签类目体系是一种分形结构,整体和局部有同构性,任何一个局部分支都可剪切出来作为独立的类目树。

  • 优点:标签直接作用于业务,可快速得到业务滋养呈现数据价值,收到的质疑与阻力小
  • 缺点:当业务、标签不断变化调整时,整个类目结构会有较大的变动,甚至重构,影响较大。

在进化过程中,重要的不是都某一条线的极致进化,而是不断分化的分支。企业应梳理出全集团多业态多部门尽可能多的数据,不断进行能量映射和基因交叉,形成丰富有趣的标签簇,并通过标签类目体系方法进行有序整理和组织,使数据资产不仅能满足将来各种场景的需求,还具有非常旺盛的自我迭代能力和很好的可延续性。

五、资产树使用模式推演

通过标签类目体系方法论所形成的数据资产库包括资产清单和资产实体:

  • 资产清单:资产清单类似于资产目录,用户可通过资产目录/门户/集市界面,清晰明了地看到所有对象的标签类目体系。在选中某种树后,可看到这种树的具体枝干轮廓:一级目录、二级目录等。选中某叶子类目后,可看到其下所涵盖的所有标签列表。每个标签就像一片独特的叶子,拥有独立的ID、名称、逻辑、类型、值字典等元标签取值。
  • 资产实体:资产实体是在设计好的标签类目树模式下的具体个体实例,即每个对象个体。资产实体都具有该对象类目树包含的标签及标签分类,可简单认为资产实体是具体不同颜色的树。在库表存储层面,资产实体可映射为加工后的标签表中每一条具体的数据记录,这些数据记录拥有统一标准的列信息,但是具体的列取值则各不相同。

5.1 查询服务

  • 确定待查找对象
  • 创建查询服务
  • 查询服务创建好后生成API或交互界面,具体业务系统或业务人员即可调用API或通过界面系统操作来使用该服务。

5.2 分析服务

分析服务经常会运用在业务系统中OLAP分析型数据操作中,过程如下:

  • 梳理清楚分析的对象是什么
  • 选中对象,在服务管理中选中“分析”这类服务类型,进入服务的创建过程。
  • 分析服务创建号后生成API或交互界面,具体业务系统或业务人员即可通过API或通过界面操作系统来使用该服务。

数据分析就是对某一对象全体在某一属性标签上的取值处理,即对有颜色树叶在某一纬度切面上不同变形;取值分布就是颜色分布变形为不同数据轴上的数量表示;求平均就是将各种颜色在数量上差异变形为最终的调和色彩。

5.3 圈选服务

圈选服务经常会运用在对特定目标对象的操作中,先确认并选中对象,圈选服务创建好后生成API或交互界面,具体业务系统或业务人员可调用API或通过界面系统操作来使用该服务。

猜你喜欢

转载自blog.csdn.net/baidu_38792549/article/details/125715393