标签类目体系(面向业务的数据资产设计方法论)-读书笔记7

第7章 器:标签工具

标签工具的核心模块包括标签体系设计、标签同步加工、标签管理、标签门户、标签应用等。

  • 通过标签体系设计模块可搭建标签类目体系基础框架,并实现逻辑模型与物理模型间的映射。
  • 标签同步加工模块实现标签体系的底层物理表数据在不通存储资源之间的交换流转,以及标签映射字段的开发加工。
  • 标签管理模块完成对标签维护、标准、质量、价值、安全等方面的管理。标
  • 签门户实现标签资产的概括总览与集市开发。
  • 标签应用模块帮助用户快速搭建满足业务场景需求的查询、分析洞察等数据应用以发挥资产价值。

1、标签体系设计

一个标签类目体系的完整设计过程可以通过对象设计、类目设计、标签设计等功能模块实现。

1.1 对象设计

设计一个标签类目体系首先需要确定对象。在创建对象的过程中,需要录入清楚对象的基本信息。对象分为实体对象和关系对象两种,在创建关系对象时,需要额外关联清楚该关系所涉及的实体对象。

某一个对象创建完毕后,需要将该对象与某一物理表主键关联在一起,进而实现该对象的底层数据逻辑映射。

1.2 类目设计

类目层级的创建模式可参考文件夹或目录的创建模式:可创建并列的同级目录,也可在某级目录下创建子类目。设计类目时,除了需要设计类目层级,还需要对类目进行标签命名并系统编号。

1.3 标签设计

标签创建过程中,需要录入标签的基本信息和场景信息。基本信息包括标签名、标签描述、加工类型、标签逻辑、值字典、取值类型、安全等级等。场景信息包括标签适用的行业领域、适用的业务场景、已经被使用的行业领域、已经被使用的业务场景等。

除此之外,标签设计还包括评估信息和血缘信息:评估信息包括标签质量分、标签价值分、标签累积调用次数、标签热度分等,需要在标签使用过程中由系统自动记录并运算得出;血缘信息则需要在标签实际开发完成后通过关联映射操作完成。

标签创建完成后,需要将逻辑标签与物理字段绑定映射。通过字段映射后的标签,才能关联到真实的数据取值供后续业务使用,否则就仅仅是一种逻辑设计,无法落地应用。

设计好的标签体系在标签同步和标签管理后,就可在标签门户中进行发布共享,供业务人员查看使用,创建数据应用赋能场景。

2、标签同步与加工

标签设计完成后,需要实现映射字段的数据同步与加工,才能保证标签实际落地可用。标签同步模块包含:目的源管理、同步计划、同步结果等功能。标签加工过程则分为专业的数据开发过程和通过可视化配置实现数据的二次开发。

3、标签管理

标签设计开发完毕后,需要对标签进行上架、下架、解绑等维护管理。标签上架审批通过后,才能在标签门户中开放给业务人员进行标签的查看和选用。除了标签的基础维护功能外,还涉及标签治理优化部分的管理,包括标签标准、标签质量、标签价值、标签安全等具体管理模块。

3.1 标签维护

标签维护包括对标签的上架、下架、解绑、修改等操作。选择标签上架并通过系统审核后,标签才能被业务人员选择使用。当某些标签长时间不被使用或价值过低时,标签需要进行下架或淘汰删除。标签解绑适用于某标签需要与当前绑定的数据字段接触映射关系的情况。标签修改指的是对标签的描述、加工类型、标签逻辑等录入信息进行修正,但标签名称和标签编号两项录入信息,不支持修改。

3.2 标签标准

标签标准是对标签类目的命名、取值、格式等的一致约定。在标签标准模块中可以创建一系列的标签命名规则、标签取值规则来对命名、取值等设置规则并执行保障。

3.3 标签质量

标签质量模块对标签全生命周期中的质量问题进行识别、度量、监控、预警,并通过可视化方式显示、增强质量分析效果,进而使得标签质量获得进一步提高。资产管理人员可从标签完整性、一致性、规范性、准确性、及时性等不同维度进行质量分析,进而给出后续标签治理的决策动作。

3.4 标签价值

标签价值主要通过标签调用量、标签活性、标签热度、场景贡献、业务好评等多方面因素反映。标签价值是标签运营的核心导向,价值高的标签可以反向推进数据源增补、数据再处理,、计算引擎优化等优化动作。标签价值和标签质量可联合运用:价值高质量高的标签,需要大力推广营销;价值高质量低的标签,需要重点治理优化;价值低质量高的标签,需要尽快找到合理应用场景发挥作用;价值低质量低的标签,需要考虑提升性价比,必要时下架淘汰。

3.5 标签安全

标签与数据信息项存在关联,因此需要进行安全管控。可对标签进行分级分类管理,即将标签按照安全等级进行分类。不同的安全等级对应着不一样的标签存储、处理、开放、使用方式。标签在创建时需要选择合适的标签安全等级。用户角色权限设计时,也需要考虑对不同安全等级标签的操作和使用权限。

4、标签门户

标签类目体系在后台设计创建后,可通过标签门户前台对业务人员展示。标签门户中的资产概览模块,包括已经构建的对象数、类目数、标签数、应用数等整体情况,以及标签调用曲线、标签价值、标签排行榜等标签使用情况。通过资产概览模块,管理人员可快速了解企业数据资产的建设和使用情况。

5、标签使用

标签在设计、加工、管理、开放后,可供业务人员选择使用。常见两种应用如下:

  • 数据查询:实现对某个体对象的标签取值查询;
  • 群体洞察:实现对某群体对象在各标签撒花姑娘的取值分析。

猜你喜欢

转载自blog.csdn.net/baidu_38792549/article/details/126829022