目录
一、分值分布
CDGA:10分(10单选)
CDGP:10分(2单选,4多选)
考点:
驱动因素、成果和实施;
基本概念、活动、工具;
评估、组织和文化;
数据架构评估;
二、重点知识梳理
1、引言
语境关系图:
数据架构定义:识别企业的数据需求(无论数据结构如何),设计和维护总蓝图以满足这些需求。 使用总蓝图来指导数据集成、控制数据资产,并使数据投资与业务战略保持一致。
数据架构目标:(识别需求;设计结构;战略准备)
- 识别数据存储和处理需求。
- 设计结构和计划以满足企业当前和长期的数据需求。
- 战略性的为组织做好准备,快速发展其产品、服务和数据,以利用新兴技术中固有的商机。
架构:对组件要素有组织的设计,旨在优化整个结构或系统的功能、性能、可行性、成本和用户体验。
系统的基本结构:具体体现在架构构成中的组件、组件之间的相互关系以及管理其设计和演变的原则。在组织不同范围、不同层级开展。
架构师职责:通过自身的专业技能,将这些容易被非专业架构人员难以理解或迷惑的内容定义和设计清晰,以便浅显易懂(负责将难以理解的东西定义明确清晰)。
企业架构的类型:
- 业务架构
- 数据架构
- 应用架构
- 技术架构
好的架构能助于:良好的企业架构管理有助于组织了解系统的当前状态,加速向期待状态的转变,实现遵守规范,提高效率的目标。
数据架构的主要目标:是有效地管理数据,以及有效地管理存储和使用数据的系统。
数据架构的基本组成:
- 数据架构成果,包括不同层级的模型、定义、数据流,这些通常被称为数据架构的构件
- 数据架构活动,用于形成、部署和实现数据架构的目标
- 数据架构行为,包括影响企业数据架构的不同角色之间的协作、思维方式和技能
数据架构是数据管理的基础。由于大多数组织拥有的数据超出了个人可以理解的范围,因此有必要在不同抽象层级上描述组织的数据,以便更好地了解数据,帮助管理层做出决策。
数据架构的构件:
- 当前状态的描述
- 数据需求的定义
- 数据整合的指引
- 数据资产管理规范
最为详细的数据架构设计文件:是正式的企业数据模型,包含数据名称、数据属性和元数据定义、概念和逻辑实体、关系以及业务规则。物理数据模型也属于数据架构文件,但物理数据模型是数据建模和设计的产物,而不是数据架构的产物。
1.1 业务驱动因素
数据架构的目标(业务驱动因素):是在业务战略和技术实现之间建立起一座通畅的桥梁,数据架构是企业架构中的一部分。
数据架构主要职责:
- 利用新兴技术所带来的业务优势,从战略上帮助组织快速改变产品、服务和数据。
- 将业务需求转换为数据和应用需求,以确保能够为业务流程处理提供有效数据。
- 管理复杂数据和信息,并传递至整个企业。
- 确保业务和 IT 技术保持一致。
- 为企业改革、转型和提高适应性提供支撑。
1.2 数据架构成果和实施
数据架构的主要成果:
- 数据存储和处理需求。
- 设计满足当前和长期数据需求的结构和规划。
数据架构师:架构师寻求一种能为组织带来价值的方式对组织的数据架构进行设计。这种价值主要通过合适的技术应用、有效运营、项目效率提升及数据应用能力加强来体现。
数据架构师主要工作:
- 定义数据当前状态。
- 提供数据和组件的标准业务词汇。
- 确保数据架构和企业战略、业务架构一致性。
- 描述数据战略需求。
- 高阶数据整合概要设计。
- 整合企业数据架构蓝图。
总体数据架构实施:
- 使用数据构架构件(主蓝图)来定义数据需求、指导数据整合、管控数据资产,确保数据项目投入与企业战略保持一致。
- 与参与改进业务或 IT 系统开发的利益相关方合作,学习并影响他们。
- 通过数据构架及通用的数据词汇,搭建企业数据语言。
1.3 基本概念
架构框架:架构的架构。思考和理解架构的方式。
企业架构类型:业务构架、数据架构、应用架构、技术架构
Zachman框架:
- 基本概念
- 最著名的企业架构是Zachman框架。Zachman 框架是一个本体,即6x6 矩阵构成了一组模型,这组模型可以完整地描述一个企业以及相互之间的关系。它并不定义如何创建模型,只是显示哪些模型应该存在。
- Zachman 框架—问询沟通:
- 什么 What:目录列,构建架构的实体。
- 怎么 How:流程列, 表示执行的活动。
- 在哪里 Where,分布列,业务位置和技术位置。
- 谁 Who:职责列,角色 和组织。
- 时间 When:时间列,表示间隔、事件、周期和时间表。
- 为什么 Why:动机列, 表目标、策略和手段
- Zachman 框架—重新定义转换:
- 1)高管视角(业务背景):定义不同模型范围的业务元素目录。
- 2)业务管理视角(业务概念): 明确管理层在定义的业务模型中所涉及的不同业务概念之间的关系。
- 3)架构师视角(业务逻辑): 作为模型设计的架构师细化系统需求,设计系统逻辑模型。
- 4)工程师视角(业务实体):作为 具体模型建造者的工程师,在特定技术、人员、成本和时间限制内,优化和实施为具体应用设计 的物理模型。
- 5)技术人员视角(组件程序集):采用特定技术、脱离上下文语境的视角,来解 释配置模型的技术人员如何使用、组装和实施配置组件。
- 6)用户视角(操作类):参与人员所使用的实际功能实例。该视角没有模型。
企业数据架构
- 定义:定义对组织非常重要元素的标准术语和设计。企业数据架构的设计中包括业务数据描述,如数据的收集、存储、整合、移动和分布。
- 具体如下:
- 1)企业数据模型(数据结构 、数据规范)。
- 2)数据流设计。
在企业数据架构中概念如下:
数据:需要安全、集成、存储、记录、分类、共享的报表和分析,最终交付使用。过程中数据可 能会被:验证、增强、链接、认证、整合、脱敏处理以及用于分析,直到数据被归档或清除。
企业数据模型:是一个整体的、企业级的、独立实施的概念或逻辑数据模型,为企业提供通用的、 一致的数据视图。简化抽象的。包括:数据实体(如业务概念)、数据实体间关系、关键业务规 则和一些关键属性。
数据流设计:定义数据库、应用、平台和网络(组件)之间的需求和主蓝图。展示数据在业务流 程、不同存储位置、业务角色 和技术组件间的流动。
企业数据模型:采用行业标准模型能加快开发企业数据模型的效率。随着企业需求变化,企业数据模型中的范围和各层级内容也会扩张,可以用不同层级增量和迭代方式来构建。每个企业数据模型中的实体应仅属于一个主题域,但可和任何其他主题域相关联。企业概念数据模型是由主题域模型相结合构建,可自上而下,也可自下而上。
主题域的识别准则必须在整个企业模型中保持一致。常用的主题域识别准则:使用规范化规则, 从系统组合中分离主题域,基于顶级流程(业务价值链)或者基于业务能力(企业架构)从数据治理结构和数据所有权(或组织)中形成主题领域。如果主题域结构是使用规范化规则形成的, 那么它对于数据架构工作通常是最有效的。规范化过程将建立承载/构成每个主题域的主要实体。
数据流:记录数据血缘的数据加工过程,用于描述数据如何在业务流程和系统中流动。源于哪, 在哪存,如何转化,数据血缘分析有助于分析解释数据流中某一点上的数据状态。
数据流映射记录了数据与以下内容的联系:
- 业务流程中的应用。
- 某个环境中的数据存储或数据库。
- 网段(有助于安全映射)。
- 业务角色 (描述哪些角色有职责创建、更新和删除数据)。
- 出现局部差异的位置。
数据流可以用于描述不同层级模型的映射关系:主题域、业务实体,乃至属性层面的映射关系。 用二维矩阵或数据流图呈现。
2、活动
简化数据和企业架构的两种方式:
- 面向质量(与传统一致)。
- 面向创新(不用面面俱到)。
2.1 建立企业数据架构
建立企业架构包含的工作:(可并行或串行)
- 战略。选择框架,制定方法,开发路线图。
- 沟通与文化。
- 组织。明确责任和职责。
- 工作方法。与企业架构保持一致。
- 结果。在总体路线图中产出。
企业数据架构会影响项目和系统开发的范围边界:
- 定义项目数据需求。通过数据架构为企业提供每个项目的数据需求
- 审评项目数据设计。通过设计审评来确保概念、逻辑和物理数据模型与架构一致,与组织的长期策略一致。
- 确定数据溯源影响。确保数据流在应用中的业务规则一致并且可追溯。
- 数据复制控制。复制是一种常见的,能够提供改善应用性能和便于获取数据的方法,但是也有可能导致数据的不一致。数据架构治理能保证充分的复制控制 (方法和机制) 来达到所需的一致性(并不是所有应用要求的严格程度都一致)。
- 实施数据架构标准。为企业数据架构生命周期制定和实施标准。标准可以表示为原则、流程、指南和规划蓝图
- 指导数据技术和更新决策。数据架构与企业架构一起管理每个应用的数据技术版本、补丁和数据技术路线图策略。
建立企业架构的步骤:
- 1 现有数据架构规范评估
- 2 开发路线图:描述了 3-5 年发展路径。路线图应以数据管理成熟度评估为指导
- 路线图包括:
- 1 )高层次里程碑事件。
- 2 )所需资源。
- 3 )成本评估。
- 4 )业务能力工作流划分。
- 开展步骤:业务数据驱动路线图可以从最独立的业务能力开展,再处理相互依赖程度较高的业务能力。
- 路线图包括:
- 3 在项目中管理企业需求
- 开展步骤:在项目级别上,通过数据模型定义需求的过程是从审查业务需求开始的。通常,这些需求是特定 于项目目标的,不会对企业产生影响。该过程还应包括开发术语定义和支持数据使用的其他活动
企业数据架构项目相关的活动:
- 定义范围。保证范围和接口与企业数据模型一致。
- 理解业务需求。获取数据相关的需求,如实体,资源,可用性,质量和痛点,业务价值。
- 设计。形成 细的目标规范。
- 实施(什么时候购买。什么时候重用数据。什么时候构建。)
2.2 整合其他企业架构
架构活动嵌入到项目过程采用的方式:
- 瀑布方式。
- 迭代方式。
- 敏捷方式(DevOps)
3、工具
数据架构工具:
- 数据建模工具。
- 资产管理软件。(用于管理数据资源目录,描述其内容及跟踪它们之间的关系)
- 图形设计应用。
4、方法
4.1 生命周期预测
架构设计面向的对象:
- 当前的。
- 部署周期的。
- 策略周期的。
- 退役的。
- 优先的。
- 限制的。
- 新兴的。
- 审核的。
4.2 图标使用规范
图标使用规范:
- 清晰一致的说明。
- 所有图表对象与说明相匹配。
- 清晰一致的线条方向。
- 一致的交叉线显示方法。
- 一致的对象属性。
- 线性对称。
5、实施指南
数据架构包括构件、活动、行为。
数据架构实施工作内容:
- 建立企业数据架构团队和举办问题讨论会。
- 生成数据架构版本。
- 在开发项目中,形成和建立数据架构工作方式。
- 提高组织对数据架构工作价值认识。
5.1 就绪评估和风险评估
就绪评估和风险评估:
- 缺少管理层支持。
- 成功与否缺乏证据。
- 缺乏管理者的信任。
- 管理层不正确的决策。
- 文化冲击。
- 缺乏有经验的项目经理。
- 单一维度视角。
5.2 组织和文化
组织和文化依赖(对数据框架的接受度取决于):
- 对架构方法的接受度。
- 确认数据属于组织的 业务资产,而不仅是 IT 的任务。
- 放弃局部数据视角,接受企业级数据视角的能力。
- 将架构交 付成果整合到项目实施中的能力。
- 规范数据治理的接受程度。
- 立足企业布局,而不局限于项目交付成果和 IT 解决方案的能力。
6、数据架构治理
6.1 数据架构治理活动
数据架构治理活动:
- 项目监督。
- 管理架构设计、生命周期和工具。
- 定义标准。
- 创建 数据相关构件。
6.2 度量指标
数据构架度量指标:
- 1.架构标准接受率:测量项目与已建立的数据构架的紧密程度及项目与企业架构参与流程的遵循度
- 2.实现趋势。
- 1)使用/重用/代替/废弃测量。
- 2)项目执行效率测量
- 3.业务价值度量指标。
- 1)业务敏捷性改进。
- 2)业务质量。
- 3)业务操作质量。
- 4)业务环境改进