数据仓库术语

LDM:逻辑数据模型,是利用图形方式,通过数据和关系反映业务的一个过程;定义需要追踪和管理的各种重要实体、属性和关系;是进行各种数据管理、分析和交流的重要手段;是IT和业务人员沟通的桥梁。

3NF:第三范式。所谓范式是指数据库设计中应该满足的标准规范。第三范式定义为“Every Non-Key attribute is fully & directly functionally dependent on the candidate keys.”从定义中不难看出,这种设计方法和维度建模方法不同,能最大程度上减少冗余,并保证结构具有足够的灵活性和扩展性。

ER图:实体关系图(Entity-Relationship),以图形方式描述数据模型的一种标准方法。

Subject:主题,是对数据综合、归类、并按一定的业务逻辑抽象出来的分析对象。

Entity:实体,逻辑数据模型中的一种对象,在数据库中的定义是“客观存在并可相互区别的事物”,对应物理数据库中的表(Table)。

Attribute:属性,逻辑数据模型中的一种对象,在数据库中的定义是“实体所具有的某一特性”,对应物理数据库中的字段(Field)。

Key:键值(Key Attribute),唯一标识实体的属性集。从数据上来讲,一个表中的不同记录的Key一定是不同的,Key就唯一标识了某条记录。

Relationship:关系,实体之间的联系,反映了现实世界中事物的关联关系和特定的业务规则。

SWU:标准工作单元():创建能够高效流通且不会造成瓶颈的小型模式的过程。

并行数据管理:多个机器相互协作以缩减处理时间的处理方式。

MPP:大规模并行处理,一种能够处理海量数据的操作系统。

独立型数据集市:源数据直接来自于遗留系统而不是来源于数据仓库的一种数据集市。

依赖型数据集市:将数据仓库作为单一数据来源的一种数据集市。

非结构化数据:逻辑组织形式无法被计算机理解的数据。

非易失性数据:一次写入后不可被更改的数据,有时也叫做“快照”数据。

归档处理:围绕旧数据或非活动数据展开的行为。

规范化:按照已有的标准在细节层次上组织数据的过程

合规:符合由立法机构或其他一些管理机构强制要求的业务规则。

解析:读取文本并且查找存在于文本中的语境化值的过程。

粒度:数据记录的细节层次。

连接:基于一个公共键来整合两个或多个表的过程。

命名约定:在构建系统的过程中为变量赋予名称的方式。

批处理:将事务处理分成多批一起处理。

BI:商业智能()用于将企业中现有的数据进行有效整合、快速准确的提供报表和决策依据,帮助企业做出明智业务经营决策的一套完整方法。

实体:数据的粗略分类。

数据的回流:从数据仓库到作业环境的数据迁移。

数据概况:数据质量过程的关键部分,包括检查源系统的数据是否在取值、范围、频率和关系等方面存在异常,以及检查其他可能影响未来分析工作的特征。

数据集市:数据仓库的一个子集,通常面向一个业务小组或团队。

数据模型:数据的一种抽象。

数据清洗:查找和修正不准确数据的过程。

数据生命周期:认为数据在不同的阶段呈现出不同的特征。

数据退化:数据完整性随时间推移不断降低的趋向性。

MDM:主数据管理(),用于创建和维护一个一致性视图的一系列过程,也指企业参考数据的一个总的键列表。该数据包括下面这样的实体:客户、潜在客户、供应商、员工、产品,服务、资产和账目等。它还包括与这些实体相关的分组和层级结构。

NLP:自然语言处理,认为文本的语境可以从文本本身推断出来的思想。

自主服务BI:不需要IT团队的帮助就能使BI用户获取所需信息的一种基础设施。

ODS:操作数据存储(),一种数据库类型,通常用作一个面向数据仓库的中间区域。与包含静态数据的数据仓库不同,ODS的内容在业务运营的过程中是不断更新的。它还是一种数据结构,既有数据仓库的一些特性,也有作业系统的一些特性。通常,ODS是一种可选的结构,有些公司需要用到,有些则不需要。

派生实体:属性是由其它实体的属性计算演变而来的实体。






猜你喜欢

转载自blog.csdn.net/rainticking/article/details/78935935
今日推荐