数据模型相关基本概念

一、Data Warehouse数据仓库

      “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions.”——Bill Inmon(“Building the Data Warehouse”,1990)

      中文释义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。——比尔·恩门(《建立数据仓库》,1990)

二、Data Warehouse数据模型

       数据模型可以分为逻辑模型与物理模型。

      逻辑数据模型陈述业务相关数据的关系,是一种与数据库无关的结构设计,从企业业务领域的角度及高度订出subject area model(主题域模型),再逐步向下深入到entities(实体)、attributes(属性)。

      物理模型与数据库管理系统有关,是建置在该系统上的数据架构,故设计时需考虑数据类型(data type)、空间及性能相关的议题。 

      为了输出数据模型,一般经过四个建模阶段,具体阶段任务和产出可参考另一篇“数据建模”相关文章:

三、Entities实体

      就数据库而言,实体往往指某类事物的集合。

四、Subject主题

      主题,是一个抽象概念,对应企业中某一宏观分析领域所涉及的分析对象。

      数据仓库中的数据是面向主题进行组织的。主题是根据分析的要求来确定的。这与按照数据处理或应用的要求来组织数据是不同的。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。

五、主题域

  主题域通常是联系较为紧密的数据主题的集合。可以根据业务的关注点,将这些数据主题划分到不同的主题域。主题域的确定必须由最终用户和数据仓库的设计人员共同完成。

六、主题域、主题、实体间关系

  主题设计是对主题域进一步分解,细化的过程。主题域下面可以有多个主题,主题还可以划分成更多的子主题,而实体则是不可划分的最小单位。主题域、主题、实体的关系如下图所示:

发布了9 篇原创文章 · 获赞 3 · 访问量 5368

猜你喜欢

转载自blog.csdn.net/congzi66166/article/details/104924014