数据仓库相关

数据仓库特点:

  • 面向主题的
  • 集成的
  • 稳定的
  • 反应历史变化的
        主题是对业务数据的一种抽象,是从较高层次上对信息系统中数据进行的归纳和整理。面向主题的数据组织可以分成两部分:根据原系统业务数据的特点进行主题的抽取和确定每个主题所包含的数据内容。
        由于数据仓库中的数据是经过ETL过程得到的,故数据仓库在经历数据集成阶段后,是数据仓库中的数据都遵循统一的编码规则,并且消除了许多冗余数据。集成一般有两种形式,数据的集成(如根据身份证将同一个客户的信息集成在一条记录中)和编码的集成(如将各业务系统不同标示法的性别统一用一种方式标示)。
        数据仓库中的数据反映的是一段历史时期的数据内容,主要操作为查询、分析,而不进行一般意义上的更新修改操作,是为了企业高层人员决策分析之用。
        
操作型数据库
数据仓库
  • 时间期限:30-60天
  • 键码中可能含有时间键
  • 时间期限:5-10年
  • 键码中一般都含有时间键

数据仓库与数据库的区别
事务型处理数据和分析型处理数据的区别
事务型处理数据
分析型处理数
  • 对性能要求严格
  • 事务驱动的
  • 主要面向应用
  • 主要存储即时性、细节性的数据
  • 数据可更新
  • 对性能要求较高
  • 分析驱动的
  • 主要面向决策分析
  • 主要存储历史、汇总性的数据
  • 数据不可更新

数据库生产系统和数据仓库决策系统的区别
数据库生产系统
数据仓库决策系统
  • 面向应用、事务处理
  • 实时性高
  • 数据检索量小
  • 指存储当前数据
  • 访问频率高
  • 响应时间在1s以下
  • 用户数量很大在战争中
  • 面向主题、分析型处理数据
  • 实时性要求不高
  • 数据检索量大
  • 存储大量的历史数据和当前数据
  • 访问频率中、低
  • 响应时间为几秒或更长
  • 用户数量相对较小

数据仓库系统开发和应用的过程

猜你喜欢

转载自ruinxdgzy.iteye.com/blog/1722815