数据仓库 二

数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策

------------------------------------------------

数据仓库与传统数据库区别

数据生命为5-10年,反之60-90天

数据为每天的复制快照,不能更新,反之包含当前值,可更新

数据总是包含某时间元素,反之可包含也可不包含

--------------------------------------------------

数据粒度,粒度的双重级别

数据分割,小数据块容易建立索引,扫描,恢复,监控

按照1.时间 2.商业线 3.地理位置 4.组织单位

数据仓库中的数据组织:

简单堆积   按天的统计堆积

轮转综合   按天,按周,按月统计堆积

简单直接   按天统计,按月连接

连续       同上,连接连续文件

数据仓库清理:

数据进入轮转综合文件

转到大容量介质上

数据清除

数据转移层

猜你喜欢

转载自blackproof.iteye.com/blog/2078984