[数据仓库]数据仓库和数据库的区别

数据仓库和数据库

数据仓库是面向主题的、集成的、稳定的,反映历史变化数据集合,用于分析场景,支持管理决策过程等。

  1. 面向主题:在较高层次对企业的数据进行综合归并而进行的抽象概念。数据仓库都是基于某个明确主题,仅需要与该主题相关的数据,其他的无关细节数据将被排除掉
  2. 集成的:从不同的数据源采集数据到同一个数据源,此过程会有一些ETL操作;并保持数据的一致性、完整性、准确性、有效性
  3. 反映历史变化:关键数据隐式或显式的基于时间变化
  4. 相对稳定:数据仓库的数据一般只做添加不做更新:数据装入以后一般只进行查询操作,没有传统数据库的增删改操作

数据库是通过一定数据结构对数据进行组织、存储和管理,一般用于OLTP应用场景,目的是具有较高的独立性、扩展性、较少的冗余、高性能和高效率。

数据仓库和数据库的区别:

 

数据仓库

数据库

数据范围

企业全部数据、历史数据、变化数据

当前数据

数据变化

一般只添加,很少修改、不删除

增删改查等

应用场景

决策处理、数据画像、机器学习、人工智能

业务处理

建模理论

ER建模、维度建模、混合建模

ER建模,一般遵循3NF

数据处理

非频繁、数据量大、高吞吐、有时延

频繁、量少次多、高并发、低延迟

猜你喜欢

转载自blog.csdn.net/henku449141932/article/details/112979840