Hadoop构建数据仓库实践读书笔记【1】

数仓的好处:

  • 将多个数据源集成到单一数据存储,因此可以使用单一数据查询引擎展示数据。
  • 缓解在事务处理数据库上因执行大查询儿产生的资源竞争问题。
  • 维护历史数据。
  • 通过对多个源系统的数据整合,使得在整个企业的角度存在统一的中心视图。
  • 通过提供一致的编码和描述,减少或修正数据问题,提高数据质量。
  • 一致性地组织信息。
  • 提供所有数据的单一通用数据模型,而不用关心数据源。
  • 重构数据,使数据对业务用户更有意义。
  • 向复杂分析查询交付优秀的查询性能,同时不影响操作型系统。
  • 开发决策型查询更简单。

个人使用的体验:能够在hive上多表连接查询(mysql上跨服务器),大量数据查询速度更快。可以做数据的union,去重和except。

猜你喜欢

转载自www.cnblogs.com/astride/p/11164048.html