[数据仓库]基于大数据的数仓和传统数仓的区别

其他 2021-01-28 09:27:30 阅读次数: 0

目录

基于大数据的数仓

传统数仓和基于大数据的数仓的相同点

基于大数据的数仓

随着新的应用场景（个性化推荐、用户画像、机器学习、数据分析、风控、精准运营）的出现，数据爆炸式增长，基于大数据的数仓应用而生，其特点是业务变化快，速度快、能处理海量数据，有实时需求；ER建模被弱化、DWS、DM采用维度建模；建模被弱化，更偏于混合建模，数据质量一般，关注需求速度快、灵活。更强调数据资产的重要性，一般到达一定规模，倾向与做数据治理（数据质量、数据安全、数据标准、数据血缘、主数据、元数据管理）

实效性高
业务灵活、多变
数据源多样性
数据质量参差不齐
应用场景复杂

技术栈：HDFS、Hive、Hbase、Flume、Kafka、Flink、Spark、Sqoop、ES、oozie等

传统数仓

传统数仓建有较稳定的业务场景和相对可靠的数据质量，同时也有相对稳定的需求，对数仓建设有较为完善的项目管控流程，数据建模有较严格、稳定的建设标准；但是建设周期长，处理的数据结构单一，处理复杂数据成本高，只要支持数据分析和管理决策。

DWD一般采用ER建模、DWS、DM采用维度建模，数据质量高。

技术栈：TD、Oracle

传统数仓和基于大数据的数仓的相同点

1、分层架构

2、ER、维度建模理论同样适用

3、数据服务体系一般都有BI、指标系统

猜你喜欢

转载自blog.csdn.net/henku449141932/article/details/112647200

[数据仓库]基于大数据的数仓和传统数仓的区别

【数仓大全】传统数仓、大数据数仓、离线数仓、实时数仓、数仓Lambda架构、Kappa架构、数据湖

[数仓]数据仓库设计方案

数据仓库(二) 数仓理论（重点核心）

数据仓库1-数仓的意义

数据仓库实战之3数仓搭建

大数据数仓项目

数据仓库简介、发展、架构演进、实时数仓建设、与离线数仓对比

应用实践 | 数仓体系效率全面提升！同程数科基于 Apache Doris 的数据仓库建设

数据仓库系列（一）数据仓库的特点与架构分类--数仓与数据库究竟有什么区别？？

漫谈大数据 - 基于SparkSQL的离线数仓

数据仓库实践杂谈（十三）——逻辑数据模型（数仓模型）

腾讯云对象存储联合DataBend云数仓打通数据湖和数据仓库

大数据方案-数仓建设

大数据学习：离线数仓

大数据-数仓学习总结与分享

大数据-数仓分层之DWD

大数据-数仓分层之DWT

大数据-数仓分层之DWS

大数据-数仓分层之ADS

大数据-数仓分层之ODS

大数据-数仓分层（五）

【数仓】数据质量

BigData：数仓/数据仓库的定义、特点、意义之详细攻略

【数仓】数据仓库高频面试题题英文版(1)

本地数据仓库项目(一) —— 本地数仓搭建详细流程

【从0开始离线数仓项目】——数据仓库的环境搭建（1）

数仓数据指标和标签体系区别

传统数据仓库和云数据仓库的区别

大数据教程【01.08】--大数据数仓实战项目

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)