大数据分析平台的演进之路 - 代码天地

大数据分析平台的演进之路

其他 2020-06-28 11:57:35 阅读次数: 0

1、石器时代

大数据技术刚起步时平台架构很简单，数据流从日志通过RSYNC(linux系统下的数据镜像备份工具)流入到Hive，然后通过Hive SQL语句统计分析，结果导入到MySQL，最后形成报表展示。整个流程的驱动基于Shell脚本完成，报表系统和数据处理是利用Java实现。所有业务需求都是手工处理，所有报表都要写Java代码开发，这个给开发人员造成了很大的工作量，并且用户获取数据周期长，速度慢。

图片.png

2、铁器时代

整合了所有数据、所有计算资源和服务框架，重新构建形成一个大数据平台框架。底层是大数据平台所用的计算资源，离线计算主要是Hive、Spark，流式计算主要是Spark Streaming和Flink；OLAP主要是Impala和Kylin。数据方面Pingback是用户行为日志，机器日志就是程序产生的相关日志。线上数据库主要是MySQL、MongoDB等，大数据存储主要是HDFS、HBase、Kudu，Kudu主要是支持实时，分布式存储主要是HBase、HDFS。再往上层是开发平台层，主要负责工作流开发。流计算通过专门的开发工具进行管理，就是将任务开发进行重新构建。数据开发针对于系统数据进行血缘管理，提供数据集成管理，实现数据在不同集群、引擎间的同步。如机房中有很多机器分成3-4个集群，相互之间要进行数据同步，先前主要是手写程序完成,现在可以通过数据集成来进行跨DC的数据同步。数仓管理主要是埋点投递管理、指标维度管理、数仓模型管理。最上层就是直接面向用户的分析报表平台，自助分析工具有漏斗分析、画像分析、路径分析，还有自助查询工具、BI报表工具等。

图片.png

猜你喜欢

转载自blog.csdn.net/gracejpw/article/details/106965752

大数据分析平台的演进之路

滴滴的大数据计算平台演进之路

数据分析大数据之路一

数据分析大数据之路二

大数据平台演进之路 | 淘宝 & 滴滴 & 美团

大数据分析学习之路

【大数据分析】学习之路详解

如何搭建大数据分析平台

大数据分析平台搭建指南

如何构造大数据分析平台

大数据分析平台哪个好？

蚂蚁金服杨军：蚂蚁数据分析平台的演进及数据分析方法的应用

大数据系列5：Pig – 大数据分析平台

数据仓库、大数据平台、数据中台演进之路

数据分析大数据之路二 numpy

数据分析大数据之路三 numpy 2

大数据分析日志入库方案优化之路

大数据下的数据分析平台架构

大数据时代｜搭建Python数据分析平台

基于大数据技术的综合数据分析平台

大数据平台的搭建和数据分析

【大数据平台】基于Spark的气象数据分析

大数据分析

InfoSphere Streams——实时大数据分析平台

Hadoop 信息集成平台，让大数据分析更简单！

mmTrix大数据分析平台构建实录（转）

mmTrix大数据分析平台构建实录

mmTrix大数据分析平台构建实录[转]

免费大数据分析云平台有哪些?

巧用Superset大数据分析平台搞定各类图表

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)