Flume+kafka+flink+es 构建大数据实时处理 - 代码天地

Flume+kafka+flink+es 构建大数据实时处理

其他 2020-02-10 12:19:22 阅读次数: 0

大数据目前的处理方法有两种：一种是离线处理，一种是实时处理。如何构建我们自己的实时数据处理系统我们选用flume+kafka+flink+es来作为我们实时数据处理工具。因此我们的架构是：

flume集群

kafka集群

flink集群

es集群

其具体架构如图

对于flume集群，它的作用就是采集数据并将数据提供给kafka集群，我们可以通过topic来实现。

对于zookeeper-kafka集群，它的作用是存储flume提供的数据，并且将相应的topic对外开放。它的作用就相当于一个数据库（事实上它喜欢被动）

对于flink集群，它当然是消费kafka的message，并且对这些message进行各种犀利的处理（它对计算很擅长，对于关系并不像吹的那样牛逼也许是我们主要使用streamAPI而不是tableAPI的缘故）这里要声明的是我们做的是流式逐条数据处理。表关联和同表不同数据关联请先跑一遍mysql。因为tableAPI并不能支持我们之前用过的所有sql函数，当然最常见的SUM,AVG，COUNT等除外。曾经很SB的想用flink的tableAPI把大约3G的数据文件根据某个字段合并（i7 4核 16G内存的MBP跑了7分钟）觉得还是nio的0拷贝好一点随便七八十的分片并行（数据量大的话能把别的系统跑崩）对于连接ES和kafka的事交给flink的API仨字儿，真好用。

当然版本也要注意：我们flume => 1.8.0

zookeeper => 3.5.5

kafka => 2.11

flink => 1.9.1

ES => 7.2.0

具体配置下次再聊

Nryana0

发布了15 篇原创文章 · 获赞 2 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/Nryana0/article/details/104050950

Flume+kafka+flink+es 构建大数据实时处理

Flume+Kafka+Storm+Redis构建大数据实时处理系统

[转]Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

Flume+Kafka+Storm+Redis构建大数据实时处理系统：实时统计网站PV、UV+展示

资深程序员分享：如何用Flume+Kafka+Storm+Redis构建大数据实时处理系统

使用 Kafka + Spark Streaming + Cassandra 构建数据实时处理引擎

Apache Kafka：大数据的实时处理时代

Kafka+Storm+HDFS整合实践-构建大数据实时分析处理系统

大数据实时处理实战

Spark Streaming实时处理Kafka数据

（大数据实时动态数据处理）flume+kafka+strom;zookeeper+hadoop+hbase

【大数据】流式实时处理框架Flink学习路线图

大数据安装之Kafka（用于实时处理的消息队列）

流式大数据实时处理—技术、平台及应用

简述大数据实时处理框架

火山引擎发布流式计算 Flink 产品，助力构建大数据实时计算平台

第六章：基于Flink、Kafka实现海量数据的实时处理

SparkStreaming 数据实时处理

大数据实时流处理框架比较(Flink,Storm,Spark-Streaming)

Flume+Kafka+Spark Streaming实现大数据实时流式数据采集

大数据实时阶段----【Spark04之sparkStreaming整合flume、sparkStreaming整合kafka (★★★★★)】

maxwell+kafka+Spark Streaming构建MySQL Binlog日志采集实时处理方案

从批处理到实时处理：Flink的数据处理变革和API扩展

Flink大数据实时计算系统实践

Druid：一个用于大数据实时处理的开源分布式系统

全面解析流式大数据实时处理技术、平台及应用

Spark3大数据实时处理-Streaming+Structured Streaming 实战

大数据实时处理学期总结（Spark、Scala）

flume+Kafka+flink实时统计实战(单机版)

MySQL数据实时增量同步到Kafka - Flume

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)