《基于 Apache Flink 的流处理》阅读笔记

其他 2020-03-27 22:14:47 阅读次数: 0

第一章：状态化流处理概述

数据处理框架

把数据处理框架分为两类

事物型处理：企业日常运营业务中的各类应用
- 企业资源规划（ERP），客户关系管理（CRM）还有一些基于Web的应用
  - 独立的数据处理层：也就是应用程序本身：连接外部用户或者服务，处理操作传入的数据，每次操作都会访问数据库读取或者更新状态
  - 数据存储层：事物型数据库，外部操作就会访问这个数据库
- 这种“单点”在扩容更新会有问题，现在用微服务——解耦，接口通信，部署到不同的容器中
分析型处理
- 需要对不同类型的数据进行联合分析的时候，建一个数据仓库（专门处理分析查询），将事务性数据库中的数据拷贝到仓库中就是ETL （提取-转换-加载）
- 对于数据仓库就需要定期整合报告或者ad-hoc query（即席查询），过程中就用到了Hadoop生态的组件，完成数据仓库和一系列操作，代替关系型数据库，用HDFS
在建立数仓和对数仓中的数据进行分析的过程就用到了流处理技术

状态化处理

事件流当中对于跨记录转换都需要状态，每次处理新事件的时候能够读写之前的状态
Flink用的就是内存和内嵌式数据库作为状态存储，定期备份
像Kafka这种日志系统和Flink相连，部署在Flink上的流处理应用进行事件的分析处理
几种流处理应用
- 事件驱动型：通过事件触发不同的业务逻辑，进行后续的操作；类似于微服务架构的模式，不同的应用之间通过日志系统通信了，而且访问本地状态的速度要比访问数据库更快
- 数据管道：低延时的ETL
- 流式分析：不用像数仓或者Hadoop那样批处理来分析数据，实时分析，还有实时SQL

运行例子

配置好java；Flink的tar包官网上下载解压，配置环境变量
1.启动集群

没有配置环境变量的话到Flink的bin包下使用start命令即可

2。浏览器中输入 http://你的IP地址:8081，就能看到图形化界面

3.跑一个小例子，通过./bin/flink run命令跑一个 example 中的例子
一个例子
查看日志中的结果
在这里插入图片描述
相应的控制台显示

最后关闭集群

关闭之前看到现有的进程
在这里插入图片描述
可以看到一个TaskManager，这个是Flink处理数据中的一个JVM进程，后续可以通过修改配置文件设置它其中的slot也就是线程的大小

关闭集群
在这里插入图片描述
查看进程，发现和Flink相关的处理进程结束了

PanicJaw

发布了9 篇原创文章 · 获赞 1 · 访问量 185

私信关注

猜你喜欢

转载自blog.csdn.net/PanicJaw/article/details/104865521

《基于 Apache Flink 的流处理》阅读笔记

Apache Flink 流处理实例

Apache Flink流处理(一)

Apache Flink流处理(三)

Apache Flink流处理(二)

Apache Flink流式处理

实时流处理系统容错机制（二）：Apache Flink 基于State的异步容错机制

Apache Flink 1.5.6 发布，流处理框架

Apache Flink 1.7.2 发布，流处理框架

Apache Flink 1.9.1 发布，流处理框架

Apache Flink 1.9.3 发布，流处理框架

Apache Flink 1.12.1 发布，流处理框架

Apache Flink 1.15.2 发布，流处理框架

Apache 流框架Flink简介

企业级大数据处理实践——基于 Apache Flink

Apache Flink

Apache Flink 数据流编程模型

Apache Flink - 数据流容错机制

使用Apache Flink开始批处理

Apache Flink中流处理之Window详解.

基于 Apache Flink 的实时计算数据流业务引擎在京东零售的实践和落地

快手基于 Apache Flink 的实时数仓建设实践

基于 Apache Kyuubi 实现分布式 Flink SQL 网关

基于Flink的批流处理API编程实现wordcount案例

如何基于 Apache Doris 与 Apache Flink 快速构建极速易用的实时数仓

Flink视频教程_基于Flink流处理的动态实时电商实时分析系统

Apache Flink-什么是Apache Flink？

Apache Flink数据流的Fault Tolerance机制

Apache 流框架 Flink，Spark Streaming，Storm对比分析

Apache Flink-数据流之上的有状态的计算

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)