Flink SQL如何保证分topic有序 - 代码天地

Flink SQL如何保证分topic有序

编程语言 2020-07-23 09:12:56 阅读次数: 0

一、场景

在做实时数仓的时候，我们需要保证提高消费能力和数据有序，那如果要用Flink sql 和 Kafka交互，就会出现如下两个问题：

flink sql 通过ddl读取和写入kafka怎么设置并行度呢？
flink sql 通过ddl写入kafka怎么自定义分区呢？

二、问题剖析

首先我们知道Flink sql不支持不支持相关的设置，但是可以通过env或配置文件设置所有算子的并行度。同时kafka默认分区有序，所以source的并发一般小于等于kafka的partition数，理想状态是1：1。sink的并发一般也是和输出topic相关，如果要保证有序，可以按key进行分区，保证数据均匀可以自定义分区策略，比如roundrobin、shuffle等。

提示：对kafka分区不熟悉的可以看我之前总结的相关文章：
深入分析Kafka架构（三）：消费者消费方式、三种分区分配策略、offset维护

三、解决方案

首先第一个问题我们可以为咱们的程序设置默认的并发度，用代码或者命令行参数，配置文件都可以。
第二个问题可以将 connector.sink-partitioner设置为 custom, 然后设置 connector.sink-partitioner-class

猜你喜欢

转载自blog.csdn.net/qq_26803795/article/details/107402432

Flink SQL如何保证分topic有序

利用Flink消费Kafka数据保证全局有序

flink sql

Flink:Flink-SQL开发

【Flink】（十五）Flink SQL / Table 介绍与实战

【FLink】Flink SQL 解析嵌套的 JSON 数据

[Flink基础]-- Flink DataSource 有哪些？

【FLink】Flink 任务如何优雅的停止

Flink SQL Table实战

flink SQL 外关联

Apache Flink SQL概览

Flink SQL 批处理

Apache Flink SQL

Flink SQL项目实录

Flink示例——Table、SQL

Flink SQL DDL

Flink SQL and Table

Flink SQL 做 WordCount

Flink_SQL 应用

Flink_SQL 应用

flink_SQL 开发

flink_SQL 开发

Flink Sql教程（8）

Flink Sql教程（7）

Flink Sql教程（6）

Flink Sql教程（5）

Flink Sql教程（4）

Flink Sql教程（3）

Flink Sql教程（2）

Flink Sql教程（1）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)