大数据之Kafka：Kafka架构深入之工作流程及文件存储机制 - 代码天地

大数据之Kafka：Kafka架构深入之工作流程及文件存储机制

其他 2021-03-27 10:04:44 阅读次数: 0

3.1 Kafka工作流程及文件存储机制
在这里插入图片描述
Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。
topic是逻辑上的概念，而partition是物理上的概念，每个partition对应于一个log文件，该log文件中存储的就是producer生产的数据。Producer生产的数据会被不断追加到该log文件末端，且每条数据都有自己的offset。消费者组中的每个消费者，都会实时记录自己消费到了哪个offset，以便出错恢复时，从上次的位置继续消费。
在这里插入图片描述
由于生产者生产的消息会不断追加到log文件末尾，为防止log文件过大导致数据定位效率低下，Kafka采取了分片和索引机制，将每个partition分为多个segment。
每个segment对应两个文件——“.index”文件和“.log”文件。分别表示为segment索引文件和数据文件（引入索引文件的目的就是便于利用二分查找快速定位message位置）。这两个文件的命令规则为：partition全局的第一个segment从0开始，后续每个segment文件名为上一个segment文件最后一条消息的offset值，数值大小为64位，20位数字字符长度，没有数字用0填充。
这些文件位于一个文件夹下（partition目录），该文件夹的命名规则为：topic名称+分区序号。例如，first这个topic有三个分区，则其对应的文件夹为first-0,first-1,first-2。
index和log文件以当前segment的第一条消息的offset命名。下图为index文件和log文件的结构示意图。
在这里插入图片描述
“.index”文件存储大量的索引信息，“.log”文件存储大量的数据，索引文件中的元数据指向对应数据文件中message的物理偏移地址

猜你喜欢

转载自blog.csdn.net/weixin_43597208/article/details/115259688

大数据之Kafka：Kafka架构深入之工作流程及文件存储机制

Kafka 工作流程与文件存储机制

kafka工作流程及文件存储机制

【Kafka从入门到放弃系列三】Kafka架构深入——工作流程和存储机制

深入分析Kafka架构（一）：工作流程、存储机制、分区策略

Kafka 基础架构、工作流程、存储机制介绍

深入了解Kafka【二】工作流程及文件存储机制

四、Kafka 工作流程及文件存储机制

kafka工作流程及文件存储

大数据技术之 Kafka (第 3 章 Kafka 架构深入 ) Log存储解析

Kafka快速入门系列(5) | Kafka的工作流程及文件存储机制

大数据技术之Kafka（一）Kafka概述、Kafka快速入门、Kafka架构深入

Kafka架构和工作流程深入解析

Kafka架构和工作流程深入解析

Kafka-工作流程，文件存储机制，如何通过offset找到对应的消息

大数据技术之 Kafka (第 3 章 Kafka 架构深入 ) Kafka 生产者

大数据技术之kafka (第 3 章 Kafka 架构深入) Kafka 事务

大数据技术之kafka (第 3 章 Kafka 架构深入) Zookeeper 在 Kafka 中的作用

大数据技术之 Kafka (第 3 章 Kafka 架构深入 ) Kafka 消费者

大数据技术之kafka (第 3 章 Kafka 架构深入 ) 高效读写数据

Kafka 工作流程

大数据技术之kafka (第 3 章 Kafka 架构深入 ) offset讲解

大数据技术之kafka (第 3 章 Kafka 架构深入 ) 消费者组案例

大数据技术之kafka (第 3 章 Kafka 架构深入) 分区策略在分析

Kafka笔记（一）之kakfa工作流程

大数据之Kafka：Kafka基础架构和核心概念

大数据之kafka

大数据之Kafka：Kafka架构深入之生产者和消费者的分区分配策略

Kafka工作流程分析

kafka producer工作流程

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)