hdfs 数据流单位 block、packet与chunk - 代码天地

hdfs 数据流单位 block、packet与chunk

其他 2019-06-12 09:08:10 阅读次数: 0

block、packet与chunk

在DFSClient写HDFS的过程中，有三个需要搞清楚的单位：block、packet与chunk；

block是最大的一个单位，它是最终存储于DataNode上的数据粒度，由dfs.block.size参数决定，默认是64M；注：这个参数由客户端配置决定；
packet是中等的一个单位，它是数据由DFSClient流向DataNode的粒度，以dfs.write.packet.size参数为参考值，默认是64K；注：这个参数为参考值，是指真正在进行数据传输时，会以它为基准进行调整，调整的原因是一个packet有特定的结构，调整的目标是这个packet的大小刚好包含结构中的所有成员，同时也保证写到DataNode后当前block的大小不超过设定值；
chunk是最小的一个单位，它是DFSClient到DataNode数据传输中进行数据校验的粒度，由io.bytes.per.checksum参数决定，默认是512B；
注：事实上一个chunk还包含4B的校验值，因而chunk写入packet时是516B；数据与检验值的比值为128:1，所以对于一个128M的block会有一个1M的校验文件与之对应；

写过程中的三层buffer 写过程中会以chunk、packet及packet queue三个粒度做三层缓存；

首先，当数据流入DFSOutputStream时，DFSOutputStream内会有一个chunk大小的buf，当数据写满这个buf（或遇到强制flush），会计算checksum值，然后填塞进packet；
当一个chunk填塞进入packet后，仍然不会立即发送，而是累积到一个packet填满后，将这个packet放入dataqueue队列；
进入dataqueue队列的packet会被另一线程按序取出发送到datanode；
（注：生产者消费者模型，阻塞生产者的条件是dataqueue与ackqueue之和超过一个block的packet上限）

猜你喜欢

转载自www.cnblogs.com/xiangyuguan/p/11007497.html

hdfs 数据流单位 block、packet与chunk

HDFS------block,packet,chunk的关系

HDFS的数据流

HDFS中的数据流

Hadoop HDFS 数据流

HDFS 基本概念&数据流

浅谈hdfs架构与数据流

快速学习-HDFS的数据流

Hadoop之HDFS的数据流

hadoop-HDFS的数据流

HDFS的数据流（读和写）

HDFS的数据流（面试重点）

HDFS中的数据块(Block)

【Hadoop学习之HDFS】_10HDFS的数据流

Hadoop 之 HDFS (HDFS 数据流的读写流程)

大数据（五）：HDFS数据流深入理解

从0开始学大数据（6）：HDFS的数据流

Hadoop系列008-HDFS的数据流

Hadoop文件系统——HDFS读写数据流

HDFS数据流原理，节点距离，机架感知

Hdfs block数据块大小的设置规则

Hadoop之HDFS(HDFS的数据流读写数据) （面试开发重点）

HDFS读写数据流程

HDFS读数据流程

HDFS写数据流程

HDFS 写数据流程

HDFS Append时packet的格式以及DataNode对block/checksum文件的处理

Hadoop hdfs block 状态

hdfs丢失block处理

Split ，HDFS Block

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)