Hadoop HDFS 数据流 - 代码天地

Hadoop HDFS 数据流

其他 2019-04-02 14:41:01 阅读次数: 0

HDFS 写数据流程

在这里插入图片描述

客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。
NameNode 返回是否可以上传。
客户端请求第一个 block 上传到哪几个 datanode 服务器上。
NameNode 返回 3 个 datanode 节点，分别为 dn1、dn2、dn3。
客户端通过 FSDataOutputStream 模块请求 dn1 上传数据，dn1 收到请求会继续调用 dn2，然后 dn2 调用 dn3，将这个通信管道建立完成。
dn1、dn2、dn3 逐级应答客户端。
客户端开始往dn1上传第一个bloc(k先从磁盘读取数据放到一个本地内存缓存)，以packet 为单位，dn1 收到一个 packet 就会传给 dn2，dn2 传给 dn3;dn1 每传一个 packet 会放入一个应答队列等待应答。
当一个 block 传输完成之后，客户端再次请求 NameNode 上传第二个 block 的服务器。(重复执行 3-7 步)。

HDFS 读数据流程

HDFS 读数据流程

客户端通过Distributed FileSystem向NameNode请求下载文件，NameNode通过查询元数据，找到文件块所在的 DataNode 地址。
挑选一台 DataNode(就近原则，然后随机)服务器，请求读取数据。
DataNode 开始传输数据给客户端(从磁盘里面读取数据输入流，以 packet 为单位来做校验)。
客户端以 packet 为单位接收，先在本地缓存，然后写入目标文件。

参考

HDFS详解（2）——HDFS中的读写数据流

猜你喜欢

转载自blog.csdn.net/yljphp/article/details/88970669

Hadoop HDFS 数据流

Hadoop之HDFS的数据流

hadoop-HDFS的数据流

【Hadoop学习之HDFS】_10HDFS的数据流

Hadoop 之 HDFS (HDFS 数据流的读写流程)

Hadoop系列008-HDFS的数据流

Hadoop文件系统——HDFS读写数据流

Hadoop之HDFS(HDFS的数据流读写数据) （面试开发重点）

HDFS的数据流

hadoop的HDFS读写数据流程

hadoop HDFS 写数据流程

hadoop HDFS 读数据流程

图解Hadoop hdfs写数据流程

Hadoop 从 0 到 1 学习 ——第五章 HDFS 数据流

HDFS中的数据流

Hadoop大数据 --HDFS

大数据：Hadoop（HDFS 读写数据流程及优缺点）

Hadoop-HDFS-读写数据流图解+详细分析，源码解析-连载中

大数据技术之_04_Hadoop学习_01_HDFS_HDFS概述+HDFS的Shell操作(开发重点)+HDFS客户端操作(开发重点)+HDFS的数据流(面试重点)+NameNode和SecondaryNameNode(面试开发重点)

大数据技术之_04_Hadoop学习_01_HDFS_HDFS概述+HDFS的Shell操作(开发重点)+HDFS客户端操作(开发重点)+HDFS的数据流(面试重点)+NameNode和Seconda

Hadoop - HDFS原理：HDFS 读写数据

HDFS 基本概念&数据流

浅谈hdfs架构与数据流

快速学习-HDFS的数据流

HDFS的数据流（读和写）

HDFS的数据流（面试重点）

大数据技术之Hadoop之HDFS(7)——HDFS读写数据流程

大数据（Hadoop）-HDFS原理

大数据 Hadoop之HDFS

大数据 hadoop hdfs mapreduce

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)