HDFS体系结构 - 代码天地

HDFS体系结构

其他 2018-05-21 14:46:45 阅读次数: 2

HDFS体系结构

　　master/slave架构

　　文件切分成块（128）

　　namenode是主节点

　　DataNode在本地文件系统存储文件块数据，以及块数据的校验

NameNode

　　Namenode是一个中心服务器，单一节点，负责管理文件系统的名字空间(namespace)以及客户端对文件的访问
文件操作，NameNode负责文件元数据的操作，DataNode负责处理文件内容的读写请求，数据流不经过NameNode，只会询问它跟那个DataNode联系
NameNode
　　副本存放在那些DataNode上由NameNode来控制，根据全局情况做出块放置决定，读取文件时NameNode尽量让用户先读取最近的副本，降低带宽消耗和读取时延
NameNode全权管理数据块的复制，它周期性地从集群中的每个DataNode接收心跳信号和块状态报告(BlockReport)。接收到心跳信号意味着该DataNode节点工作正常。块状态报告包含了一个该　　　　DataNode上所有数据块的列表。
DataNode
　　一个数据块在DataNode上以文件存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳
DataNode启动后向NameNode注册，通过后，周期性（1小时）的向NameNode上报所有的块信息
心跳是每3秒一次，心跳返回结果带有NameNode给该DataNode的命令，如复制块数据到另一台机器，或删除某个数据块。如果超过10分钟NameNode没有收到某个DataNode 的心跳信息，则NameNode认为该DataNode节点已死亡不可用。
SecondaryNameNode
　　辅助的NameNode
　　周期性将EditsLog文件合并
　　工作原理，如右图所示
工作流程
　　secondarynamenode通知namenode切换edits文件
　　secondarynamenode从namenode获得fsimage和edits(通过http)
　　secondarynamenode将fsimage载入内存，然后开始合并edits
　　secondarynamenode将新的fsimage发回给namenode
　　namenode用新的fsimage替换旧的fsimage
什么时候checkpiont
　　fs.checkpoint.period 指定两次checkpoint的最大时间间隔，默认3600秒。
　　fs.checkpoint.size 规定edits文件的最大值，一旦超过这个值则强制checkpoint，不管是否到达最大时间间隔。默认大小是64M
数据损坏处理
　　当DN读取block的时候，它会计算checksum；
　　如果计算后的checksum，与block创建时值不一样，说明该block已经损坏。
　　client读取其它DN上的block；NN标记该块已经损坏，然后复制block达到预期设置的文件备份数；
　　DN在其文件创建后三周验证其checksum。

与Linux文件权限类似
　　r: read; w:write; x:execute，权限x对于文件忽略，对于文件夹表示是否允许访问其内容
　　如果Linux系统用户zhangsan使用hadoop命令创建一个文件，那么这个文件在HDFS中owner是zhangsan
　　HDFS的权限目的：阻止好人做错事，而不是阻止坏人做坏事。HDFS相信，你告诉我你是谁，我就认为你是谁
　　Root 用户只能查看，不能写入
　　hadoop dfs -chmod 777 /

猜你喜欢

转载自www.cnblogs.com/sumboy/p/9067039.html

HDFS 的体系结构

HDFS体系结构

HDFS的体系结构

Apache Hadoop HDFS体系结构

HDFS的体系结构和操作

Hadoop HDFS体系结构概述

Hadoop 中HDFS、MapReduce体系结构

HDFS体系结构及基本概念

HDFS体系结构的局限性

HDFS体系结构和Java操作API

《Hadoop》"呶呶不休"（二）HDFS体系结构概述

1）HDFS分布式文件系统 2）HDFS核心设计 3 ）HDFS体系结构

HDFS二.HDFS实现分布式文件存储---体系结构

Jvm的体系结构

hadoop体系结构

MySQL体系结构

Spring体系结构

android体系结构

JVM 体系结构

hadoop的体系结构

WebRTC体系结构

Pregel体系结构

HIVE体系结构

JVM体系结构

Drupal的体系结构

Spring的体系结构

进程体系结构

oracle体系结构

体系结构

oracle的体系结构

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)