分布式储存HDFS - 代码天地

分布式储存HDFS

编程语言 2018-12-10 16:47:59 阅读次数: 0

hdfs数据块的复制策略？

数据安全：在某个节点发生故障时，不会丢失数据备份；
网络传输开销：在备份数据同步过程中，尽量减少网络传输中的带宽开销；

hdfs调整块的大小会带来哪些影响？

hdfs块太小，会增加程序启动的map数量，增加执行时间，对程序不好，一方面存放大量小文件会占用NameNode中大量内存来存储元数据，而NameNode的内存是有限的，不可取；另一方面文件块过小，寻址时间增大，导致程序一直在找block的开始位置
hdfs块大减少了寻址开销（就是寻找文件的速度快）一方面，从磁盘传输数据的时间会明显大于寻址时间，导致程序在处理这块数据时，变得非常慢；另一方面，mapreduce中的map任务通常一次只处理一个块中的数据，如果块过大运行速度也会很慢。
总结：
文件块越大，寻址时间越短，但磁盘传输时间越长；
文件块越小，寻址时间越长，但磁盘传输时间越短。

HDFS namenode启动过程

namenode在磁盘上的两类文件组成：
fsimage文件：保存文件系统至上次checkpoint为止目录和文件元数据。
edits文件：保存文件系统从上次checkpoint起对hdfs的所有操作记录日志信息。
一、首此启动hdfs过程：
1，启动namenode：
2，读取fsimage生成内存中元数据镜像。
3，启动datanode：
4，向namenode注册；
5，向namenode发送blockreport。
启动成功后，client可以对HDFS进行操作将被记录在edits文件中。
二、之后启动HDFS文件系统过程：
启动namenode：
1，读取fsimage元数据镜像文件，加载到内存中。
2，读取editlog日志文件，加载到内存中，使当前内存中元数据信息与上次关闭系统时保持一致。然后在磁盘上生成一份同内存中元数据镜像相同的fsimage文件，同时生成一个新的null的editlog文件用于记录以后的hdfs文件系统的更改。
3，启动datanode：
4，向namenode注册；
5，向namenode发送blockreport。
启动成功后，client可以对HDFS进行操作将被记录在edits文件中。

namenode HA

详情见官网（journalnode，zk)

secondary namenode作用？

它的职责是合并NameNode的edit logs到fsimage文件中，从而减少hdfs重启的时间。什么时候合并取决于配置，

hdfs常用文件格式有哪些？各有什么优缺点？

//todo

如何扩展hdfs的容量？

//todo

猜你喜欢

转载自blog.csdn.net/qq_40228214/article/details/84937999

分布式储存HDFS

【Hdfs】分布式储存系统

分布式存储与HDFS

分布式 - 存储HDFS

Hadoop分布式文件储存系统

【HBase】分布式储存系统

基于MetaID的分布式储存方案

ipfs 分布式储存说明

HDFS伪分布式环境搭建

Hadoop分布式文件系统HDFS

分布式文件系统HDFS简介

Hadoop分布式文件系统--HDFS

分布式文件系统HDFS

Hadoop伪分布式部署(HDFS)

HDFS分布式文件系统

分布式文件系统HDFS 介绍

搭建hdfs伪分布式模式

HDFS分布式文件系统简介

HDFS搭建分布式集群

分布式文件系统——HDFS

hadoop hdfs 分布式存储

Hadoop : 搭建hdfs分布式集群

HDFS 分布式文件系统

HDFS分布式集群安装

HDFS高可用分布式的搭建

1、HDFS分布式文件系统

HDFS完全分布式搭建步骤

【Hadoop】HDFS分布式文件系统

HDFS分布式原理---概念篇

HDFS完全分布式搭建

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)