Hadoop入门（5）--HDFS - 代码天地

Hadoop入门（5）--HDFS

其他 2018-08-09 10:06:15 阅读次数: 0

HDFS简介

Hadoop的文件系统

设计结构

1 Block(块)
HDFS将文件分配成block来存储，每个块默认64MB，块是文件存储处理的逻辑单元，按照block管理
2 NameNode
管理节点，存放元数据

文件与数据块的映射表
数据块与数据节点的映射表
HDFS体系结构

3 DataNode
HDFS的工作节点
用来存放真正的数据块的

HDFS中数据管理和容错

数据块副本

为了保证硬件上的容错，每个数据块3个副本，分布在两个机架内的三个节点（两份在同一个机架）。一个机架故障不影响。
这里写图片描述

心跳检测

NameNode和DataNode之间有心跳协议，
DataNode定期向NameNode发送心跳信息（网络关机）
Secondary NameNode
NameNode的备份，定期同步元数据映像文件和修改日志
故障时转正
这里写图片描述

HDFS中文件读取的流程

读取
- 客户端先在NameNode查找DataNode的位置
- 再按照位置在datanode中找到，下载下来
这里写图片描述
写入

文件拆分成块
在NameNode中查找，空的DataNode，返回空的地址
在空的DataNode中写入
流水线复制成三分
更新NameNode

HDFS特点

1 数据冗余硬件容错
* 2 流式的数据访问*
3 存储大文件不适合存储大量小文件
4 适合数据批量读写吞吐量高
不适合交互式应用高延迟
5适合一次写入多次读取，顺序读写
不支持多用户并发写相同文件

HDFS 使用

可视化操作

hadoop namenode -format

查看文件夹

hadoop fs -ls/

提交

hadoop fs -put hadoop-env.sh 目录

从HDFS下载

hadoop fs -get input/hadoop-env.sh hadoop-env2.sh

hadoop fs -get (HDFS目录) (另命名)

看文件系统所有信息

hadoop dfsadmin -report

架构图

这里写图片描述

版本对比

这里写图片描述

猜你喜欢

转载自blog.csdn.net/weixin_39381833/article/details/81266315

Hadoop入门（5）--HDFS

Hadoop-5-HDFS

Hadoop从入门到精通系列之--5.HDFS的API

Hadoop之HDFS入门

Hadoop（2）：HDFS 入门

Hadoop（5）：HDFS 的应用开发

Hadoop入门之HDFS与MapReduce

Hadoop入门2--HDFS

HDFS架构——Hadoop入门(一)

Hadoop入门：HDFS的API操作

Hadoop学习笔记5之HDFS Block

大数据-Hadoop生态(5)-HDFS概述

入门Hadoop---HDFS-HA搭建

Hadoop从入门到进阶 HDFS（一）

【Hadoop离线基础总结】HDFS入门介绍

Hadoop入门之eclipse对HDFS的常用操作

10天Hadoop快速突击（5）——HDFS详解 HDFS详解

hadoop的HDFS

Hadoop HDFS

Hadoop - HDFS

Hadoop ---- HDFS

HDFS与HADOOP

hadoop 的hdfs：

5.大数据学习之旅——hadoop-HDFS

BigData5：Hadoop之HDFS的Edits和Fsimage文件

Hadoop大数据平台入门——HDFS和MapReduce

hadoop入门--通过Apache Flume向HDFS存储数据

Hadoop入门IntelliJ编写Maven创建HDFS文件

Hadoop HA入门笔记(HDFS HA YARN HA)

Hadoop入门及HDFS底层运行原理讲解【小二讲堂】

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)