大数据框架-HDFS - 代码天地

大数据框架-HDFS

其他 2018-09-12 10:26:02 阅读次数: 0

HDFS：分布式文件系统，运行文件通过网络在多台主机分享的文件系统，分块写入(128M)，适用于一次写入多次查询，不支持并发写(只能一块一块写)，小文件不合适。

nameNode(主节点，单个): 保存HDFS的元数据信息(命名空间信息、文件系统的目录树、文件和block关系即文件对应block列表、dayaNode和block关系)；接受用户读写请求。当它运行的时候，这些信息是存在内存中的，但是这些信息也可以序列化到磁盘上。负责将文件分block存储在磁盘上，多备份存储（由dataNode进行互相之间的水平复制）。

读：在内存中始终保存元数据metedata，用于处理读请求

写：首先向edit文件写日志，写入成功后才会修改内存metedata，但fsimage没改变

Checkpoint的过程：

dataNode(从节点，多个) : Datanode是文件系统的工作节点，他们根据客户端或者是namenode的调度存储和检索数据，并且定期向namenode发送他们所存储的块(block)的列表。块默认大小128M，若文件小于128，则不会全占满该块。

Ps:Hadoop2.0，使用zookeeper来提供nameservice(active、standby)，active节点通过journalNode将edits文件时刻写入到介质中，standby节点通过failoverController 进程将数据实时同步所在机器，时刻监控namenode状态，并和zk保持心跳。

猜你喜欢

转载自www.cnblogs.com/xiongchang95/p/9633163.html

大数据框架-HDFS

大数据框架hadoop的文件系统（HDFS）命令大全

深入解读大数据框架Hadoop之HDFS架构

大数据---HDFS

大数据HDFS总结

【大数据】HDFS

大数据-hdfs技术

Hadoop大数据 --HDFS

大数据 03 HDFS

大数据原理-HDFS

大数据（1）---大数据及HDFS简述

ma-大数据HDFS

大数据笔记（一）：HDFS

大数据（Hadoop）-HDFS原理

大数据的Hdfs与MapReduce介绍

大数据学习之路-hdfs

大数据HDFS存储过程

大数据 Hadoop之HDFS

大数据生态之 ——HDFS

大数据 hadoop hdfs mapreduce

大数据存储基石HDFS

大数据存储之HDFS

大数据Hadoop之HDFS

大数据运维HDFS

大数据学习之路--HDFS

大数据之Hadoop（HDFS）

大数据-hadoop之HDFS

大数据入门之HDFS

【大数据】HDFS的shell命令

大数据HDFS应用开发

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)