《Hadoop权威指南第4版》 - 第三章 Hadoop分布式文件系统 - 设计概念/数据流/Java接口 - 代码天地

《Hadoop权威指南第4版》 - 第三章 Hadoop分布式文件系统 - 设计概念/数据流/Java接口

其他 2020-01-02 16:01:08 阅读次数: 0

3.1 HDFS的设计概念

HDFS以流式数据访问模式来存储超大的文件
HDFS延时较高, HBASE 到可以是较好的选择.
大量的小文件, namenode(命名结点/空间) 将文件系统的元数据存储在内存中,每个大概占150Bytes, 上百万/千万时需要考虑物理机的内存大小
HDFS只支持单用户在 " 文件末尾 " 的追加的方式写入数据

3.2 HDFS 的概念

数据块: 数倍于磁盘的数据块，通常MapReduce中的map任务一次只处理一个HDFS块中的数据, 也不会过大(涉及到集群)
namenode 和 datanode
- namenode为管理结点，文件系统的命名空间，保存整个文件系统树的所有文件信息，记录每个文件在各个结点中的存储信息（文件和数据块的互相引用关系）
- datanode为数据结点,
客户端Client，通过namenode和datanode交互来访问整个文件系统
块缓存，访问频繁的块会被显式的加载到DataNode的内存中
联邦HDFS，适用于超大集群，内存会成为瓶颈，联邦的HDFS的namenode允许进行扩展，每个node只管理一部分文件，如不同的目录对应不同的node
HDFS的高可用性
- namenode存在单点故障，Hadoop2 增加了 “活动-备份” 的nameNode模式

3.3 命令行模式

输入hadoop fs -help 获取命令大全

猜你喜欢

转载自www.cnblogs.com/zhazhaacmer/p/12133377.html

《Hadoop权威指南第4版》 - 第三章 Hadoop分布式文件系统 - 设计概念/数据流/Java接口

《Hadoop权威指南》第三章 Hadoop分布式文件系统

《大数据技术应用与原理》第二版-第三章分布式文件系统HDFS

hadoop权威指南第4版笔记

《Hadoop权威指南第4版》 - 第十章构建Hadoop集群-安全性

第3章:Hadoop分布式文件系统(2)

跟我一起读《Hadoop权威指南》第三篇 -- HDFS （Hadoop分布式文件系统）

《Hadoop权威指南第4版》 - 第四章关于YARN - hadoop的集群资源管理系统

Hadoop权威指南-大数据的存储与分析第四版——学习笔记——第2章——1

Hadoop权威指南第三版笔记第一章

[hive]HIVE编程指南-第三章数据类型和文件格式

Hadoop分布式文件系统（HDFS）Java接口（HDFS Java API）详细版

第三章.4节文件系统的实现

《Hadoop权威指南》---分布式文件系统

Apache Hadoop 入门教程第三章

第三章 Hadoop 运行模式(2)

第三章 Hadoop 运行模式(1)

大数据时代之hadoop(一)：hadoop安装大数据时代之hadoop(二)：hadoop脚本解析大数据时代之hadoop(三)：hadoop数据流（生命周期）大数据时代之hadoop(四)：hadoop 分布式文件系统（HDFS) 大数据时代之hadoop(五)：hadoop 分布式计算框架（MapReduce）

Hadoop基础教程-第3章 HDFS：分布式文件系统（3.1 HDFS概述）

Hadoop分布式文件系统命令行接口（HDFS Shell）详细版

第三章.3节文件系统接口

资料学习《Hadoop权威指南第4版》+《Elasticsearch源码解析与优化实战》+《Spark高级数据分析第2版》

小白做题 ——数据库系统概念（第六版）第三章习题

操作系统第三章 4 死锁

第三章第1节存货数据

译_jBPM4用户指南:第三章_图形化流程设计器(GPD)

【自考】数据结构第三章，数组，期末不挂科指南，第5篇

【自考】数据结构第三章，栈、队列、数组，期末不挂科指南，第3篇

《数据库系统原理》[2018年版] 第三章数据库设计

操作系统概念_第三章_进程

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)