Hadoop自学指南 - 代码天地

Hadoop自学指南

其他 2021-03-25 04:24:15 阅读次数: 0

笔记而已仅供参考。

数据： tb级别 pb级别

速度: 持续事实产生诗句

多样化：半结构化，非结构化，多为数据

价值：数据挖掘。预测分析（统计报表）

可以构建在廉价机器上

人口密度分析

hadoop的子项目

Core 分布式文件系统的计算框架

HDFS hadoop的分布式文件系统

Map/Reduce 数据处理框架

zooKeeper 分布式协同系统

pig

Hive 分布式数据仓库（HiveSQL）

HBase 可扩展的数据库系统

。。。

HDFS:

可靠性：因为创建了多个副本放在不同节点，并且加快读取性能。

NameNode：储存元数据（文件名称，大小，权限。。。），映射关系，存放在内存

DataNode：保存文件内容，在磁盘中

一个名字节点多个数据节点

数据复制（冗余机制）

空间回收机制

缺点：低延迟数据访问，比如毫秒级别的延迟低的，不适合用hdfs

大量的小文件不适合（文件越多元数据越大）

并发写入和随机修改，一个文件只能有一个写者（不适合修改）

存储单元是block

文件被切分成固定代销的数据块

数据块默认大小为64MB（逻辑大小，并不会实际占用磁盘大小）

一个文件被切分成若干个block存储到不同的节点上

默认情况下每个bock都有三个副本

Namenode保存元数据信息包括Block保存在哪个DATANode中（启动时上报）

元数据存储的磁盘文件名为“fsimage”

edits记录对元数据的操作日志（每隔一段时间合并数据操作，类似于关系型数据库的事务）

猜你喜欢

转载自blog.csdn.net/wangzhichaogege/article/details/110518084

hadoop自学指南二

Hadoop自学指南

Hadoop自学

Hadoop指南

MySql 自学指南1

Mysql自学指南3

Mysql自学指南2

Mysql自学指南4

机器学习自学指南

前端自学指南

Hadoop自学(慕课网自学笔记）

《Hadoop权威指南》---初识Hadoop

Java 后端自学路线指南

5G自学指南

Java自学指南七、规划

自学OpenMP指南【多层for循环】

Hadoop 流自学及工作原理

hadoop 2.3.0 搭建指南

Hadoop 权威指南

Hadoop学习指南

Hadoop搭建指南

hadoop权威指南

【HADOOP】“填坑”指南

hadoop安装简要指南

Hadoop安装指南

Hadoop命令指南

Hadoop配置安装指南

Hadoop入门——初识Hadoop 自学hadoop视频教程

Hadoop权威指南摘抄(初识Hadoop)

《Hadoop权威指南》---hadoop的I/O操作

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)