hadoop原理 - 代码天地

hadoop原理

编程语言 2018-05-12 21:22:51 阅读次数: 0

1.map-reduce

map将输入数据打散，并对其做简单处理，输出。

在hadoop中先进行一个叫做shuffle的过程对中间数据排序，然后由reduce把中间数据合并起来，然后将结果输出。

map任务读入切分后的大规模数据、处理->shuffle对数据排序->reduce进行最后的数据处理。

mapReduce适用于超大规模数据（100TB数量级）且各数据之间相关性较低情况。

2.HDFS（hadoop file system）

hadoop是使用网络松散（单一机器故障不会对集群有影响）组合起来的，多个计算机需要一个统一的文件访问方式，因此hdfs应运而生，提供了较好的容错和扩展性。

3.节点和槽位

节点：hadoop集群由很多low cose的计算机组成，则这些计算机被称为节点。

hadopp的计算节点和存储节点是统一的，这样在计算中中产生的文件，可以直接放在本机的存储节点上，减少网络带宽占用和延迟。

槽位：指集群内每个计算的cpu并发数，CPU数*核心数*超线程数的总和。任务需要安排在一个槽位执行，安排不到的会等待。

猜你喜欢

转载自y-x.iteye.com/blog/1807122

hadoop原理

hadoop--初识hadoop

Hadoop-初识hadoop

Hadoop HDFS原理分析

Hadoop MapperReduce原理

Hadoop技术原理总结

hadoop (mapreduce运行原理)

hadoop原理浅析及安装

hadoop工作原理

hadoop基础-MapReduce原理

hadoop mapreduce 原理

Hadoop之--HDFS原理

hadoop ha原理详解

Hadoop 之 MapReduce原理

Hadoop HDFS原理

Hadoop MapReduce原理及实例

hadoop：hdfs架构及原理

Hadoop Streaming原理

【Hadoop】HDFS的运行原理

hadoop hdfs内部原理

HADOOP的原理实现

Hadoop 之 HDFS原理

白话Hadoop架构原理

hadoop原理分析

Hadoop Mapreduce原理

Hadoop| MapperReduce② 框架原理

Hadoop | MapReduce 原理分析

Hadoop简单原理

HADOOP-QJM原理

Hadoop原理及架构

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)