认识Hadoop - 代码天地

认识Hadoop

其他 2019-03-01 21:04:44 阅读次数: 0

概述

开源、分布式存储、分布式计算

大数据生态体系

特点：开源、社区活跃
囊括了大数据处理的方方面面
成熟的生态圈

推荐系统

应用场景

搭建大型数据仓库，PB级数据的存储、处理、分析、统计
日志分析
数据挖掘

核心组件

HDFS（分布式文件存储系统）

特点：扩展性、容错性、海量数据存储
将文件切分成指定大小（默认128M）的数据块并以多副本（默认3副本）的存储在多个机器上
数据切分、多副本、容错等操作对用户是透明的

架构

1个master（NameNode/NN）带n个slave（datanode/DN）
1个文件会被拆分成多个Block（blocksize=128M）
NN：
- 负责客户端请求响应
- 负责元数据（文件名称、副本系数、block存放的DN）管理
DN：
- 存储用户的文件对应的数据块（block）
- 定期向NN发送心跳信息，汇报本身及所有的block信息，健康状况

hdfs副本策略

Yarn（资源调度系统）

特点：扩展性、容错性（任务失败重试）、多框架资源统一调度 （比如spark、hivesql、hbase、storm）

yarn：Yet another resource negotiator
负责整个集群资源的管理和调度

MapReduce（分布式计算框架）

特点：扩展性、容错性、海量离线数据处理

Hadoop的优势

高可靠性

数据存储：数据块多副本
数据计算：重新调度作业计算

扩展性

存储/计算资源不够时，可以横向的线性扩展机器
一个集群可以包含数以千计的节点

其他

存储在廉价机器上，降低成本
成熟的生态圈

Hadoop常用发行版及选型

Apache Hadoop（解决了单个框架的问题，联合使用时很多包冲突）
CDH：Cloudera Distributed Hadoop（60~70%）
HDP：Hortonworks Data PlatForm

猜你喜欢

转载自www.cnblogs.com/zxbdboke/p/10458615.html

认识Hadoop

Hadoop认识初体验

关于Hadoop的基础认识

初步认识Hadoop

初识Hadoop，对hadoop的简单认识，写的很明白

认识的误区 Hadoop 云计算

七种最常见的Ｈａｄｏｏｐ和Ｓｐａｒｋ项目，你见过几种？

大数据学习-2 认识Hadoop

认识大数据以及hadoop

一文带你认识Hadoop

Hadoop、Hive、Spark的简单认识和总结

Hadoop结构认识以及相关作用

Hadoop1-认识Hadoop大数据处理架构

Hadoop-请谈谈你对Hadoop的认识与理解

大数据之Hadoop学习《一》——认识HDFS

Hadoop Metrics体系分析之一：认识Metrics

Hadoop大数据开发基础系列：八、认识Hive

Hadoop2-认识Hadoop大数据处理架构-单机部署

吴裕雄--天生自然HADOOP操作实验学习笔记：hadoop框架认识以及基本操作

hadoop源码-org.apache.hadoop.io.compress系列1 认识解码器/编码器

Hadoop大象之旅004-认识一下常用的Linux工具

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)

Hadoop

【hadoop】

sql认识

DOM的认识

认识shiro

CSRF 认识

认识wsgi

JavaScript认识

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)