Hadoop 初级概念总结 - 代码天地

Hadoop 初级概念总结

其他 2019-02-22 13:30:54 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/guyan1101/article/details/87192859

google大数据技术

mapreduce bigtable GFS

hadoop

一个模仿google大数据技术的开源实现

开源的 apache

分布式存储 + 分布式计算平台

核心：

HDFS 分布式文件系统存储海量数据

MapReduce 并行处理框架实现任务分解和调度

用途

搭建大型数据仓库 pb级数据存储处理分析等业务

开源工具：

Hive ：降低使用Hadoop的使用门槛

Hbase 提供数据的读写和实时访问，实现对表数据的读写功能

zookeeper 管理hadoop节点功能

版本：

1.X 2.X

1.X稳定

2.X不稳定

新手使用1.2

安装：

1.准备linux环境

2.安装JDK

3.配置Hadoop

通过网络租用云主机

阿里云 uninteStack 等

HDFS 文件系统

HDFS的文件被分成块进行存储

HDFS块的默认大小为64m

块是文件存储处理的逻辑单元

两类节点

namenode datanode

namenode 管理节点，存放文件元数据

datanode HDFS工作节点，存放数据块

数据块副本：每个数据块3个副本分别存放在2个机架上

HDFS特点

1.数据冗余硬件容错

2.流式的数据访问

3.存储大文件

适用性和局限性

适合数据批量读写，吞吐量高

不适合交互应用，低延迟很难满足

适合一次写入多次读取顺序读写

不支持多用户并发写相同文件

mapreduce

分而治之，将一个大任务分成多个小的子任务（map），并行执行后合并结果。

基本概念

Job & Task

Jobtracker

Tasktracker

MapReduce的容错机制

1.重复执行

2.推测执行

猜你喜欢

转载自blog.csdn.net/guyan1101/article/details/87192859

Hadoop 初级概念总结

Hadoop初级之Hadoop基本概念与应用前景

hadoop初级

Hadoop概念

Hadoop 概念

Hadoop的初级学习记录

Hadoop总结

hadoop 总结

Hadoop总结：

Hadoop实战-初级部分之 Hadoop IO

Hadoop学习之概念

Hadoop：相关概念

Hadoop 核心概念解析

hadoop组件概念理解

hadoop-yarn-概念

Hadoop相关概念

Hadoop基础概念

Hadoop-概念

Hadoop——HDFS概念

Hadoop核心概念

大数据-Hadoop概念

Hadoop基本概念

Hadoop初级之Linux命令

Hadoop初级之Hive配置

Hadoop初级之shell脚本

hadoop基础概念之Hadoop核心组件

hadoop学习1-Hadoop基础概念

[hadoop]PeopleRank初步概念与PageRank的hadoop算法

什么是Hadoop，Hadoop相关概念的基本理解

Hadoop学习总结（1）——大数据以及Hadoop相关概念介绍

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)