大数据第二章hadoop概述 - 代码天地

大数据第二章hadoop概述

其他 2019-09-21 19:12:38 阅读次数: 0

hadoop简介

hadoop是基于Java语言开发的，具有很好的跨平台性，并且可以部署在廉价的计算机群众，hadoop的核心是分布式文件系统HDFS（hadoop distributed file system）和mapreduce,HDFS具有较高的读写速度和和好的容错性和可伸缩性并且具有大规模的数据分布存储性以及较高的安全性。

MAPRDUCE是一套计算速度很快的计算模型。

hadoop的特性

高可靠性、高效性、高扩展性、高容错性、成本低、支持多种语言、跨平台性。

hadoop的生态系统

HDFS作为hadoop两大核心之一的分布式文件系统，它是以流的形式访问文件系统中的数据，在访问数据的过程中，具有很高的吞吐率，他常常是作为最廉价的机群使用的最好选择工具，并且在访问数据的过程中出现故障也能很好的保障文件的可用性和可靠性。

HBase他是一个具有高性能、高可靠性的分布式数据库，一般作为HDFS的底部存储，他具有强大的非结构化数据存储能力，是采用列的形式存储，具有良好的横向扩展能力。

Mapreduce是一种编程模型其核心是采用分而治之的思想，他是把数据纷呈多个块状分布在多个计算机上进行运行，最终得出结果，汇聚在一起，具有高效率。

Hive是一个数据仓库工具可以用于数据的整理、查询、和存储，他并且也具有良好的语言转化能力。

Flume是一个分布式的日志采集、聚合和传输的系统。

Sqoop主要用于Hadoop和关系数据库之间交换数据，可以改进数据的胡操作性。

Hadoop的三大主键是HDFS、MAPREDUCE、YARN。

spark是基于mapreduce之后的具有高速度的（内存）计算模型.

猜你喜欢

转载自www.cnblogs.com/8b8b/p/11564063.html

大数据第二章hadoop概述

第二章-大数据处理框Hadoop

大数据总结【第二章：Hadoop】

第二章：大数据处理架构Hadoop

《大数据技术应用与原理》第二版-第二章大数据处理架构Hadoop

大数据环境部署第二章——Hadoop 伪分布式环境搭建

第二章：Hadoop

大数据技术原理与应用第二章大数据处理架构Hadoop 学习指南

大数据学习第二章、HDFS相关概念

spark大数据快速分析第二章

第二章 C语言概述

第二章语言的概述

第二章 RFID技术概述

第二章机器学习概述

第二章C语言概述

【Shiro】第二章 Shiro概述

第二章 springcloud入门概述

Hadoop 第二章 HDFS

第二章 SQL谓词的概述（二）

第二章第10节Java语言基础(数据类型的概述和分类)

《数据仓库工具箱》第二章笔记——Kimball维度建模技术概述

mysql核心内幕第二章-MySQL概述

Kubernetes-第二章：重要概述

第二章 C# 编程概述

《C Primer Plus》- 第二章 C语言概述

Golang----第二章Go概述

UML基础案例与应用第二章UML概述

第二章双向数据绑定

第二章—数据类型

第二章数据类型

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)