Hadoop生态圈——大数据 - 代码天地

Hadoop生态圈——大数据

其他 2018-10-18 21:01:11 阅读次数: 0

版权声明：君若不学，则何以成？本文为博主原创文章，欢迎转载（记得注明出处，拜托~）。 https://blog.csdn.net/hu_belif/article/details/83058798

Hadoop的发展史：

生态圈图解：

MapReduce:分布式数据处理模型和执行环境、运行于大型商用机集群。

ZooKeeper:一个分布式、高可用的协调服务。ZooKeeper提供分布式锁之类的基本服务用于构建分布式应用。

HDFS: 分布式文件系统,运行于大型商用机集群。 Hadoop体系最底层的一个模块。为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。

HBase: 一个分布式、按列存储的数据库。HBase 使用 HDFS作为底层存储,同时支持 MapReduce 的批量式计算和点查询(随机读取)。

Pig:一种数据流语言和运行环境,用以检索非常大的数据集。Pig 运行在MapReduce 和 HDFS 的集群上。

Hive:一个分布式、按列存储的数据仓库。 Hive 管理 HDFS中存储的数据,并提供基于 SQL 的查询语言(由运行时引擎翻译成 MapReduce作业)用以查询数据。

Avro:支持高效、跨语言的 RPC以及永久存储数据的序列化实现,主要负责数据的序列化。

Mahout:一个可扩展的机器学习和数据挖掘

大数据必备的一些数据处理技术：

借鉴：https://m.aliyun.com/wanwang/info/1504869.html

猜你喜欢

转载自blog.csdn.net/hu_belif/article/details/83058798

Hadoop生态圈——大数据

大数据Hadoop生态圈：Pig

大数据核心——Hadoop生态圈

大数据Hadoop生态圈介绍

大数据生态圈

20190223 Hadoop生态圈，关于大数据

基于ambari搭建hadoop生态圈大数据组件

大数据基石Hadoop生态圈-组件介绍

大数据Hadoop生态圈各个组件介绍（详情）

大数据Hadoop生态圈-组件介绍

大数据学习笔记——hadoop生态圈

hadoop生态圈

大数据技术生态圈讲解

大数据生态圈及重要组件

大数据生态圈简单介绍

大数据生态圈的理解

大数据生态圈相关总结

大数据架构师：如何从零基础搭建大数据hadoop生态圈

「大数据集群的搭建和使用」背景知识：大数据Hadoop生态圈介绍

一文看懂大数据的技术生态圈，Hadoop，hive，spark都有了

大数据基础知识点---hadoop生态圈

大数据生态圈单节点环境搭建（hadoop、hbase、spark等）

一文教你看懂大数据的技术生态圈:Hadoop,hive,spark

1.1大数据平台架构及Hadoop生态圈

大数据开发生态圈之Apache Hadoop简介

一篇了解大数据架构及Hadoop生态圈

大数据系列（一）hadoop生态圈基础知识后续之YARN

大数据系列（一）hadoop生态圈基础知识后续之HDFS

大数据系列（一）hadoop生态圈基础知识

大数据技术生态圈Hadoop、Hive、Spark之间的关系

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)