大数据学习笔记——hadoop生态圈 - 代码天地

大数据学习笔记——hadoop生态圈

其他 2021-02-09 09:16:03 阅读次数: 0

学习hadoop入门阅读资料，google的三篇论文
《Google file system》：论述了怎样借助普通机器有效的存储海量的大数据；
《Google MapReduce》：论述了怎样快速计算海量的数据；

《Google BigTable》：论述了怎样实现海量数据的快速查询；

大数据技术本质上无非解决4个核心问题。
1、存储，海量的数据怎样有效的存储？主要包括hdfs、Kafka；
2、计算，海量的数据怎样快速计算？主要包括MapReduce、Spark、Flink等；
3、查询，海量数据怎样快速查询？主要为Nosql和Olap，Nosql主要包括Hbase、 Cassandra 等，其中olap包括kylin、impla等，
其中Nosql主要解决随机查询，Olap技术主要解决关联查询；

4、挖掘，海量数据怎样挖掘出隐藏的知识？也就是当前火热的机器学习和深度学习等技术，包括TensorFlow、caffe、mahout等；

从生态圈角度展示图：

从架构角度展示图：

猜你喜欢

转载自blog.csdn.net/qq_33336155/article/details/80484580

大数据学习笔记——hadoop生态圈

Hadoop生态圈——大数据

大数据Hadoop生态圈：Pig

大数据核心——Hadoop生态圈

大数据Hadoop生态圈介绍

大数据生态圈

20190223 Hadoop生态圈，关于大数据

基于ambari搭建hadoop生态圈大数据组件

大数据基石Hadoop生态圈-组件介绍

大数据Hadoop生态圈各个组件介绍（详情）

大数据Hadoop生态圈-组件介绍

Haddoop大数据教程笔记_02_Hadoop生态圈简介

学习Scala 进击大数据Spark生态圈

Scala 学习进击大数据Spark生态圈

(视频)Scala 学习进击大数据Spark生态圈

【转载】学习Scala 进击大数据Spark生态圈

正式进入Hadoop学习不会再有比我还全面的大数据学习（三） Hadoop生态圈

正式进入Hadoop学习不会再有比我还全面的大数据学习（三） Hadoop生态圈

Scala 学习进击大数据Spark生态圈----个人笔记

hadoop生态圈

大数据技术生态圈讲解

大数据生态圈及重要组件

大数据生态圈简单介绍

大数据生态圈的理解

大数据生态圈相关总结

大数据架构师：如何从零基础搭建大数据hadoop生态圈

「大数据集群的搭建和使用」背景知识：大数据Hadoop生态圈介绍

学习Scala 进击大数据Spark生态圈进击Spark生态圈必备视频教程

Hadoop学习笔记_1：Hadoop相关生态圈了解学习

大数据生态圈单节点环境搭建（hadoop、hbase、spark等）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)