大数据生态圈的理解 - 代码天地

大数据生态圈的理解

其他 2019-03-17 16:19:21 阅读次数: 0

HDFS是整个大数据架构的底层，它提供了一个文件系统

Spark(Spark core(RDD)) 和 MapReduce 是一个层级，是一种操作计算框架，MapReduce相当于一个别人写好的 java程序，它并不需要在服务器上启动相应的服务，甚至可以在本地run

Hive => MapReduce Hive 操作MapReduce(底层是 MapReduce)

Spark SQL=> Spark core(RDD) Spark SQL 操作RDD(底层是 RDD)

Hive 和Scala、Java一个层级，相当于用Scala编写操作 MapReduce、Spark(Spark core(RDD))，它是一种操作计算框架的API，它把HQL翻译成MapReduce (如下图所示，它是执行一个 select count(1) from helloworld )

用以下三个HQL创建一个表，数据来自 helloworld.txt

create database test_db;
create table helloworld(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; 
load data local inpath '/root/data/helloworld.txt' overwrite into table helloworld;

可以看到实质就是把 helloworld.txt存入 /user/hive/warehouse/test_db.db/helloworld 里面，而且并不会改变原有的文件，只是会存储文件相应的元数据(metadata)

Impala是基于Hive的大数据实时分析查询引擎，直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析

猜你喜欢

转载自blog.csdn.net/q503385724/article/details/88135145

大数据生态圈的理解

大数据生态圈

大数据技术生态圈讲解

大数据生态圈及重要组件

大数据生态圈简单介绍

Hadoop生态圈——大数据

大数据生态圈相关总结

大数据Hadoop生态圈：Pig

大数据核心——Hadoop生态圈

大数据Hadoop生态圈介绍

大数据生态家族重要产物：HBase 生态圈

大数据Spark生态圈，进击Spark生态圈必备，迈向“高薪”的基石

学习Scala 进击大数据Spark生态圈

HBase 在大数据生态圈中的位置

Scala 学习进击大数据Spark生态圈

大数据生态圈所涉及的技术

(视频)Scala 学习进击大数据Spark生态圈

大数据生态圈中相关原理（1）

【转载】学习Scala 进击大数据Spark生态圈

大数据生态圈中压缩的使用

初学者看大数据生态圈

20190223 Hadoop生态圈，关于大数据

基于ambari搭建hadoop生态圈大数据组件

大数据生态圈辅助工具（汇总）

5.大数据生态圈成员和原理

大数据SRE-生态圈组件介绍

大数据基石Hadoop生态圈-组件介绍

大数据Hadoop生态圈各个组件介绍（详情）

大数据Hadoop生态圈-组件介绍

大数据学习笔记——hadoop生态圈

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)