三分钟入门hive的7个概念 - 代码天地

三分钟入门hive的7个概念

其他 2020-03-06 10:28:02 阅读次数: 0

1. hive是由Facebook实现并开源的

解决mapreduce编写复杂和学习程度高的问题。

2. hive是hadoop的数据仓库工具

hive是将存储在HDFS上的结构化数据映射为一张二维表格，编写sql语句来统计分析。

结构化数据：csv、tsv
半结构化数据：图片格式、音频格式、视频格式
非结构化数据：html、xml

用一张图来解释：
把存储在HDFS上的结构化数据，通过Hive的sql语句创建数据库表映射为一张二维表格，然后可以写sql语句进行查询分析。
在这里插入图片描述

3. hive存储的数据其实底层是存储在HDFS上

hive本身不存储数据，数据都是存储在HDFS上。

4.hive将HDFS上存储的结构化数据映射成一张二维库表/二维结构

为什么hive提供的是sql的select语法？
因为mysql的表就是一种二维结构，然后我们可以使用sql来操作
针对结构化的数据，其实都可以使用sql的查询分析语句select来进行表达

5.hive提供HQL（hive query language）查询功能

语法和SQL语法有区别，但是大致一样。

6.hive的本质是将sql语句转化为mapreduce任务运行，使不熟悉mapreduce的用户能够通过HQL处理和计算HDFS上存储的结构化数据

hive的目的是为了减轻mapreduce的编码复杂问题，但是不是用来提升mapreduce运行效率低下的问题。

hive—》mapreduce 减轻编码压力
spark—》mapreduce提升执行效率

用hive写语句，用来转换成mapreduce或者spark程序
spark和mapreduce是同种类型的东西，都是分布式并行计算框架

用一张图来解释：
客户端可以看作是我们常用的CRT，通过CRT客户端编写hive，将sql语句转化成mapreduce程序，处理和计算HDFS上存储的结构化数据，YARN集群调度资源执行mapreduce任务计算，最后将结果呈现返回给CRT客户端。
在这里插入图片描述

7.hive使用户可以极大地简化分布式计算程序的编写，将经历集中于业务逻辑

MicoOu

发布了56 篇原创文章 · 获赞 34 · 访问量 3669

私信关注

猜你喜欢

转载自blog.csdn.net/MicoOu/article/details/103350869

三分钟入门hive的7个概念

Cython三分钟入门

三分钟入门 jmeter

三分钟入门 Python

三分钟带你入门GitHub

[Java]三分钟入门多线程

三分钟入门强化学习

三分钟入门Go语言

三分钟快速入门mpvue

三分钟热度

三分钟带你解析Hive中的json字符串（详细！）

三分钟创建一个小程序-每天三分钟玩转小程序 1

三分钟入门电力系统之----------三道防线

三分钟入门量化（三）：计算收益率

三分钟带你快速了解 FineReport 7月更新亮点！

TensorFlow 三分钟入门到精通，你可以试试谷歌的AIY！

三分钟入门VyOS网络操作系统

swift高速入门，三分钟上手

三分钟带你入门 redis 高可用架构之哨兵

【NodeJS笔记】三分钟快速入门NodeJS

三分钟上手Markdown——基本语法快速入门

三分钟带入门了解openstack的horizon项目

三分钟带你入门了解openstack的swift项目

三分钟带你入门了解openstack的Nova项目

Java语言基础-三分钟入门String

三分钟带你入门了解openstack的cinder项目

三分钟带你入门了解openstack的glance项目

三分钟带你入门了解openstack的keystone项目

三分钟快速入门eclipse，不看白不看哈。

Jmeter的简单使用（一篇三分钟入门的压测分析）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)