Hive入门 ------ Hive是什么，产生背景 - 代码天地

Hive入门 ------ Hive是什么，产生背景

其他 2018-11-13 09:40:54 阅读次数: 0

版权声明：个人原创，转载请标注！ https://blog.csdn.net/Z_Date/article/details/83929027

一、hive产生背景

Apache Hive数据仓库软件可以使用SQL方便地阅读、编写和管理分布在分布式存储中的大型数据集。结构可以投射到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。

由Facebook开源，最初用于解决海量结构化的日志数据统计问题

MapReduce编程的不便性
HDFS上的文件缺少Schema（字段名，字段类型等）

二、Hive是什么

构建在Hadoop之上的数据仓库
Hive定义了一种类SQL查询语言：HQL（类似SQL但不完全相同）
通常用于进行离线数据处理（采用MapReduce）
底层支持多种不同的执行引擎（Hive on MapReduce、Hive on Tez、Hive on Spark）
支持多种不同的压缩格式、存储格式以及自定义函数（压缩：GZIP、LZO、Snappy、BZIP2.. ；存储：TextFile、SequenceFile、RCFile、ORC、Parquet ； UDF：自定义函数）

到底什么是Hive，我们先看看Hive官网Wiki是如何介绍Hive的(https://cwiki.apache.org/confluence/display/Hive/Home)：

Apache HiveApache Hive™ 数据仓库软件为分布式存储的大数据集上的读、写、管理提供很大方便，同时还可以用SQL语法在大数据集上查询。

1、是一种易于对数据实现提取、转换、加载的工具(ETL)的工具。可以理解为数据清洗分析展现。2、它有一种将大量格式化数据强加上结构的机制。3、它可以分析处理直接存储在hdfs中的数据或者是别的数据存储系统中的数据，如hbase。4、查询的执行经由mapreduce完成。5、hive可以使用存储过程6、通过Apache YARN和Apache Slider实现亚秒级的查询检索。

（Slider简介https://blog.csdn.net/jiewuyou/article/details/42614073）

猜你喜欢

转载自blog.csdn.net/Z_Date/article/details/83929027

Hive入门 ------ Hive是什么，产生背景

入门Hadoop---Hive是什么？

【Hive一】Hive入门

hive入门

Hive 入门

HIVE的定义，HIVE是什么？

Hive的UDF是什么？

Hive是什么

Hive 是什么

【HIve】Hive入门解析（九）

Hive（一）之Hive入门

什么是Hive?Hive的常用配置？hive的运行原理是什么？

hive 元数据是什么

Hive入门介绍

hive 入门介绍

Hive使用入门

hive udaf入门

Hive从入门到精通

HIVE从路人到入门

Hive的入门安装

Hive 入门及环境搭建

Apache Hive 入门

Hive入门及常用指令

Hive入门简介

Hive 快速入门(全面)

hive入门一

hive入门五

hive入门三

Hive入门之WordCount

Hive入门详解（一）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)