Hive入门简介 - 代码天地

Hive入门简介

其他 2018-07-01 05:09:51 阅读次数: 0

简介

hive [haiv]

Hive 是一个基于 Hadoop 文件系统之上的数据仓库架构。

1.为数据仓库的管理提供功能：

数据 ETL （抽取、转换和加载）工具
数据存储管理
大型数据集的查询和分析能力

2.定义了类 SQL的语言 —— Hive QL，可以将结构化的数据文件映射为一张数据库表

3.方便使用 Mapper 和 Reducer 操作，可以将 SQL 语句转换为 MapReduce 任务运行

Hive 与关系数据库的区别

1.使用的文件系统：

Hive： Hadoop 的HDFS（Hadoop的分布式文件系统）
关系数据库：服务器本地的文件系统

2.计算模型：

Hive： MapReduce
关系数据库：自己设计的计算模型

3.实时性：

Hive：为数据挖掘设计，实时性很差
关系数据库：为实时查询业务设计，实时性强

4.扩展能力：

Hive：易扩展存储能力、计算能力
关系数据库：扩展性差

使用场景

Hive 并非为联机事务处理而设计，Hive 并不提供实时的查询和基于行级的数据更新操作。
Hive 的最佳使用场合是大数据集的批处理作业，例如，网络日志分析。

数据存储

Hive 本身没有专门的数据存储格式，不能为数据建立索引
只需要在创建表时，告诉 Hive 数据中的列分隔符就可以解析数据了

Hive 中主要包括 4 种数据模型：

表（Table）
外部表（External Table）
分区（Partition）
桶（Bucket）

元数据存储

Hive 的元数据可能要面临不断地更新、修改和读取操作，不适合使用 Hadoop 文件系统进行存储
目前 Hive 把元数据存储在 RDBMS 中，比如存储在 MySQL, Derby 中

来源: 实验楼
链接: https://www.shiyanlou.com/courses/38

猜你喜欢

转载自blog.csdn.net/weixin_41471128/article/details/80174241

Hive入门简介

大数据组件——Hive简介及入门

HIVE简介

大数据入门（15）hive简介和配置

【Hive一】Hive入门

【大数据】Java同学入门Hive编程 —— 简介和入门操作

hive入门

Hive 入门

Hive (一) 简介

Hive(一)--简介

Hive简介及源码编译

Hive简介和WordCount

Hive - 简介和安装

Hive简介和架构

hive简介与架构

Hive简介及使用

Hive架构简介与安装

hive简介及安装

Hive0.13.0简介

hive---简介、启动

Hive简介(上)

hadoop(八)、hive简介

Hive--简介

Hive简介与搭建

Hive简介与配置安装

Hive简介与SQL操作

hive简介(一)

Hive简介及架构

【Hive】（一）简介

Hive基本简介

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)