大数据学习(08)--Hadoop中的数据仓库Hive

目录

1.什么是数据仓库?

1.1数据仓库概念

在这里插入图片描述

对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。

1.2传统数据仓库面临的挑战

在这里插入图片描述

1.3 Hive介绍

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Hbase支持快速的交互式的大数据应用
pig,Hive支持批量式的数据分析业务

1.4 Hive与传统数据库的对比

在这里插入图片描述

1.5 Hive在企业中的部署与应用

在这里插入图片描述

2.Hive系统架构

在这里插入图片描述

Microsoft推出的ODBC(Open Database Connectivity)技术 [1] 为异质数据库的访问提供了统一的接口
JDBC(Java Data Base Connectivity,java数据库连接)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。
CIL (Common Intermediate Language) 公共中间语言

3.Hive工作原理

3.1 SQL转换为MapReduce作业的基本原理

在这里插入图片描述
在这里插入图片描述

3.2 Hive中SQL查询转换MapReduce作业的过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.Hive HA基本原理

在这里插入图片描述

5.Impala

5.1 Impala介绍

在这里插入图片描述

5.2 Impala系统架构

在这里插入图片描述
在这里插入图片描述

5.3 Impala查询执行过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.4 Impala和Hive的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.Hive编程实践

参考博客

6.1 Hive的安装和配置

在这里插入图片描述

6.2 Hive的基本数据类型

在这里插入图片描述
在这里插入图片描述

6.3 Hive的基本操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.4 Hive的应用实例(wordCount)

在这里插入图片描述在这里插入图片描述

6.5 Hive的优势

在这里插入图片描述

7.总结

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/wangzi11111111/article/details/89096936