大数据系列（四）数据仓库hive的使用

编程语言 2019-05-09 03:02:18 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zl592886931/article/details/89789518

目录

Hive的介绍

Hive的产生背景
Hive概述

Hive架构

Hive的体系架构
Hive的部署架构

Hive与RDBMS数据库的区别
Hive的部署搭建
Hive DDL
Hive DML

Hive的介绍

Hive的产生背景

根据博主前面对于MapReduce的讲解，可以回想一下，我们做一个再简单不过的wordcount（我们都可以用java的计算函数几行代码搞定），需要以下步骤：

建立mapper => 建立reduce => 建立driver => 运行

试想一下，如果不懂java，是不是和大数据say goodbye了。再想一下，改个需求，是不是代码要做到哭？
这种统计，我放在sql数据库里一个group by全部搞定。传统关系型数据库发展了一个宇宙纪元，谁不会sql？谁会大数据？

所以在这样比较冲突的环境下，Hive诞生啦。它可以让你使用sql的方式来运行MR。这有多酸爽？想想就舒服了

Hive概述

首先来看下Hive的爸爸是谁：

Hive是由Facebook开源的，用于解决海量结构化日志统计问题的框架。

Hive是构建在hadoop之上的数据仓库，Hive的数据存储在hdfs（关系类似于关系型数据库中数据和视图，Hive是视图），并且Hive提供了SQL的查询语言：HQL，因为底层引擎是MR，So，对于其他大数据计算框架比如spark等的支持，简直狼狈为奸～

那么问题来了，都有那么多的框架了，我凭什么用Hive？说的对，那我们用spark吧？云计算上面全部都有了，我为什么要自己搭建？干脆买云吧。那开源那么多产品，我为什么还要做程序，不然做一个PPT方案架构师吧？所以，小伙伴们，路如何选择只有靠自己的坚持，既然我们选择了程序员，那么对于技术应该有所追求抑或是偏执。哪怕将来做了管理，做了业务，技术始终是我们的根本。我坚信，将来核心竞争力一定是研发！！！

Hive架构

Hive的体系架构

Hive的部署架构

Hive与RDBMS数据库的区别

Hive的部署搭建

Hive DDL

Hive DML

猜你喜欢

转载自blog.csdn.net/zl592886931/article/details/89789518

大数据系列（四）数据仓库hive的使用

大数据系列（四）数据仓库hive后续之对日志文件的统计

大数据系列4：Hive – 基于HADOOP的数据仓库

大数据系列之数据仓库Hive知识整理（四）Hive的严格模式，动态分区，排序，事务，调优

大数据 Hive数据仓库

大数据06 数据仓库 Hive

大数据——Hive(数据仓库工具)

大数据 Hive 数据仓库介绍

大数据仓库hive初识简介

【Hive】基于hadoop的大数据仓库

Hive 数据仓库

Hive数据仓库

HIVE—数据仓库

Hive --数据仓库

什么是Hive——大数据仓库Hive基础

数据仓库Hive的安装和使用

大数据系列之数据仓库Hive知识整理（二）Hive基本操作，使用API通过JDBC连接访问

大数据数据仓库——hive学习权威指南

大数据学习（08）--Hadoop中的数据仓库Hive

大数据学习之Hive数据仓库 20

大数据技术之数据仓库工具Hive查询

大数据技术之数据仓库工具Hive安装

大数据技术之数据仓库工具Hive函数

大数据学习笔记(六)_Hive数据仓库

大数据之Hadoop数据仓库Hive

大数据离线阶段05：数据仓库，Hive

大数据系列之数据仓库Hive知识整理（一）Hive简介，架构与工作流程，环境搭建

大数据系列之数据仓库Hive知识整理（五）Hive的中函数，用户自定义函数（UDF）

数据仓库四

第二节：大数据仓库HIVE《02》

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)