大数据-Hive

其他 2019-04-10 21:40:57 阅读次数: 0

Hive

简介

Apache Hive是一个数据仓库软件在Hadoop中处理结构化数据，有助于使用SQL读取，编写和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。提供了命令行工具和JDBC驱动程序以将用户连接到Hive

特点

优点

（1）操作接口采用类SQL语法，简单、快速

（2）可以替代MapReduce程序，sqoop

（3）可以处理海量数据

（4）支持UDF，自定义函数

缺点

（1）处理数据延迟高，慢

（2）HQL的表达能力有限

架构图

在这里插入图片描述

（1）用户通过客户端的CLI和JDBC来操作Hive

（2）Hive将元数据存储在数据库中，如mysql、derby

（3）SQL解析器、编译器、query优化器和execution执行器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成

（4）生成的查询结果存储在HDFS中

（5）调用底层MapReduce进行查询和计算

猜你喜欢

转载自blog.csdn.net/JavaDestiny/article/details/89161904

大数据（Hive）-原理

大数据（Hive）-安装

【大数据】HIVE配置

大数据 Hive

Hive大数据倾斜

大数据----hive

大数据Hive汇总

大数据-Hive的安装

大数据-Hive

大数据--hive查询

大数据利器Hive

大数据篇：Hive

大数据时代的技术hive：hive介绍

大数据Hive系列之Hive MapReduce

大数据Hive系列之Hive API

大数据技术之Hive(Hive搭建)

漫谈大数据 - Spark on Hive & Hive on Spark

大数据之hive与impala

Hive 大数据倾斜总结

大数据学习之hive

hive hadoop 大数据初探

大数据系列hive——jdbc

大数据系列hive——安装

大数据学习——hive函数

大数据学习——hive使用

大数据——Hive（基础操作）

大数据——Hive（理论篇）

大数据开发——Hive笔记

大数据技术之Hive

大数据-hive理论(1)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)