Hive（一）—— 启动与基本使用 - 代码天地

Hive（一）—— 启动与基本使用

其他 2019-12-04 21:50:48 阅读次数: 0

基本概念

Hive用于解决海量结构化日志的数据统计问题。

Hive是基于Hadoop的一个数据仓库工具。本质是将HQL（Hive的查询语言）转化成MapReduce程序。

HIve处理的数据存储在HDFS
HIve分析数据底层的默认实现是MapReduce
执行程序运行在Yarn上

Hive的优缺点

优点：

可以快速进行数据分析，不需要写MapReduce程序。
MapReduce适合处理大数据，不适合处理小数据

缺点：

HQL表达能力有限，迭代式算法不能表达，粒度较粗，调优比较困难。

自定义函数类别：

UDF
UDAF
UDTF

架构原理

执行顺序：解析器-编译器-优化器-执行器

Hive与数据库对比

HIve相比数据库，读多写少，没有索引，需要暴力扫描所有数据，即使引入了MapReduce机制，也不适合实时查询，扩展性和Hadoop的是一致的，扩展性强。

参考文档

Hive Getting Started

猜你喜欢

转载自www.cnblogs.com/fonxian/p/11985741.html

Hive（一）—— 启动与基本使用

hive的基本使用（一）

Flume（一） —— 启动与基本使用

Flink（一） —— 启动与基本使用

Hive系列(一)Hive基本概念

Hive的基本使用（一）—— 数据类型

hive sql的使用(一)

Hive启动异常解决(一)

Hive安装与基本操作(一)

Hive（一）基本概念

一、hive基本原理和使用

Hive(2)-Hive的安装,使用Mysql替换derby,以及一丢丢基本的HQL

Hive基础一 -----Hive的基本架构---Hive和传统数据库的比较

Hive基本语法使用

hive 基本使用

Hive的基本使用

hive学习--基本使用

Hive基本使用

Hive 基本语法操练（一）：表操作

hive一些基本用法

Hive的基本原理（一）

Hive的一些基本概念

Hive学习(一)【基本概念、安装】

大数据之Hive（一）：Hive基本概念、架构、Hive 与 Hadoop 的关系、Hive 与传统数据库对比、Hive 数据模型、Hive 安装部署

Oracle一点基本使用:安装启动和卸载

Hive 的一些使用 important

Hive：02-hive安装与基本使用

Hive基础03、Hive基本库使用

Hive的基本使用（处理数据）

hive安装和基本使用

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)