认识Hive-数据的导入导出 - 代码天地

认识Hive-数据的导入导出

其他 2019-01-12 09:30:52 阅读次数: 0

版权声明：路漫漫其修远兮，吾将上下而求索。 https://blog.csdn.net/Happy_Sunshine_Boy/article/details/85338851

什么是Hive

把SQL语句转换成map-reduce任务，并完成数据封装【解释器、编译器、优化器】Hive是大数据生态系统中的数据仓库。

Hive架构

Hive就是大数据中的数据仓库，擅长处理格式良好的结构化数据。对非结构化并不适合；
Hive能够把结构良好的数据文件映射成一张关系数据库的表，并提供类似SQL（HQL）的查询功能；
Hive会把SQL语句转换成MapReduce任务运行；
提供ETL的工具；
Hive运行时，元数据存储在关系型数据库中。

优缺点

成本低，入手快
不需要学习MapReduce开发
不支持实时查询

Hive vs RDBMS

比较项	SQL	HiveQL
ANSI SQL	支持	不完全支持
更新	UPDATE\INSTERT\DELETE	insert OVERWRITE\INTO TABLE
事物	支持	不支持
模式	写模式	读模式
数据保存	块设备，本地文件系统	HDFS
延时	低	高
多表插入	不支持	支持
子查询	完全支持	只能用在Form子句中
视图	Updatable	Read-only
可扩展性	低	高
数据规模	小	大
……	……	……

数据类型

原子数据类型（常规数据类型）
复杂数据类型
- ARRAY
- MAP
- STRUCT

表

托管表（managed table）（内部表）
外部表

简单示例

登录Hive

su hdfs
hive

在这里插入图片描述

查看数据库

show databases;

在这里插入图片描述

创建数据库

create database if not exists databasename;

在这里插入图片描述

数据导入

root用户在/home/hdfs/tgm/目录下创建user.txt文件

cat user.txt
1,abc,25,13188888888888
2,test,30,13888888888888
3,adsfsadf,34,899314121

在这里插入图片描述

在hive中创建数据表

create table tgm_test
(id int, 
name string,
age string,
tel string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

在这里插入图片描述

从本地文件加载

load data local inpath '/home/hdfs/tgm/user.txt' into table tgm_test;

在这里插入图片描述

从HDFS中文件加载

load data inpath 'user.txt' into table tgm_test;

从Hive中另一个表中加载

create table tgm_test2
(id int,
name string,
tel string)
partitioned by (age int)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

在这里插入图片描述

insert into table tgm_test2
partition (age='25')
select id, name, tel
from tgm_test;

在这里插入图片描述

数据导出

导出到本地

insert overwrite local directory '/tmp/test'
select * from tgm_test;

导出到HDFS

insert overwrite directory '/tmp/test'
select * from tgm_test;

导出时指定分隔符

insert overwrite local  directory '/tmp/test'
row format delimited
fields terminated by ','
select * from tgm_test;

猜你喜欢

转载自blog.csdn.net/Happy_Sunshine_Boy/article/details/85338851

认识Hive-数据的导入导出

五, Hive-数据的导入和导出

Hive-导入数据

Hive-表数据的导出、导入（HDFS、本地）

Hive数据导入导出

hive数据的导入导出

hive Hive数据导入导出

hive 的数据导入和导出

hive数据的导入导出方式

Hive表导入、导出数据

Hive DML(数据导入导出)

Hive数据导出导入操作

Hive数据导入和导出

【HIVE】（四）数据导入/导出

hive的数据导出和导入

【Hive】（三）Hive数据导入，导出，分区

HIVE-元数据存储

Hive-数据类型

Hive-数据仓库

[Hadoop大数据]——Hive数据的导入导出

Hive教程之DML数据导入导出

sqoop从hive、hdfs导入导出数据（mysql）

hive 的导入导出数据的命令汇总

从Oracle导出数据并导入到Hive

Hive中数据的导入与导出的几种方式

Hive文件格式及数据导入导出

hive的数据导入导出，备份恢复

Hive 数据导入导出方式小结

hive-数据倾斜解决详解

hive-数据库操作

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)