Métodos de carga de datos de Hive (cargar, insertar; tabla ordinaria, tabla de particiones)

prefacio

Introducción a los métodos de carga de datos de Hive (insertar, cargar)


Método 1: cargar datos

Sintaxis básica:
load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student[partition ]

Descripción del parámetro:
1 cargar datos: indica cargar datos
2 local: indica cargar datos desde local a la tabla de colmena; de lo contrario, carga datos de HDFS a la tabla de colmena
3 ruta de entrada: indica la ruta de carga de datos
Ruta relativa, por ejemplo: proyecto/datos1
Absoluto ruta, por ejemplo:/user/hive/project/data1
contiene el URI completo del esquema, como por ejemplo: hdfs://namenode:9000/user/hive/project/data1
4 sobrescribir: significa sobrescribir los datos existentes en la tabla , de lo contrario significa agregar. El contenido de la tabla (o partición) de destino se eliminará y luego el contenido del archivo/directorio señalado por la ruta del archivo se agregará a la tabla/partición. 5 en la tabla: indica qué tabla cargar 6 estudiante:
indica
el partición específica de la tabla
7: significa cargar en la partición especificada

-- 加载本地文件
load data local inpath '/home/hadoop/load1.txt' into table tb_load1;

-- 加载HDFS文件
load data inpath '/hive/test/load2.txt' into table tb_load1;

-- 加载分区数据
load data inpath '/hive/test/load_part_male.txt' into table tb_load2 
partition (sex='male');

--使用overwrite:会覆盖之前的数据
load data local inpath '/home/hadoop/load3.txt' overwrite into table tb_load1;

Método 2: insertar insertar

1. reloj ordinario

-- 覆盖 
insert overwrite table tb_insert1 select id,name from tb_select1;
-- 追加
insert into table tb_insert1 select id,name from tb_select1;

2.Tabla de particiones

-- 分区插入
insert overwrite table tb_insert_part partition(sex = 'male')
select id,name from tb_select1 where sex='male';

-- 动态分区插入(需先设置非严格模式)
set hive.exec.dynamic.partition.mode=nonstrict;

insert overwrite table tb_dy_part partition(sex) 
select id,name,sex from tb_select1;

Método 3: como seleccionar

注意: Los datos solo se pueden cargar en modo como. Si hay otros campos de partición, los campos de partición solo se conservan en forma de campo.

create table tb_create_mode as 
select id,name from tb_select1;

Salida de datos

(1) Exportar a local

insert overwrite local directory '/home/hadoop/'
select id,name from tb_select1;

ejemplo :

INSERT overwrite directory "/user/yuanpengfei/ypf/lifeng/vehPOI" ROW format delimited fields terminated BY "," 
select substr( md5(concat('mb',field_2,'xx')),9,6), field_3, field_4, field_5, field_6, field_7
from default.longchuan_od_temp

Resumir

Si este artículo te resulta útil, espero que los grandes puedan 关注apoyarme . ¡Muchas gracias ! ¡¡¡Corrígeme si hay algún problema!!!点赞收藏评论

Referencia 1
Referencia 2

Supongo que te gusta

Origin blog.csdn.net/weixin_42326851/article/details/132214145
Recomendado
Clasificación