Directorio de artículos
prefacio
Introducción a los métodos de carga de datos de Hive (insertar, cargar)
Método 1: cargar datos
Sintaxis básica:
load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student[partition ]
Descripción del parámetro:
1 cargar datos: indica cargar datos
2 local: indica cargar datos desde local a la tabla de colmena; de lo contrario, carga datos de HDFS a la tabla de colmena
3 ruta de entrada: indica la ruta de carga de datos
Ruta relativa, por ejemplo: proyecto/datos1
Absoluto ruta, por ejemplo:/user/hive/project/data1
contiene el URI completo del esquema, como por ejemplo: hdfs://namenode:9000/user/hive/project/data1
4 sobrescribir: significa sobrescribir los datos existentes en la tabla , de lo contrario significa agregar. El contenido de la tabla (o partición) de destino se eliminará y luego el contenido del archivo/directorio señalado por la ruta del archivo se agregará a la tabla/partición. 5 en la tabla: indica qué tabla cargar 6 estudiante:
indica
el partición específica de la tabla
7: significa cargar en la partición especificada
-- 加载本地文件
load data local inpath '/home/hadoop/load1.txt' into table tb_load1;
-- 加载HDFS文件
load data inpath '/hive/test/load2.txt' into table tb_load1;
-- 加载分区数据
load data inpath '/hive/test/load_part_male.txt' into table tb_load2
partition (sex='male');
--使用overwrite:会覆盖之前的数据
load data local inpath '/home/hadoop/load3.txt' overwrite into table tb_load1;
Método 2: insertar insertar
1. reloj ordinario
-- 覆盖
insert overwrite table tb_insert1 select id,name from tb_select1;
-- 追加
insert into table tb_insert1 select id,name from tb_select1;
2.Tabla de particiones
-- 分区插入
insert overwrite table tb_insert_part partition(sex = 'male')
select id,name from tb_select1 where sex='male';
-- 动态分区插入(需先设置非严格模式)
set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table tb_dy_part partition(sex)
select id,name,sex from tb_select1;
Método 3: como seleccionar
注意
: Los datos solo se pueden cargar en modo como. Si hay otros campos de partición, los campos de partición solo se conservan en forma de campo.
create table tb_create_mode as
select id,name from tb_select1;
Salida de datos
(1) Exportar a local
insert overwrite local directory '/home/hadoop/'
select id,name from tb_select1;
ejemplo :
INSERT overwrite directory "/user/yuanpengfei/ypf/lifeng/vehPOI" ROW format delimited fields terminated BY ","
select substr( md5(concat('mb',field_2,'xx')),9,6), field_3, field_4, field_5, field_6, field_7
from default.longchuan_od_temp
Resumir
Si este artículo te resulta útil, espero que los grandes puedan
关注
apoyarme . ¡Muchas gracias ! ¡¡¡Corrígeme si hay algún problema!!!点赞
收藏
评论