第一点：导入txt文件到hive

参考网址： http://blog.csdn.net/wisgood/article/details/40560799

hive操作参考网址： http://blog.csdn.net/fengshi_fengshi/article/details/51395198

模板代码：

create database if not exists dw_fltdb;
use dw_fltdb;
drop table if exists dw_fltdb.factfltsegordersnap2015_08;
create table if not exists dw_fltdb.factfltsegordersnap2015_08 (
	orderid bigint,
	sequence int,
	flightno string
	-- 注意是上面一行string后面一定不能跟","
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS TEXTFILE;
-- 加local是从主机文件系统导入到hive;不加local是从hdfs导入到hive
load data local inpath '/home/hadoop/dw_flatdb/dw_fltdb.factfltsegordersnap2015-08.txt' into table dw_fltdb.factfltsegordersnap2015_08;

第二点: hive的数据类型

基础类型：

数据类型	所占字节	开始支持版本
TINYINT	1byte，-128 ~ 127
SMALLINT	2byte，-32,768 ~ 32,767
INT	4byte,-2,147,483,648 ~ 2,147,483,647
BIGINT	8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
BOOLEAN
FLOAT	4byte单精度
DOUBLE	8byte双精度
STRING
BINARY		从Hive0.8.0开始支持
TIMESTAMP		从Hive0.8.0开始支持
DECIMAL		从Hive0.11.0开始支持
CHAR		从Hive0.13.0开始支持
VARCHAR		从Hive0.12.0开始支持
DATE		从Hive0.12.0开始支持

复杂类型：

ARRAY：ARRAY类型是由一系列相同数据类型的元素组成，这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits，它是由['apple','orange','mango']组成，那么我们可以通过fruits[1]来访问元素orange，因为ARRAY类型的下标是从0开始的；
MAP：MAP包含key->value键值对，可以通过key来访问元素。比如”userlist”是一个map类型，其中username是key，password是value；那么我们可以通过userlist['username']来得到这个用户对应的password；
STRUCT：STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素，比如user是一个STRUCT类型，那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE，他是从Hive 0.7.0开始支持的。

CREATE TABLE employees (  
    name STRING,  
    salary FLOAT,  
    subordinates ARRAY<STRING>,  
    deductions MAP<STRING, FLOAT>,  
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
) PARTITIONED BY (country STRING, state STRING);

hive相关语法与操作

第一点：导入txt文件到hive

第二点: hive的数据类型

基础类型：

复杂类型：

猜你喜欢