Hive3.1.0入门:从一条建表语句掌握三种复合数据类型使用

一、概述


    之前有篇文章:Hive实战:详解Hive复合数据类型,讲解了Hive三种复合数据类型使用,之前例子中一张表只有一种复合数据类型,这篇文章我们主要演示下,多余单张表存在多种复合数据类型的情况,如何编写对应的HQL建表语句。


二、实例演示


    1.假设我们有一些学生信息数据,字段分别有姓名name String类型、爱好interests  array类型、课程和分数course  map类型、info 手机号和年龄  struct类型,下面我们直接看数据文件student1.txt:

lujisen1,basketball|football,yuwen:80|shuxue:81,18668984418|20lujisen1,basketball|volleyball,yuwen:90|shuxue:91,18668984417|21


2.这张表含有array、map、struct三种符合数据类型,如何进行建表对数据进行分割呢?创建表语句如下:

create table studetn1(name string,interests array<string>,course map<string,double>,info struct<phone:string,age:int>)row  format delimited fields terminated by ','collection items terminated by '|'map keys terminated by ':'lines  terminated by '\n';

    

下面来分析下这个建表语句:


   1).row  format delimited 这个是行格式化限制,下面就指定行里面的字段如何分隔;


   2)fields terminated by ',':指定每个字段的用逗号分隔;


   3).collection items terminated by '|'  复合数据类型map、array的分隔符 ,内部元素都用“|”分隔;


  4).map keys terminated by ':'  这里是map专属的设置 指定map中key/value分隔符是":"


    5).lines  terminated by '\n'   这里就比较好理解了 指定每行的分隔符


3.下面我就实际操作一下,用上面的语句建表student1,截个图:


图片


 4.加载数据:

load data local inpath '/root/student1.txt' into table student1;


5.查询下数据表,验证数据加载成功:

图片


     可能还有其他复杂数据类型,原理跟这个基本一致。


猜你喜欢

转载自blog.51cto.com/15080019/2653912