走近大数据之Hive进阶(二、Hive的数据查询)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011712163/article/details/89429618

目录

一、简单查询和fetch task

二、在查询中使用过滤

三、在查询中使用排序


一、简单查询和fetch task

1、Hive查询的基本语法

语法跟sql语法基本相似

SELECT * FROM user 与 SELECT name, gender FROM user的区别?

SELECT *全表扫描不会开启MapReduce作业,SELECT name, gender 会开启MapReduce作业查询想要的数据。(下面会介绍怎样不开启MapReduce作业)

nvl(A,B)函数:当A为空时取B

2、简单查询的Fetch Task功能

前面两种只能在本次连接中生效,要永久生效需要修改配置文件,修改如下图

二、在查询中使用过滤

1、where条件语法跟sql类似,如果需要查询含下划线_的记录,需要转义字符

2、使用explain查询sql的执行计划,阅读顺序:从下往上,从右往左

三、在查询中使用排序

1、order by语句进行排序:排序属于高级操作,一定开启mapreduce作业(及前面的Fetch Task功能设置对order by是无效的)

2、order by 后面可以跟: 列名, 列的表达式, 列的别名, 序号

设置排序编号:set hive.groupby.orderby.position.alias=true //默认为false

猜你喜欢

转载自blog.csdn.net/u011712163/article/details/89429618
今日推荐