大数据--------关于Hive Union使用说明

我在使用Hive SQL时,用关系型数据库SQL的语法写的Hive SQL.当进行多表union的时候,对数据进行去重,我用了如下SQL:

select bacc,lst_int_prvs_dt,lst_txn_mf_sn 
from test1
union 
select bacc,lst_int_prvs_dt,lst_txn_mf_sn 
from test2;

在运行的时候,错误信息为: 

Error: Error while compiling statement: FAILED: ParseException line 4:0 missing ALL at 'select' near '<EOF>' (state=42000,code=40000)

提示少了ALL,查询了hive官网关于union的用法说明,发现hive1.2.0之前的版本只支持union all,在1.2.0之后的版本才支持union,然后我看了一下我的版本是1.1.0

我的hive版本信息为:

Connected to: Apache Hive (version 1.1.0)
Driver: Hive JDBC (version 1.1.0)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Beeline version 1.1.0 by Apache Hive

解决办法:只能使用union all,然后再在外边套一层select distinct自己手动实现去重即可解决。

select distinct bacc,lst_int_prvs_dt,lst_txn_mf_sn
from (
select bacc,lst_int_prvs_dt,lst_txn_mf_sn 
from test1
union 
select bacc,lst_int_prvs_dt,lst_txn_mf_sn 
from test2);

猜你喜欢

转载自blog.csdn.net/hexinghua0126/article/details/87095690