版权声明:最终解释权归汐银所有,转贴请私聊 https://blog.csdn.net/qq_39562468/article/details/83996439
hive去重多行数据并统计
这个是练习数据部分截图,可以看出有部分重复数据
OK我们先进入hive
然后创建库uid
create database uid;
然后创建表uid_id
create table uid_id(uid_id int);
然后去重
select distinct uid_id from uid;
最后完成会弹一个提示里面有表的数据量就是出重后剩余的数量