hive去重统计

版权声明:最终解释权归汐银所有,转贴请私聊 https://blog.csdn.net/qq_39562468/article/details/83996439

hive去重多行数据并统计

这个是练习数据部分截图,可以看出有部分重复数据

OK我们先进入hive

然后创建库uid

create database uid;

然后创建表uid_id

create table uid_id(uid_id int);

然后去重

select distinct uid_id from uid;

最后完成会弹一个提示里面有表的数据量就是出重后剩余的数量

猜你喜欢

转载自blog.csdn.net/qq_39562468/article/details/83996439