distinct和group by 去掉重复数据分析


详见: http://blog.yemou.net/article/query/info/tytfjhfascvhzxcytp40

用distinct关键字只能过滤查询字段中所有记录相同的(记录集相同),而如果要指定一个字段却没有效果,另外distinct关键字会排序 。

select distinct id,name from t1 可以取多个字段,但只能消除这2个字段值全部相同的记录

例如要显示的字段为A、B、C三个,而A字段的内容不能重复可以用下面的语句:

having [条件] order by A desc

显示出来的字段和排序字段都要包括在group by 中

如上句的min(B),min(C),count(*)

有聚合函数的条件写在having 后面

如果在上句中having加 count(*)>2 就可以查出记录A的重复次数大于2的记录

下面语句可以查询出那些数据是重复的:

将上面的>号改为=号就可以查询出没有重复的数据了。

PS:关于group by和distinct到底哪个性能好,我还是不敢太赞同网上的一些说法,自己测试才是王道。
未完,待续。。。

猜你喜欢

转载自grefr.iteye.com/blog/1908353
今日推荐