1つまたは複数のフィールドのSQLステートメントに基づいて重複データを見つけるのMySQL

1.テーブルが2つのフィールドのIDと名前があり、名前はすべてのデータを複製するクエリ

 
1
select * from xi a where (a.username) in ( select username from xi group by username having count (*) > 1)

2すべてのデータパケットの後に、お問い合わせ、および重複データのクエリデータの繰り返し回数、最初の列:

 
1
select count (username) as '重复次数' ,username from xi group by username having count (*)>1 order by username desc

Daquanのをクエリし、重複レコードを削除します:3は、それが他の人の結果は、以下に記載されているを確認することです

図1に示すように、冗長なルックアップテーブルの重複レコード、重複レコードを決定するために、単一のフィールド(peopleid)に基づいています

 
1
2
select * from people
where peopleId in ( select peopleId from people group by peopleId having count (peopleId) > 1)

図2に示すように、テーブルが削除され、冗長重複レコード、重複レコードは、最小記録行IDを残し、(peopleidが)に応じて決定される単一のフィールドであります

 
1
2
3
delete from people
where peopleId in ( select peopleId from people group by peopleId having count (peopleId) > 1)
and rowid not in ( select min (rowid) from people group by peopleId having count (peopleId )>1)

3、余分なルックアップテーブルが繰り返し記録されている(複数のフィールド)

 
1
2
select * from vitae a
where (a.peopleId,a.seq) in ( select peopleId,seq from vitae group by peopleId,seq having count (*) > 1)

図4に示すように、テーブルは、最小記録行IDを残し、冗長重複(複数フィールド)削除されます

 
1
2
3
delete from vitae a
where (a.peopleId,a.seq) in ( select peopleId,seq from vitae group by peopleId,seq having count (*) > 1)
and rowid not in ( select min (rowid) from vitae group by peopleId,seq having count (*)>1)

5、ルックアップテーブルを繰り返し、余分な(複数のフィールド)を記録し、最小記録のROWIDが含まれていません

 
1
2
3
select * from vitae a
where (a.peopleId,a.seq) in ( select peopleId,seq from vitae group by peopleId,seq having count (*) > 1)
and rowid not in ( select min (rowid) from vitae group by peopleId,seq having count (*)>1)

(二)

例えば

フィールド「名前」は、表Aにあり

そして、異なるレコード間の「名前」の値が同じであってもよいし、

今、重複したエントリのテーブル、「名前」の値内の各レコードの間、必要です。

 
1
Select Name , Count (*) From A Group By Name Having Count (*) > 1

あなたは、同じサイズの性別を確認する場合は、次のように:

 
1
Select Name ,sex, Count (*) From A Group By Name ,sex Having Count (*) > 1

(三)

この方法の一つ

 
1
2
3
4
5
6
7
8
9
10
11
declare @ max integer ,@id integer
declare cur_rows cursor local for
select 主字段, count (*) from 表名 group by 主字段 having count (*) >;
open cur_rows fetch cur_rows into @id,@maxwhile @@fetch_status=0
begin
  select @ max = @ max -1
  set rowcount @ max
  delete from 表名 where 主字段 = @id
fetch cur_rows into @id,@maxend
close cur_rows
set rowcount 0

方法2二つの意味で重複するレコード「レコードを繰り返し」、1はすべてのフィールドが重複するレコードある他のフィールドではない一方で、第二は、そのような名前のフィールドの繰り返しのように重複したレコードのキー・フィールドの一部であることを、完全に重複するレコードでありますリピート、リピート特定無視できます。

  1、最初の繰り返しのため、比較的容易に使用して、解決するために

 
1
select distinct * from tableName

結果セットは、重複レコードなく得ることができます。  

テーブルの必要性が重複するレコードを削除する場合は、(レコードが重複を保持します)

次の方法を削除することができます

 
1
2
3
4
select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp

繰り返しの悪い生成されたテーブルのデザインがユニーク索引列を解くことができる高めることであるのため、これが発生します。

図2に示すように、そのようなオーバーラップの問題は、典型的には、重複フィールドは結果の2つだけのフィールドは名前、住所、要件を設定することとしたが、以下のように繰り返し記録動作の最初のレコードを保持するために必要

 
1
2
3
select identity( int ,1,1) as autoID, * into #Tmp from tableName
select min (autoID) as autoID into #Tmp2 from #Tmp group by Name ,autoID
select * from #Tmp where autoID in ( select autoID from #tmp2) 

最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写在select子句中省去此列)

(四)查询重复

1
select * from tablename where id in ( select id from tablenamegroup by idhaving count (id) > 1)

对一个字段查找重复记录

 

根据sample_code字段找到重复记录

 
1
SELECT * FROM tb_table WHERE sample_code IN ( SELECT sample_code FROM tb_table GROUP BY sample_code HAVING COUNT (sample_code) > 1 );

对多个字段查找重复记录(这里以2个为例)

 

根据name和code字段找到重复记录

 
1
2
3
4
SELECT * from ( SELECT *, CONCAT( name ,code) as nameAndCode from tb_table) t WHERE t.nameAndCode in
(
  SELECT nameAndCode from ( SELECT CONCAT( name ,code) as nameAndCode from tb_table) tt GROUP BY nameAndCode HAVING count (nameAndCode) > 1
)

おすすめ

転載: www.cnblogs.com/zhangzhiping35/p/12066930.html
おすすめ