sqlserver删除表中的重复数据

笔记：

首先创建表：
create table Student(
ID varchar(10) not null,
Name varchar(10) not null,
);

insert into Student values(‘1’, ‘zhangs’);
insert into Student values(‘2’, ‘zhangs’);
insert into Student values(‘3’, ‘lisi’);
insert into Student values(‘4’, ‘lisi’);
insert into Student values(‘5’, ‘wangwu’);
在这里插入图片描述
模拟数据库中的重复书数据

1、查询表中Name 重复的数据

select Name from Student group by  Name having count(Name) > 1

在这里插入图片描述
思路：根据name分组查询，如果分组的数量大于1，就说明重复了。

2、有唯一列，通过唯一列最大或最小方式删除重复记录

检查表中是否有主键或者唯一值的列，当前可以数据看到ID是唯一的，可以通过Name分组排除掉ID最大或最小的行

delete from Student
  where Name in( select Name from Student group by  Name having count(Name) > 1) and 
 ID not in(select  max(ID) from Student group by  Name having count(Name) > 1 )

3、无唯一列使用ROW_NUMBER()函数删除重复记录

如果表中没有唯一值的列，可以通过 来删除重复数据
重复执行插入脚本，查看表数据，表中没有唯一列值

在这里插入图片描述

Delete T From
 (Select Row_Number() Over(Partition By [Name] order By [ID]) As RowNumber,* From Student)T
 Where T.RowNumber > 1

执行删除脚本后查询表数据
在这里插入图片描述
小知识点：

语法：ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)
表示根据COLUMN分组，在分组内部根据 COLUMN排序，而此函数计算的值就表示每组内部排序后的顺序编号（组内连续的唯一的)

函数“Row_Number”必须有 OVER 子句。OVER 子句必须有包含 ORDER BY
Row_Number() Over(Partition By [Name] order By [ID])  表示已name列分组，在每组内以ID列进行升序排序，每组内返回一个唯一的序号

内容是转载的，学到了记下来；

飞天小栗旬

发布了10 篇原创文章 · 获赞 7 · 访问量 695

私信关注

sqlserver删除表中的重复数据

1、查询表中Name 重复的数据

2、有唯一列，通过唯一列最大或最小方式删除重复记录

3、无唯一列使用ROW_NUMBER()函数删除重复记录

猜你喜欢