数据库每日一题---第2天:查找重复的电子邮箱

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第6天,点击查看活动详情

一、问题描述

编写一个 SQL 查询,查找 Person 表中所有重复的电子邮箱。

+----+---------+
| Id | Email   |
+----+---------+
| 1  | [email protected] |
| 2  | [email protected] |
| 3  | [email protected] |
+----+---------+
复制代码

说明:所有电子邮箱都是小写字母。

题目链接:查找重复的电子邮箱

二、题目要求

样例

根据以上输入,你的查询应返回以下结果:

+---------+
| Email   |
+---------+
| [email protected] |
+---------+

复制代码

考察

1.聚合函数
2.建议用时10~25min
复制代码

三、问题分析

重复的电子邮箱存在多次。要计算每封电子邮件的存在次数,我们可以使用以下两种方法的相关代码:

1.聚合函数

聚合函数就是分组的意思,将具有相同属性的目标值,根据给定的分组条件进行分组。

这里我们事先使用聚合函数group by把邮箱号相同的数据分成一组,以上面的样例为例,结果如下:

[email protected]  1 3
-----------
[email protected]  2
复制代码

通过分组之后的结果,使用having count进行具体的操作,筛选出值大于1的结果就是重复的电子邮箱。

2.自连接

自连接就是针对相同的表,进行相应的连接操作。我们预先定义两个 a b都来自于 Person的数据,

第一步筛就是要预先选出表中不重复的电子邮件,随后和另一个变量对于的表进行遍历。如果满足电子邮件相同但id编号不同这样的两个条件,那么就是输出的结果我们要寻找的重复电子邮件。

四、编码实现

1.聚合函数

select  Email
from Person
group by Email     -- 分组
having count(*)>1  -- 筛选
复制代码

2.连接查询

select distinct a.Email
from Person as a,
Person as b
where a.Email=b.Email and a.Id!=b.Id
复制代码

五、测试结果

1.png

2.png

猜你喜欢

转载自juejin.im/post/7103441453598113822