mysql语法-DQL(select高级查询)


1.DDL(数据定义语言)

DDL部分可以回顾上一篇文章:mysql语法-DDL(create、drop、alter)

2.DML(数据操作语言)

DML部分可以回顾上一篇文章:mysql语法-DML(insert、update、delete)

3.DQL(数据查询语言)

DQL基础查询可以回顾上一篇文章:mysql语法-DQL(select基础查询)


接下来记录一下查询的高级用法。

高级查询

我们基于emp表和dept表进行查询。
emp表:
在这里插入图片描述
dept表:
在这里插入图片描述

1. 连接查询

1.1 笛卡尔积

直接查询两张表,最后的结果是笛卡尔积(两个集合所能组成的有序对)
emp表有14条记录,dept表有4条记录,一共查询出14*4=56条记录
select * from emp,dept;

在这里插入图片描述

1.2 内连接

内连接:多张表都匹配的记录(通用列)组成
特点:
	无主从表之分,内连接与连接顺序无关(记录)
	记录必须在多张表都匹配才能出现在结果集,不匹配就不会出现,比如dept的40号部门记录就没有出现
	# 查询所有雇员及其部门信息
	# 简单语法
	select * from emp,dept where emp.deptno = dept.deptno;
	#标准语法:inner join ... on 条件
	select * from emp inner join dept on emp.deptno = dept.deptno;
	## inner join ...using(通用列),
		# 但是1.通用列的名称在多张表中必须一致才能使用
		# 2.必须是等值=连接,不能大于小于
		# 3.会掉重复列,比如deptno列只显示一列
	select * from emp inner join dept using(deptno);

会出现重复列。
在这里插入图片描述
不会出现重复列。
在这里插入图片描述
1.3 自然连接

自然连接:必须是等值连接,连接的字段必须一样
表中字段名称相等的字段进行连接,会自动去掉重复列
select * from emp natural join dept;

在这里插入图片描述
1.4 外连接

特点
	外连接与连接顺序有关(区分主从表(驱动表/附属表))
	以主表为驱动,依次在从表中寻找匹配的记录,如果匹配则连接并展示,否则以null填充
	语法:left/right [outer] join ... on...
	# 保留emp中所有记录,从dept表中寻找deptno匹配连接
	select * from emp left join dept on emp.deptno = dept.deptno;

以emp表的记录顺序依次从dept表中找到匹配的值。
在这里插入图片描述
以dept表的记录顺序来依次从emp表中找到匹配的值。
在这里插入图片描述

# 保留dept表所有数据,依次从emp表中匹配连接,无匹配返回null
select * from dept left join emp on dept.deptno = emp.deptno;

在这里插入图片描述
1.5 自连接

以本身为镜像进行连接(自身连接自身)
# 查询员工及其领导的名称(员工和领导都在一张表上)
# 从e1表中的经理编号找到e2表中对应的员工编号,该员工编号对应的就是经理
select e1.ename,e2.ename as mgr from emp e1,emp e2 where e1.mgr = e2.empno;

在这里插入图片描述

2. 子查询

也叫嵌套查询,把查询出来的结果当作另外一个查询的条件
案例:查询员工编号为7788的员工所在部门的名称

内连接查询:
select dept.dname from dept inner join emp on dept.deptno = emp.deptno and emp.empno = 7788;

但是如果表的数据比较多,使用连接查询会非常慢,所以可以使用子查询
括号是子查询,优先执行
select dname from dept where deptno = (select deptno from emp where empno = 7788);
思路:
1.先筛选出emp表员工编号为7788的员工所在的部门编号;
2.然后dept表的部门编号=emp表的部门编号,查出dept表的部门名称。

在这里插入图片描述
案例:查询工资>2000的员工所在的部门信息。

单行子查询:子查询返回的结果是一条记录  可用= > <
多行子查询:子查询返回的结果是多条记录,可用:
=any : in    >any:大于最小值  <any:小于最大值
<>all:不在   >all:大于最大值  <all:小于最小值
select * from dept where deptno in (select distinct deptno from emp where sal > 2000);
select * from dept where deptno = any (select distinct deptno from emp where sal > 2000);

在这里插入图片描述

嵌套层次越深,效率越低
e是给括号内的查询结果命名,因为 from 关键字后要+select e.ename from(
select * from emp where sal > 2000) e;

在这里插入图片描述

in和exists的区别

where后面in的执行原理:主查询中的每一行在与in后面子查询语句的结果匹配时,子查询语句就重新执行遍历一遍。
所以在数据量极大的情况下,子查询在与主查询每匹配一次就重新遍历一次,总的时间就会变长。所以有时候性能甚至不如直接进行连接查询。

where后面exists的执行原理:主查询中每一行代入子查询进行匹配,匹配成功返回True,取得主表那一行数据;匹配失败返回False,不取该行数据。子查询不出结果,所以select的字段没有意义,一般用*。
exists的好处在于当子表数据量比较大的情况下,可以避免子表每匹配一次就进行全表扫描一次。

一般使用子查询的时候,对于性能一般可以这样区分:
1、当主表数据量大,子表数据量小,使用in。
2、当主表数据量小,子表数据量大,使用exists。

in
1.先执行子查询,再执行主查询
2.需要字段一一匹配,比如where后面要接字段
3.子查询必须返回结果集
select * from dept where deptno in (select deptno from emp where sal > 2000); 

先执行子查询,获取工资>2000的部门编号,再执行主查询。
在这里插入图片描述 在这里插入图片描述

exists
1.先执行主查询,主查询遍历每条记录,在子查询中进行匹配,看是否出现匹配
2.不需要字段匹配,where后面不接字段
3.子查询不返回具体结果,返回TrueFalse
#检查子查询是否至少会返回一行数据,该子查询实际上并不返回任何数据,而是返回值True或False
#括号内查询出来很多条记录,注意不是单个字段
select * from dept where exists(select * from emp where sal > 2000 and emp.deptno = dept.deptno);

在这里插入图片描述

小结:连接查询和子查询

连接查询:如果最终结果分布在多张表,肯定用连接查询
子查询:如果最终结果只在一张表,可能只要用子查询就ok

实际工作中:连接和子查询一起用。

1.连接查询:容易思考,如果每张表的数据量较大,不适合直接连接,影响性能。(可先过滤筛选之后再连接)

2.子查询:有可能因为嵌套层次太多,影响性能。

查询员工编号为7788的员工的名称和所在部门的名称(分布在两张表)
两种思路:
		1.先连接两张表--筛选7788
	    2.先筛选7788--再跟dept表连接(推荐)

在这里插入图片描述

3. 联合查询

union: 并集,所有的内容都查询,重复的显示一次
union all: 并集,所有的内容都显示,包括重复的

案例:查询20号部门或者员工工资>2000的员工的信息

# 去重后,有8条数据
select * from emp where deptno = 20
union
select * from emp where sal > 2000;

在这里插入图片描述

# 没有去重,有3条数据重复,重复的记录是条件为部门编号=20,同时工资也超过2000,因为只要查到一个条件就返回一次。
select * from emp where deptno = 20 
union all 
select * from emp where sal > 2000;

在这里插入图片描述

发布了56 篇原创文章 · 获赞 34 · 访问量 3672

猜你喜欢

转载自blog.csdn.net/MicoOu/article/details/103251493