『 MySQL篇』：MySQL表的聚合与联合查询

基础篇	MySQL系列专栏(持续更新中 …)
1	『 MySQL篇』：库操作、数据类型
2	『 MySQL篇』：MySQL表的CURD操作
3	『 MySQL篇』：MySQL表的相关约束
4	『 MySQL篇』：MySQL表的聚合与联合查询

函数	说明
count(列名或表达式)	返回查询到的数据的个数
sum(列名或表达式)	返回查询到的数据的和, (不是数字没有意义)
avg(列名或表达式)	返回查询到的数据的平均值
max(列名或表达式)	返回查询到的数据的最大值
min（列名或表达式)	返回查询到的数据的最小值

以上的聚合函数可以在列名和表达式之前加上 distinct, 先对查询到的数据进行去重, 再进行计算

下面,我们将创建一组示例数据,对以上的聚合函数进行演示,

--- 创建学生成绩表
mysql> create table exam(
    -> id int primary key comment '学号',
    -> name varchar(20) comment '学生姓名',
    -> email varchar(50) not null comment '电子邮箱',
    -> chinese decimal(4,1) comment '语文成绩',
    -> english decimal(4,1) comment '英语成绩',
    -> math decimal(4,1)  comment'数学成绩'
    -> );
Query OK, 0 rows affected (0.02 sec)

--- 插入学生成绩数据
mysql> insert into exam values(202301,'张华','[email protected]',69,112,110),
    -> (202302,'李三','[email protected]',115.5,120,89),
    -> (202303,'宋七','[email protected]',110,113,66),
    -> (202304,'王五','[email protected]',89,65,78),
    -> (202305,'赵四','[email protected]',90,112,130),
    -> (202306,'李八','[email protected]',null,null,null);
Query OK, 6 rows affected (0.01 sec)
Records: 6  Duplicates: 0  Warnings: 0

---学生成绩表结构
mysql> desc exam;
+---------+--------------+------+-----+---------+-------+
| Field   | Type         | Null | Key | Default | Extra |
+---------+--------------+------+-----+---------+-------+
| id      | int(11)      | NO   | PRI | NULL    |       |
| name    | varchar(20)  | YES  |     | NULL    |       |
| email   | varchar(50)  | NO   |     | NULL    |       |
| chinese | decimal(4,1) | YES  |     | NULL    |       |
| english | decimal(4,1) | YES  |     | NULL    |       |
| math    | decimal(4,1) | YES  |     | NULL    |       |
+---------+--------------+------+-----+---------+-------+
6 rows in set (0.00 sec)

--- 数据详表
mysql> select * from exam;
+--------+------+------------------+---------+---------+-------+
| id     | name | email            | chinese | english | math  |
+--------+------+------------------+---------+---------+-------+
| 202301 | 张华 | 123452@163.com   |    69.0 |   112.0 | 110.0 |
| 202302 | 李三 | 1452563@163.com  |   115.5 |   120.0 |  89.0 |
| 202303 | 宋七 | 36215465@qq.com  |   110.0 |   113.0 |  66.0 |
| 202304 | 王五 | 15547522@163.com |    89.0 |    65.0 |  78.0 |
| 202305 | 赵四 | 15623355@163.com |    90.0 |   112.0 | 130.0 |
| 202306 | 李八 | 18625222@163.com |    NULL |    NULL |  NULL |
+--------+------+------------------+---------+---------+-------+
6 rows in set (0.01 sec)

count()函数

使用 count()函数可以返回数据表中的行数 , 允许对表中所有符合特定条件的所有行进行计数 .

#计算表中的总行数
mysql> select count(*) from exam;
+----------+
| count(*) |
+----------+
|        6 |
+----------+
1 row in set (0.01 sec

#计算表中chinese中的总行数
mysql> select count(math) from exam;
+-------------+
| count(math) |
+-------------+
|           5 |
+-------------+
1 row in set (0.00 sec)

#计算表中english列的总行数,并去重
mysql> select count(distinct english) from exam;
+-------------------------+
| count(distinct english) |
+-------------------------+
|                       4 |
+-------------------------+
1 row in set (0.01 sec)

COUNT(*)函数计算包含NULL和非NULL值的行，即：所有行 , 而count (列名) 进行计算时 , 不会将值为NULL的行计算在内, 即所有的非空行 . count(distinct 列名) 则会返回不包含空值的唯一行数 .

结合where语句进行使用

#查询exam表当中, 英语成绩为112的人数
mysql> select count(english) from exam where english = 112;
+----------------+
| count(english) |
+----------------+
|              2 |
+----------------+
1 row in set (0.00 sec)

sum() 函数

SUM()函数返回一组值的总和，SUM()函数忽略NULL值。如果找不到匹配行，则SUM()函数返回NULL值。

#计算数学成绩的总和, 并命名为emath
mysql> select sum(math) as emath from exam;
+-------+
| emath |
+-------+
| 473.0 |
+-------+
1 row in set (0.00 sec)

#计算英语成绩低于120分的成绩总和
mysql> select sum(english) from exam where english < 120;
+--------------+
| sum(english) |
+--------------+
|        402.0 |
+--------------+
1 row in set (0.00 sec)

avg()函数

AVG()函数计算一组值的平均值。它计算过程中是忽略NULL值的 , 使用 avg() 函数可以的到一组数据的平均值 .

# 计算所有同学的语文成绩的平均值
mysql> select avg(chinese) from exam;
+--------------+
| avg(chinese) |
+--------------+
|     94.70000 |
+--------------+
1 row in set (0.03 sec)

#计算总分的平均分
mysql> select avg(math+chinese+english) as 总均分 from exam;
+-----------+
| 总均分    |
+-----------+
| 293.70000 |
+-----------+
1 row in set (0.00 sec)

MAX()函数

MAX()函数返回一组值中的最大值。MAX()函数在许多查询中非常方便，例如查找最大数量，最昂贵的产品以及客户的最大付款数等 .

# 查询总分最高的同学总分
mysql> select max(math+english+chinese) as 总成绩 from exam;
+--------+
| 总成绩 |
+--------+
|  332.0 |
+--------+
1 row in set (0.00 sec)

#查询单科英语成绩的最高分的姓名
mysql>  select max(english) from exam;
+--------------+
| max(english) |
+--------------+
|        120.0 |
+--------------+
1 row in set (0.00 sec)

不使用max()函数的情况 , 也可以使用order by对数据集进行降序,并使用limit字句对结果集进行降序排序

mysql> select (chinese+math+english) as total  from exam order by total desc limit 1;
+-------+
| total |
+-------+
| 332.0 |
+-------+
1 row in set (0.00 sec)

如果要找到总成绩最高的同学的全部信息 , 需要使用子查询进行

# 查询总成绩最高的同学信息
mysql> select *
    -> from exam
    -> where chinese+math+english = (select max(chinese+math+english)
    ->                               from exam
    ->                              );
+--------+------+------------------+---------+---------+-------+
| id     | name | email            | chinese | english | math  |
+--------+------+------------------+---------+---------+-------+
| 202305 | 赵四 | 15623355@163.com |    90.0 |   112.0 | 130.0 |
+--------+------+------------------+---------+---------+-------+
1 row in set (0.00 sec)

Min()函数

Min()函数用于返回一组值当中的最小值 , 通常用于查询一组数据当中最小的值 , 如最小单价, 最小分数等 , 和 max() 函数的用法类似。

# 查询最小的总分
mysql> select min(math + english + chinese) as total from exam;
+-------+
| total |
+-------+
| 232.0 |
+-------+
1 row in set (0.00 sec)

#查询最小总分的全部信息
mysql> select * from exam 
       where chinese+english+math = (select min(math + english + chinese) as                                      total from exam);
+--------+------+------------------+---------+---------+------+
| id     | name | email            | chinese | english | math |
+--------+------+------------------+---------+---------+------+
| 202304 | 王五 | 15547522@163.com |    89.0 |    65.0 | 78.0 |
+--------+------+------------------+---------+---------+------+
1 row in set (0.00 sec)

MySQL 当中除了一些常用的聚合函数外 , 还包括一些字符串函数 , 日期时间函数 , 控制流函数等 , 下面再列举一些比较常见的其他函数 .

IFNULL函数

IFNULL函数是MySQL控制流函数之一，它接受两个参数，如果不是 NULL ，则返回第一个参数，否则IFNULL函数返回第二个参数

IFNULL(expression_1,expression_2);

如果expression_1不为NULL，则IFNULL函数返回expression_1; 否则返回expression_2的结果。

示例表如下所示：

#查找某位同学的联系方式 （如果电话为空，使用邮箱）
mysql> select name,ifnull(phone,email) as 联系方式 from exam;
+------+------------------+
| name | 联系方式         |
+------+------------------+
| 张华 | 13225631456      |
| 李三 | 15698475235      |
| 宋七 | 15236486952      |
| 王五 | 15547522@163.com |
| 赵四 | 13562698745      |
| 李八 | 18625222@163.com |
+------+------------------+
6 rows in set (0.00 sec)

#其中，王五和李八的电话为空，则使用其电子邮箱作为其联系方式。

日期、时间函数

now()函数	返回当前日期和时间。
month()函数	返回一个表示指定日期的月份的整数。
year()函数	返回日期值的年份部分。
dayname()函数	获取指定日期的工作日的名称。
round(数据，n) 函数	表示返回的数据保留n位小数

mysql> select year('2018-01-01');
+--------------------+
| year('2018-01-01') |
+--------------------+
|               2018 |
+--------------------+
1 row in set

mysql> select dayname('2018-01-01') dayname;
+---------+
| dayname |
+---------+
| Monday  |
+---------+
1 row in set

1.2 `GROUP BY`子句

GROUP BY子句通过列或表达式的值将一组行分组为一个小分组的汇总行记录。 GROUP BY子句为每个分组返回一行。换句话说，它减少了结果集中的行数，当GROUP BY子句与聚合函数相结合时，可以返回每个分组的单个值。

#示例职工表
mysql> create table emp(
    ->  id int primary key auto_increment,
    ->  name varchar(20) not null,
    ->  role varchar(20) not null,
    ->  salary numeric(11,2)
    -> );
Query OK, 0 rows affected (0.05 sec)
mysql> insert into emp(name, role, salary) values
    -> ('张三','科员', 2000.54),
    -> ('宋七','副厅', 8996.99),
    -> ('赵四','科员', 1800.11),
    -> ('李八','科长', 4540.5),
    -> ('宋九','科员', 2356.33);
Query OK, 5 rows affected (0.01 sec)
Records: 5  Duplicates: 0  Warnings: 0

mysql> select * from emp;
+----+------+------+---------+
| id | name | role | salary  |
+----+------+------+---------+
|  1 | 张三 | 科员 | 2000.54 |
|  2 | 宋七 | 副厅 | 8996.99 |
|  3 | 赵四 | 科员 | 1800.11 |
|  4 | 李八 | 科长 | 4540.50 |
|  5 | 宋九 | 科员 | 2356.33 |
+----+------+------+---------+
5 rows in set (0.00 sec)

对职工表进行分组查询，查询已知数据当中每个职位的最低和最高工资

mysql> select role,max(salary),min(salary) from emp group by role;
+------+-------------+-------------+
| role | max(salary) | min(salary) |
+------+-------------+-------------+
| 副厅 |     8996.99 |     8996.99 |
| 科员 |     2356.33 |     1800.11 |
| 科长 |     4540.50 |     4540.50 |
+------+-------------+-------------+
3 rows in set (0.00 sec)

1.3 `HAVING`子句

GROUP BY子句进行分组以后，需要对分组结果再进行条件过滤时，不能使用 WHERE 语句，而需要使用 HAVING子句

再次对上述的职工表进行操作，找出最高工资大于4000的职工职位角色和工资

mysql> select role,max(salary) from emp group by role having max(salary) > 4000;
+------+-------------+
| role | max(salary) |
+------+-------------+
| 副厅 |     8996.99 |
| 科长 |     4540.50 |
+------+-------------+
2 rows in set (0.00 sec)

条件筛选可以使用where, order by, limit等来实现，也可以不使用

HAVING子句和where语句的使用区别

分组之前指定条件, 也就是先筛选再分组, 使用where关键字.
分组之后指定条件, 也就是先分组再筛选, 使用group by关键字

where和group by语法上要注意区分, where语句紧跟在表名后, 而having跟在group by后 .

示例：查询工资小于5000的职工中，各职工角色的平均工资（保留两位小数）

mysql> select role,round(avg(salary)) from emp where salary < 5000 group by role;

+------+--------------------+
| role | round(avg(salary)) |
+------+--------------------+
| 科员 |               2052 |
| 科长 |               4541 |
+------+--------------------+
2 rows in set (0.01 sec)

二 . 多表关系

概述

项目开发当中,在进行数据库的表结构设计时,会根据业务需求和业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着某种联系 , 基本上分为三种: 一对多/多对多/一对一.

一对多(多对一)

案例 : 班级与学生的关系

关系 : 一个班级拥有多个学生 , 一个学生属于一个班级

实现 : 在多的一方(学生) 建立外键, 指向另一方的主键

多对多

案例 : 学生与课程的关系

关系 :一名学生可以选修多门课程 , 一门课程也可以供多个学生来选择 .

实现 : 建立第三张中间表, 中间表中至少包含两个外键,分别关联两表的主键

一对一

案例 : 用户与用户详情之间的关系

关系 : 多用于单表拆分 , 将一张表的基础字段放在一张表当中 , 其他详情字段放在另一张表当中,以提升操作效率

实现 : 在任意一方加入外键,关联另一方的主键 , 并设置外键是唯一的

三、联合查询

实际开发当中往往要使用多个表的的数据,所以需要多表联合查询 , 多表联合查询时是对多张表的数据取笛卡尔积 , 然后对联合表中筛选出需要的数据

对n条记录的表A和m条记录的表B进行笛卡尔积，一共会产生n*m条记录, 当两张表的数据量很大的时候, 这个操作就非常危险了 , 需要慎重使用

mysql> select * from class;
+----------+------------+
|    id    |   name     |
+----------+------------+
|        1 | 计科1班    |
|        2 | 计科2班    |
+----------+------------+
2 rows in set (0.00 sec)

mysql> select * from student;
+------+--------+----------+
| id   | name   | class_id |
+------+--------+----------+
|    1 | 张三   |        1 |
|    2 | 李四   |        1 |
|    3 | 王五   |        2 |
|    4 | 赵六   |        2 |
+------+--------+----------+

#两个表进行笛卡尔集之后可以得到结果
mysql> select * from student, class;
+------+--------+----------+----------+------------+
| id   | name   | class_id |   id     | name       |
+------+--------+----------+----------+------------+
|    1 | 张三   |        1 |        1 | 计科1班    |
|    1 | 张三   |        1 |        2 | 计科2班    |
|    2 | 李四   |        1 |        1 | 计科1班    |
|    2 | 李四   |        1 |        2 | 计科2班    |
|    3 | 王五   |        2 |        1 | 计科1班    |
|    3 | 王五   |        2 |        2 | 计科2班    |
|    4 | 赵六   |        2 |        1 | 计科1班    |
|    4 | 赵六   |        2 |        2 | 计科2班    |
+------+--------+----------+----------+------------+
8 rows in set (0.00 sec)

上述两表进行笛卡尔集之后，得到了 4 * 2 即 8 条的结果，在这之中只有class_id相同的数据才是有效数据，所以要添加限制条件才能筛选出有效数据

3.1 内连接

内连接查询的是两张表交集的部分

隐式内连接

select 字段列表 from 表1 ，表2 where ... = .. .;

显式内连接

select  字段列表 from 表1 inner join 表2 on 连接条件

以上述两张学生表和课程表为例，查询一名学生的姓名，以及该学生所在的班级名称

#隐式内连接
mysql> select student.name, class.name from class,student
    ->       where student.class_id = class.id;
+------+---------+
| name | name    |
+------+---------+
| 张三 | 计科1班 |
| 李四 | 计科1班 |
| 王五 | 计科2班 |
| 赵六 | 计科2班 |
+------+---------+
4 rows in set (0.01 sec)
# 也可以对表名起一个别名
mysql> select s.name, c.name from class c,student s
    ->   where s.class_id = c.id;
+------+---------+
| name | name    |
+------+---------+
| 张三 | 计科1班 |
| 李四 | 计科1班 |
| 王五 | 计科2班 |
| 赵六 | 计科2班 |
+------+---------+
4 rows in set (0.00 sec)

#显式内连接
mysql>  select student.name, class.name from student inner join class on student.class_id = class.id;
+------+---------+
| name | name    |
+------+---------+
| 张三 | 计科1班 |
| 李四 | 计科1班 |
| 王五 | 计科2班 |
| 赵六 | 计科2班 |
+------+---------+
4 rows in set (0.03 sec)

3.2 外连接

左外连接

相当于查询表1(左表)所有的数据包含表1和表2交集部分的数据

select 字段列表 from 表1 left join 表2 on 条件 ... ;

右外连接

相当于查询表2(右表)的所有数据 , 包含表1 和表2 交集部分的数据

select  字段列表 from 表1 right join 表2 on 条件 ....;

示例:

#表结构如下所示
mysql> select * from class;
+----+---------+
| id | name    |
+----+---------+
|  1 | 计科1班 |
|  2 | 计科2班 |
|  3 | NULL    |
+----+---------+
3 rows in set (0.00 sec)

mysql> select * from student;
+----+------+----------+
| id | name | class_id |
+----+------+----------+
|  1 | 张三 |        1 |
|  2 | 李四 |        1 |
|  3 | 王五 |        2 |
|  4 | 赵六 |        2 |
|  5 | 宋六 |     NULL |
+----+------+----------+
5 rows in set (0.01 sec)

mysql> select * from student left join class on student.class_id = class.id;
+----+------+----------+------+---------+
| id | name | class_id | id   | name    |
+----+------+----------+------+---------+
|  1 | 张三 |        1 |    1 | 计科1班 |
|  2 | 李四 |        1 |    1 | 计科1班 |
|  3 | 王五 |        2 |    2 | 计科2班 |
|  4 | 赵六 |        2 |    2 | 计科2班 |
|  5 | 宋六 |     NULL | NULL | NULL    |
+----+------+----------+------+---------+
5 rows in set (0.00 sec)

mysql> select * from class left join student on class.id = student.class_id;
+----+---------+------+------+----------+
| id | name    | id   | name | class_id |
+----+---------+------+------+----------+
|  1 | 计科1班 |    1 | 张三 |        1 |
|  1 | 计科1班 |    2 | 李四 |        1 |
|  2 | 计科2班 |    3 | 王五 |        2 |
|  2 | 计科2班 |    4 | 赵六 |        2 |
|  3 | NULL    | NULL | NULL |     NULL |
+----+---------+------+------+----------+
5 rows in set (0.00 sec)

#使用左外连接或者右外连接的前提一般是 , 需求的列中部分元素为空值,直接使用内连接无法显示出来,所以采用左外连接或者 右外连接

3.3 自连接

自连接指的是在同一张表内连接自身进行查询 ,自连接查询可以是内连接查询也可以是外连接查询 . (自连接查询中表必需起别名)

select 字段列表 from 表A 别名A join 表A 别名B on 条件

案例 : 员工表中包含以下字段 : 员工 id , 员工姓名 name,员工年龄 age , 员工领导managerid

# 查询员工以及所属领导的名称 (内)
select a.name,b.name  from emp a,emp b  where a.managerid = b.id;
(查询的结果不包含领导为null的字段)
# 查询所有员工及其领导的名字 , 如果员工没有领导, 也需要查询出来
select a.name '员工',b.name '领导' from emp a left join emp b on a.managerid = b.id;
#使用左外连接会将所有员工的姓名全部显示出来, 包括没有领导的

3.4 合并查询

在实际应用中，为了合并多个select的执行结果，可以使用集合操作符 union，union all。使用UNION和UNION ALL时，前后查询的结果集中，字段需要一致。

union all

该操作符用于取得两个结果集的并集。当使用该操作符时，不会去掉结果集中的重复行(合并后的结果中包含重复行)

select * from course where id<3
union all
select * from course where name= '数据结构';
# 当查询字段不一致时会报错

union

该操作符用于取得两个结果集的并集。当使用该操作符时，会自动去掉结果集中的重复行

select * from course where id<3
union 
select * from course where name= '数据结构';

同理 or

select * from course where id < 3 or name = '数据结构';

union查询时，在索引列查询速度快,or,in采用的是全表扫描机制更适用于非索引列查找。

3.4 子查询

概念 : SQL语句中嵌套select语句 , 称为嵌套查询 , 又称子查询 .

select * from table1 where column1 = (select column1 fropm table2);

子查询外部的语句可以是 : INSERT / UPDATE / SELECT 中的任何一个

标量子查询

子查询返回的结果为单个值(数字,字符串,日期)等, 常用操作符: = <> > >= < <=

#查询张三同学的同班同学
select * from student where class_id =(select class_id from student where name = '张三');

列子查询

子查询返回的结果是一列(可以是多行) ,这种子查询称为列子查询 .

常用的操作符为 : IN , NOT IN , ANY ,ALL

#  查询选修课程名称为语文或者英语的分数信息 (in)
select * from score where course_id in 
(select id from course where name='语文' or name='英文');

#查询语文课程分数大于其他任意一名学生的信息(any)
select * from score where grade>any(select grade from score where course_id = (select class_id from student where name = '语文'));

exists关键字

exists( )内子查询语句返回结果不为空，说明where条件成立就会执行主sql语句。如果为空就表示where条件不成立，sql语句就不会执行。not exists 和 exists相反，子查询语句结果为空，则表示where条件成立，执行sql语句。否则不执行。

在from子句中使用子查询：子查询语句出现在from子句中。这里要用到数据查询的技巧，把一个子查询当做一个临时表使用

-- 获取“计算机1班”的平均分，将其看作临时表
select avg( sco.score ) score from 
score sco
join student stu ON sco.student_id = stu.id
join classes cls ON stu.classes_id = cls.id
where cls.NAME = '计算机1班';