优化SQL 语句 in 和not in 的替代方案
用IN写出来的SQL的优点是比较容易写及清晰易懂,这比较适合现代软件开发的风格。
但是用IN的SQL性能总是比较低的,从SQL执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别:
SQL试图将其转换成多个表的连接,如果转换不成功则先执行IN里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功,但对于含有分组统计等方面的SQL就不能转换了。 推荐在业务密集的SQL当中尽量不采用IN操作符
NOT IN 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用NOT EXISTS 或(外连接+判断为空)方案代替
在数据库中有两个表,一个是当前表Info(id,PName,remark,impdate,upstate),一个是备份数据表bakInfo(id,PName,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
首先,添加10万条测试数据
代码
使用not in 和in操作:
1
2
3
4
5
6
7
8
|
SET
STATISTICS
TIME
ON
GO
--备份数据
insert
into
bakInfo(id,PName,remark,impdate,upstate)
select
id,PName,remark,impdate,upstate
from
dbo.Info
where
id
not
in
(
select
id
from
dbo.bakInfo)
GO
SET
STATISTICS
TIME
OFF
|
此操作执行时间:
1
2
3
4
5
6
7
8
9
|
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 3 毫秒。
SQL Server 执行时间:
CPU 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update
Info
set
upstate=1
where
id
in
(
select
id
from
dbo.bakInfo)
|
此操作执行时间:
1
2
3
4
5
6
7
8
9
|
SQL Server 分析和编译时间:
CPU 时间 = 62 毫秒,占用时间 = 79 毫秒。
SQL Server 执行时间:
CPU 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete
from
Info
where
upstate=1
and
id
in
(
select
id
from
dbo.bakInfo)
|
此操作执行时间:
1
2
3
4
5
6
7
|
SQL Server 分析和编译时间:
CPU 时间 = 183 毫秒,占用时间 = 183 毫秒。
SQL Server 执行时间:
CPU 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
|
使用join连接替代方案:
1
2
3
4
5
6
7
8
9
10
11
|
SET
STATISTICS
TIME
ON
GO
--备份数据
insert
into
bakInfo(id,PName,remark,impdate,upstate)
select
id,PName,remark,impdate,upstate
from
(
SELECT
Info.id,Info.PName, Info.remark, Info.impdate,Info.upstate, bakInfo.id
AS
bakID
FROM
Info
left
JOIN
bakInfo
ON
Info.id = bakInfo.id )
as
t
where
t.bakID
is
null
and
t.upstate=0
GO
SET
STATISTICS
TIME
OFF
;
|
此操作执行时间:
1
2
3
4
5
6
7
|
SQL Server 分析和编译时间:
CPU 时间 = 247 毫秒,占用时间 = 247 毫秒。
SQL Server 执行时间:
CPU 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
|
1
2
3
4
|
--更改当前表状态
update
Info
set
upstate=1
FROM
Info
INNER
JOIN
bakInfo
ON
Info.id = bakInfo.id
|
此操作执行时间:
1
2
3
4
5
6
7
|
SQL Server 分析和编译时间:
CPU 时间 = 4 毫秒,占用时间 = 4 毫秒。
SQL Server 执行时间:
CPU 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
|
1
2
3
4
5
|
--删除当前表数据
delete
from
Info
FROM
Info
INNER
JOIN
bakInfo
ON
Info.id = bakInfo.id
where
Info.upstate=1
|
此操作执行时间:
1
2
3
4
5
6
7
|
SQL Server 分析和编译时间:
CPU 时间 = 177 毫秒,占用时间 = 177 毫秒。
SQL Server 执行时间:
CPU 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
|
可以看出使用join方案比使用not in 和in执行时间要短很多了