常用的SQL优化原则

同事写的，我整理了一下

1）通过分析SQL执行计划来优化SQL，这是最直接、最有效的方式。

2）Oracle SQL优化的目标主要有如下三点：降低执行SQL语句所需要的工作负载；均衡执行SQL语句所需要的工作负载；并行化执行SQL语句所需要的工作负载。

3）SQL的优化原则不能一概而论，与很多因素有关。比如你的系统的种类，是OLTP还是OLAP?系统数据量的大小；数据的分布；表和索引是否分析；表的一些存在严重倾斜的列上是否存在直方图；你用hint了吗？

optimizer_mode的值（Oracle 10g中的选项有first_rows/all_rows/first_rows_n，9i中还有rule/choose）是什么；

db_file_multiblock_read_count的值(影响Oracle在执行全表扫描时一次读取的block数量， 10gR2后数据库会根据系统的情况自动调整)是多少；_optim_peek_user_binds的值（当数据倾斜时是否对执行计划纠偏，可选值为true/false，默认为true）是什么；

optimizer_index_cost_adj 的值(索引扫描与全表扫描的成本比较，值范围为1~10000，百分比，缺省为100，表示两者等价)是多少等等。

总之，调优非常灵活，没有固定的模式，应该具体问题具体分析。

4）索引不一定比全表扫描快。

5）不要在where中使用function，如果要用，可以考虑建函数索引。

6）建联合索引时把离散程度最高的列放在最前面，这适用于主键索引或者需要高选择性的index range scan的索引。

扫描二维码关注公众号，回复： 1308627 查看本文章

7）不要让SQL执行时产生隐式转换。

8）如果有可能，就用union all 代替or吧。

通常情况下, 用UNION替换WHERE子句中的OR将会起到较好的效果. 对索引列使用OR将造成全表扫描. 注意, 以上规则只针对多个索引列有效. 如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引.
高效:
　　SELECT LOC_ID , LOC_DESC , REGION
　　FROM LOCATION
　　WHERE LOC_ID = 10
　　UNION
　　SELECT LOC_ID , LOC_DESC , REGION
　　FROM LOCATION
　　WHERE REGION = “MELBOURNE”
低效:
　　SELECT LOC_ID , LOC_DESC , REGION
　　FROM LOCATION
　　WHERE LOC_ID = 10 OR REGION = “MELBOURNE”

9）用exists不一定比用in好！如果子查询中的select有很好的选择性，那就用in吧！即in适合于外表大而内表小的情况；exists适合于外表小而内表大的情况。这里要注意not in中的null问题。

10）使用count(*)而不是count(columnname)，count(columnname)当碰到所查的列的值有null的时候，结果就不准了。

11）null值不入普通的B树索引，所以对B树索引而言，纯粹的null/not null条件是不会使用该索引的。

12）不要在重复值过多（即离散程度很小）的列上建索引

13）在基数小的字段上要善于使用位图索引。位图索引会记录相关的NULL值列信息。

14）CBO并不总是正确的！当你发现CBO产生的执行计划有问题时，先仔细分析一下为什么会这样：表和索引分析了吗？数据是否倾斜？或者你可以做一个10053或者10046的trace，分析一下原因。

15）不要对长度太长的VARCHAR2字段建索引。如果确实有这样的需求，可以考虑使用oracle text。
16）Nested Loops(NL)连接时要选择正确的连接顺序，选取的原则通常是尽量选择返回较少数据的表作为驱动表。

17）对于Nested Loops(NL)而言，如果driving row source(外部表)比较小，并且在inner row source(内部表)上有唯一索引，或有高选择性非唯一索引时，使用这种方法可以得到很好的效率；NL有其它连接方法没有的一个优点：NL可以先返回已经连接的行，而不必等待所有的连接操作处理完才返回数据，这可以实现快速响应。

18）Sort Merge Join(SMJ)对于非等值连接，这种连接方式的效率是比较高的；如果在关联的列上都有索引且两个row source差不多大，可以考虑使用SMJ；SMJ通常并不适合于OLTP系统，本质原因是因为对于OLTP系统而言，排序是非常昂贵的操作。除非你能避免排序操作，比如关联的列上都有索引。

19）Hash Join(HJ)适合于小表与大表连接并且返回大型结果集的连接，其效率好于SMJ与NL，但是这种连接只能用于等值连接且必须用CBO。若要让HJ取得较好的效率，如下几点要注意：确认小表是驱动表；确认涉及到的表和连接键都分析过了；如果在连接键上数据不均匀的话，一定要收集直方图；如果可以，调大pga_aggregate_target的值。

如何看执行计划

1）从缩进度最大的行读取，它是最先被执行的步骤

2）当缩进一样时，最上面的最先被执行

其他资料：

优化器模式 http://blog.sina.com.cn/s/blog_492c0acd0100d0u0.html

表扫描方式 http://blog.csdn.net/doupeihua/article/details/6822591

Oracle 连接和半连接 http://blog.sina.com.cn/s/blog_7c5a82970101ix2l.html

常用的SQL优化原则

猜你喜欢