Oracle SQL语句优化心得

自从Oracle 10g以来，Oracle就存在了两种优化器--CBO和RBO。

RBO: Rule-Based Optimization 基于规则的优化器

CBO: Cost-Based Optimization 基于代价的优化器

RBO顾名思义，Oracle在系统内部定义了一系列sql语句执行了规则，sql严格按照规则来生成执行计划，并执行，对表的数据分布和变化不敏感，所以才有了CBO的出现。

CBO是对每个查询所耗费的资源进行量化，从而可以根据这个量化的值选出最佳的执行计划，一个查询所耗费的资源可分为:I/O，CPU，network三部分代价。

<1>I/O一般是将数据库文件中的数据库块读入内存(磁盘读入内存)所耗费的资源

<2>CPU代价是内存中处理数据的代价，在这些数据上进行排序sort,表的join连接操作，这都需要cpu资源的耗费。

<3>network是远程查询数据库表或者执行分布式连接的网络传输代价

注：Oracle中数据库的概念是Oracle数据文件中的最小单位，由多个操作系统块组成。

数据库使用的优化器根据参数optimizer_mode决定，取值如下:

RULE 使用RBO优化器

choose 数据字典有被引用的对象的统计数据，则使用CBO，否则使用RBO

all_rows 以数据吞吐量为主要目标，以便使用最少的资源完成语句

first_rows 以数据响应时间为主要目标，以便快速查询开始的n行数据

first_rows[1|100|1000|n] 让优化器选一个能把响应时间减到最小的执行计划，以迅速产生查询结果的前n行

2.执行计划中的概念

row_sources(行源) 根据where中条件限制后的结果集或者多表链接后的结果集，不单指table

predicate(谓词)

access谓词这个谓词的条件的值将会影响数据的访问路径（一般针对索引）

fileter谓词起过滤作用

driving table(驱动表,外表,outer table) 用于嵌套连接和哈希连接

probed table(被探查表,内表,inner table)

access path(访问路径)

full table scans(全表扫描) Oracle顺序读取分配给表的每个数据块，知道表的最高水位线。可以一次性读取多个块，block的数量则由操作系统的I/O最大值和multiblock(db_block_multiblock_read_count)参数共同决定

Table Access by ROWID(通过ROWID的表存取/rowid lookup）

Index Scan（索引扫描/index lookup）

......

sort-mergejoin(排序合并连接)

nested loop(嵌套连接)

hash join(哈希连接)

3.sql语句执行过程

每种类型sql语句都要一下n个阶段:

<1>create a cursor

<2>parse the statement解析语句

判断语法是否正确，权限是否充足，查找数据字典是否符合表，列的定义，锁分析，生成执行计划等，这一步骤比较耗费资源，一般都应该减少解析次数。但是也有下述这种情况:当sql的基表发生的dml语句导致数据分布发生了较大的变化(可能影响的执行计划)，如果还采用之前的执行计划，有可能性能会不太好，这时候最好重新进行表分析，重新生成执行计划，所以这个还是要看具体情况决定。

<5>bind any variables

<7>run the statement

<9>close the cursor

若使用了并行功能

<6>parallelize the statement 并行执行语句

若是select语句

<3>describe result of a query 描述查询结果集

<4>define output of a query 定义查询输出

<8>fetch rows of a query 获取查询行

4.sql中标的连接方式

排序合并连接

MERGE

row_source1按照连接列进行排序，row_source2按照连接列进行排序

row_source1，row_source2一起执行合并操作，即将两个row_source按照连接条件连接起来

嵌套循环

一般原则是选择驱动表是较小的row_source

优点:可以快速返回已经连接的行，不必等所有行连接操作处理完才返回数据，可实时响应

hash连接

较小的row_source用来构建hash table的bitmap，第二个row_source被用来hansed，并与第一个row_source生成的hash table匹配，以便进一步连接，比bitmap用来check hash table中是否有匹配的行。

三种连接方式比较:

smj:第一，对于非等值连接效率较高。关联列上有索引更好。对于两个较大的row_source比nl效率高

nl:第一快速响应。外部表较小，内部表上有唯一索引/高效的非唯一索引

hj:hash_area_size参数要合适。只能用于等值连接。

Oracle SQL语句优化心得

猜你喜欢