oracle表联结方法

     联结的方法有:嵌套循环联结、散列联结、排序-合并联结、笛卡儿积联结。每种联结方法都有一定的最适合使用的条件,对于每对需要联结的表,优化器还必须确定表联结的顺序。

  • 嵌套循环联结(NESTED LOOPS)

      嵌套循环联结使用一次访问运算所得到的结果集中每一行来与另一个表进行对碰。如果结果集的大小是有限的,并且在用来联结的列上建有索引的话,这种联结的效率通常是最高的。嵌套循环联结的运算成本主要是读取外层表中的每一行并将其与所匹配的内层表中的行联结所需的成本。

顾名思义,嵌套循环联结就是一个循环嵌套在另一个循环当中。外层循环基本来说就是一个只使用WHERE子句中的属于驱动表的条件对它进行的查询。当数据行经过了外层条件筛选并被确认匹配条件后,这些行就会逐个进入到内层循环中。然后再基于联结列进行逐行检查看是否与被联结的表中的某一行相匹配。如果这一行与第二次的检查相匹配,就将会被传递到查询计划的下一步或者如果没有更多步骤的话直接被包含在最终的结果集中。这种类型的强大之处在于所使用的内存是非常少的 。在结果集较少的时候会是最好的。NESTED LOOPS运算后所列出的第一个表是驱动表。

  • 排序-合并联结(SORT JOIN MERGE JOIN)

      排序-合并联结独立地读取需要联结的两张表,对每张表中的数据行按照联结键进行排序,然后对排序后的数据行集进行行合并。对这种联结方法来说排序的开销是非常大的。对于不能够放入内存中的大的数据源来说,可能会使用临时磁盘空间来完成排序。这是非常耗占内存和时间资源的。但是一但数据行集排序完成了,合并的过程是非常快的。为了进行合并,数据库轮流操作两个表,经较最上面的数据行,丢弃在排序队列中比另一列表中的最上面一行出现得早的数据行,并只返回匹配的行。

  • 散列联结(HASH JOIN)

     散列联结,与排序-合并联结类似,首先应用WHERE子句中的筛选标准来独立地读取要进行联结的两个表。基于表和索引的统计信息,被确定为返回最少行数的表被完全散列化到内存中。这个散列表包含了原表的所有数据行并被基于将联结键转化为散列值的随机函数载入到散列桶中。只要有足够的内存空间,这个散列表将一直放在内存中。然而,如果没有足够的内存,散列表将会被写入到临时磁盘空间。

     下一步就是读取另一张较大的表并对联结键列应用散列函数。然后利用得到的散列值,对较小的在内存中的散列表进行探测以寻找匹配的第一个表的行数据所在的散列桶。每个散列桶都有一个放在其中的数据行列表(通过一个位图来表示)。这个列表被用来与探测行进行匹配。如果匹配成功,则返回这一行数据,否则丢弃。较大的表只读取一次,并检查其中的每一行来寻找匹配。这与嵌套循环联结的不同之处在于,此处内层表被多次读取。因此较大的表是驱动表,仅读取一次,而较小的散列表则被探测很多次。与嵌套回路联结执行计划不同,在执行计划的输出中较小的散列表放在前面而较大的探测表放在后面。

  • 笛卡尔积联结(MERGE JOIN CARTESIAN)

      笛卡尔联结发生在当一张表中的所有行与另一张表中的所有行联结的时候。因此,这种联结所得到的结果集的部行数等于一张表(A)中的数据行数乘以另一张表(B)中的数据行数,也就是A*B=结果集中总的数据行数。

  • 外联结(NESTED LOOPS OUTER)

      外联结返回一张表的所有行以及另一张表中满足联结条件的行数据。ORACLE使用+字符来表明进行外联结。+号放在一对圆括号中,位于只有匹配才会返回数据行的表联结旁。正如在对种联结方法进行总述的时候指出的,外联结需要外联结表作为驱动表。这意味着有可能不能选用更加优化的联结执行顺序。因此,使用外联结的时候需要格外小心,因为它的选用有可能会影响到整个执行计划的性能。

     小结:在确定SQL语句的执行计划的时候,优化器必须做出几个关键的选择。首先,要确定查询中所用的每个表最合适的访问方法。基本上有两种选择:索引扫描全表扫描 。每种访问方法用来访问包含SQL语句所需数据的实现方式是不同的。一旦优化器选定了访问方法,就必须选定联结方法。表将会被逐对进行联结,前一次联结的结果的数据行被用来与下一个表进行联结,直到所有表都被联结并获得最终的结果集。理解每种访问和联结方法是如何实现,有助于你写出可以让优化器作出最高效选择的SQL。理解所选的运算以及这些运算是如何进行,也将助于你来避免最容易发生性能问题的地方。理解表之下的内部原理,可以帮助你写出更好、更快的SQL语句。

猜你喜欢

转载自mukeliang.iteye.com/blog/1707396