构建一个基于成本的SQL优化器？

什么是SQL优化器？

SQL 优化器会分析一个 SQL 查询语句并选择最高效的方式来执行请求。非常简单的查询可能只有一种执行的方法，与此同时，复杂的查询请求可能有数以千计，甚至数以百万计的方式可供选择。优化器的优化效果越好，就越接近最佳的执行方案，而这个最佳方案将会是执行查询请求的最高效方法。

下面是一条看上去简单的查询 SQL ：

SELECT *
FROM customers c, orders o
WHERE c.id=o.cust_id AND c.name < ’John Doe’

我不会用优化器在处理上述查询时需要考虑的诸多问题让你（或者我）感到无聊和厌烦，但下面的几个注意点会传达出我想要表达的观点；

我们应该在表关联前后评估字段名过滤么？
我们应该在索引上使用散列关联、合并关联、或者嵌套循环关联（在 CockroachDB 称为“查找关联”）？
如果是查询关联或者散列关联，我们是要通过枚举客户的方式来查询订单，还是通过枚举订单的方式来查询客户？
如果有一个建立在“name”字段上的辅助索引，我们是否可以通过这个索引来查询匹配的名字？或者说最好用主键索引来查找匹配的id？

除此之外，让优化器孤立地解决上述问题是肯定没办法胜任实际需要的，它需要纵观所有解决方案来发现最好的那一个。可能通过使用查询关联结合辅助索引的方式是非常不错的方法，但如果可以使用合并关联，主键索引会有更好的执行效果。实际上，一个方案是否是最佳的解决方案受数据行总数、众多的硬件运算器的相对性能、数据值的存储位置和查询频率以及其他因素的共同影响。

启发式 vs 基于成本

人们是如何在众多可能的执行计划中做出优化选择的？在这件事情上进行开发与思考的历史比我的年龄还要大，所以任何人的回答都会显得不那么精确。但是别灰心，在这个问题上，我们还是有两条通用的途径可以解决的。

第一条途径是每个人都在第一时间构建自己需要的优化器。人们基于常规原则收集预置的启发式规则。举例来说，假设有一条等式条件是预置的，则可能有一条启发式规则总是使用哈希连接（hash join）来代替嵌套循环连接。大多数情况下，执行计划在结果上表现得好，那么，这就是一条好的启发式规则。也就是说，像这样的基于规则的优化器就叫做启发式优化器。

然而，静态启发式规则也有缺点。他们在大多数情况下工作得很好，但在其他情况下，他们可能找不到最优执行计划。例如，查找联接循环遍历来自外部关系的行，并通过反复探测内部关系上的索引来查找匹配的内部行。当外部行数很少时，这种方法很有效，但是随着外部行数的增加，这种方法会逐渐降低，并且每一行的探测开销开始拖长执行时间。在某些交叉点，散列或合并连接可能会更好。但是很难设计出启发式规则来捕捉这些微妙之处。

接下来就开始介绍基于成本的优化器。基于成本的优化器将枚举可能的执行计划，并为每个计划分配成本，成本是执行该计划所需的时间和资源的估计值。一旦这些可能性被列举出来，优化器就会选择成本最低的计划并将其交付执行。虽然成本模型通常被设计为最大化吞吐量（即每秒查询），但它也可以被设计为支持其他期望指标的查询行为，例如最小化延迟（即检索第一行的时间）或最小化内存使用。

基于此，你可能会问：“如果成本模型被证明是有缺陷的怎么办？”。确实如此，基于成本的优化器是否足够好和它分配的成本是成正比的。此外，成本的精确度也高度依赖于优化器评估数据行数时达到的精确度。这听上去就像优化器在执行查询过程中的每个阶段评估实际返回的数据行总数。此时，我们已经引入了另一个研究了数十年的课题：数据库统计。

收集得到的数据库统计信息被发送给优化器希望其可以提供更精确的评估数据行数。有实际帮助的统计信息涵盖了表数据行、无重复的和存在空值的列数以及用于理解值分布的直方图等。这些信息都会传给优化器，优化器依据得到的信息给出关于采用何种关联类型、关联顺序、索引选择以及其他问题的解决方案。

优化器的重生

随着时间的推移，CockroachDB从一个简单的、具有启发式探索性质的优化器发展成一个足够复杂的优化器。在2.0版本产品中，基于不可能简单的通过逃避事实的现实，我们开始限制启发式规则的使用数量。经过细微调整过的启发式规则开始与其他规则相互冲突，而我们却很难调查出问题到底出在了哪条规则上。一个非常简单的启发式规则:

当遇到一个相等条件时采用散列关联

被变更为

当遇到一个相等条件时采用三联关联，除非所有的输入参数都是关联键，这种情况下会采用合并关联

到最后，我们甚至考虑了诸如

当遇到一个相等条件时采用三联关联，除非所有的输入都是关联键，这种情况下会采用合并关联。如果其中的一个关联输入参数由数量不多的列提供，而其他输入参数可以使用一个有效的索引集，那么就使用查找关联

这样的规则设置。

我们加入的每一条启发式规则都必须基于已经存在的规则进行测试检查，以此保证这些新加入的规则可以和其他现有规则正常高效的完成工作。如果说基于成本的优化器是一个平衡的积木塔的话，那么启发探索式优化器则是一个不稳定的结构，非常容易崩溃。

高级选项

正如我之前所说的，我会引导诸位读者一览新优化器的一些高级选项特征。在开始之前，把一个查询想象成一棵树结构，执行计划的中每一个步骤对应树结构的一个节点。事实上，这也是SQL解释器如何展示一个执行计划的整个过程：

上图所示的输出结果显示了一个未经优化 的查询请求是如何执行的：首先，计算得到一个完整的关于客户表和订单表的交叉乘积结果，之后根据WHERE条件过滤结果集，之后计算结果行数。但是！这个执行过程的性能非常差！如果客户表里有10,000个用户，订单表里有100,000条订单，那么两表交叉乘积后会产生10亿条记录，而大部分数据都是要被过滤废弃掉的，这会造成极大的浪费。

接下来会证明新优化器的价值所在。新优化器首先会将最开始的执行计划树结构转换成一系列逻辑上等价的执行计划树，然后从中选出成本最小的那一个。那么问题来了，什么叫“逻辑上等价”呢？两棵执行计划树逻辑上等价意味着这两棵树被执行完成后会返回同样的结果（在没有ORDER BY条件限制时可能数据行顺序不一致）。换言之，从正确性的角度来看，优化器会选中哪个执行计划并不重要，它只关心哪个计划的性能更好。

转换

新优化器不会一次性生成所有的等价执行计划树。相反，最开始的时候有一个初始化树结构，接着通过一系列递增的转换操作来生成可供选择的树结构。每一次独立的转换操作都是相对简单的；许多简单的转换操作相互结合共同实现复杂的优化需求。观察优化器的运行过程会让你觉得非常不可思议：即使你了解优化器使用的每一个独立的转换操作，它还是会发现可以产生许多令人惊讶的组合，而这些组合可以生产我们从未想到的执行计划。即使对于上述展示的相对简单的查询请求，优化器应用了12个转换操作来实现最终请求。下面展示了4个关键的转换操作流程图。

你可能注意到了为了最大程度的追求性能过滤器条件被向下移动到了join部分，成为了扫描操作的一部分。在最后的转换操作中，优化器决定采用一个带有辅助索引的查询关联来响应查询请求。

截止到本文撰写时，基于成本的优化器已经实现了超过160个不同的转换操作，我们会继续在未来的发行版本中加入更多的转换操作类型。由于转换操作完全依赖于新优化器的核心，所以我们花费大量的时间使得这些转换操作尽可能容易的被定义、学习和维护。为了实现这个目的，我们创造了一个称为Optgen的域细节语言(DSL)来表述转换操作的结构，以及用来从DSL生产真实Go语言代码的工具。如下是用Optgen语言表述转换操作的一个例子：

(Select
	$input:(InnerJoin $left:* $right:* $on:*)
	$filter:*
)
=>
(InnerJoin
	$left
	$right
	(ConcatFilters $on $filter)
)

这个转换将WHERE子句中的条件与内部连接的ON子句中的条件进行了合并。这个操作生成了大约25行的Go语言代码，其中包含了保证传递匹配转换被采用的代码。

备忘

我已经解释了新发布的优化器是如何生成许多的等价执行计划，并且基于成本估计选择其中最理想的一个执行计划。理论上这一套机制听上去还不错，但是优化器实际的效果怎么样呢？它会不会有可能需要指数级的内存空间来存储生成的这些计划？我们可以从一个被称为备忘的精巧的数据结构中得到这个问题的答案。

备忘被设计用来利用计划之间有意义的冗余来有效存储根据一个给定的查询请求生成的所有执行计划树集合。例如，一个关联查询可能有数个逻辑上相等的、从各个方面角度看都完全相同的执行计划，只不过一个计划采用了散列关联，一个计划采用了合并关联，另一个采用查询关联。除此之外，每个计划可能会有多个变量：一个变量里左连接输入参数使用主键索引来扫描行，在另一个变量里使用辅助索引做相同的工作。单纯地编码的话，这会因为计划的指数膨胀导致需要指数范围的空间来存储这些计划树。

备忘通过定义一个名为备忘组的等值类集合来解决上述问题，在每个备忘组中包含了一个逻辑上等值的表达式集合。下图详细说明了备忘组的工作原理：

为了构建一个执行计划，从组1中选任意一个运算符，然后分别从组2和组3中选择操作的左操作数和右操作数。因为在同一个组里的运算符一定是逻辑上相等的，所以不管你选中的是什么，你都会得到一个合法执行计划。简单的算术计算显示了共有12个（3 * 2 * 2）可能的执行计划会被编码到备忘里。所以，可以尽情想象一下拥有6种关联方式、复杂的聚合、众多的过滤器条件的报表查询可能带来的复杂度。其生成的计划树可能会以千计，如果你对备忘结构一无所知，那么在编码过程过程中需要的存储空间比你期望的要小的多。

当然，新的优化器不会随机的从备忘中挑选其中的一个执行方案树。相反，它会记录并选择每个备忘组中成本最小的那一个，然后基于这些选择的表达式中递归构建最终的执行方案。

总结

我们团队计划在接下来的时间内连续推出关于CockroachDB内部基于成本的优化器的内部分析文章。