本系列是这本算法教材的扩展资料：《算法竞赛入门到进阶》(京东当当 ) 清华大学出版社
PDF下载地址：https://github.com/luoyongjun999/code 其中的“补充资料”
如有建议，请联系：（1）QQ 群，567554289；（2）作者QQ，15512356

《算法竞赛入门到进阶》的第7章“动态规划”，讲解了DP的概念，以及线性DP、区间DP、树形DP、数位DP、状态压缩DP等应用场景。
本文以及后续几篇，将介绍DP的优化技术。

四边形不等式DP优化涉及的证明比较复杂，如果先给出定义和证明会让人迷惑，所以本文的组织结构是：先给出应用场景，引导出四边形不等式的概念，再进行定义和证明，最后用例题巩固。
四边形不等式DP优化，虽然理论有点复杂，但是编码很简单。

1 理论背景

四边形不等式（quadrangle inequality）应用于DP优化，是一个古老的知识点。它起源于Knuth（高纳德）1971年的一篇论文^[1]，用来解决最优二叉搜索树问题。1980年，储枫（F. Frances Yao，姚期智的夫人）做了深入研究^[2]，扩展为一般性的DP优化方法，把一些复杂度\(O(n^3)\)的DP问题，优化为\(O(n^2)\)。所以这个方法又被称为“Knuth-Yao DP Speedup Theorem”。

2 应用场合

有一些常见的DP问题，通常是区间DP问题，它的状态转移方程是：
\(dp[i][j] = min(dp[i][k] + dp[k + 1][j] + w[i][j])\)
其中\(i <= k < j\)，初始值\(dp[i][i]\)已知。\(min()\)也可以是\(max()\)，见本文第6小节的说明。
方程的含义是：
（1）\(dp[i][j]\)表示从\(i\)状态到\(j\)状态的最小花费。题目一般是求\(dp[1][n]\)，即从起始点\(1\)到终点\(n\)的最小花费。
（2）\(dp[i][k] + dp[k + 1][j]\)体现了递推关系。\(k\)在\(i\)和\(j\)之间滑动，\(k\)有一个最优值，使得\(dp[i][j]\)最小。
（3）\(w[i][j]\)的性质非常重要。\(w[i][j]\)是和题目有关的费用，如果它满足四边形不等式和单调性，那么用DP计算dp的时候，就能进行四边形不等式优化。
这类问题的经典的例子是“石子合并”^[3]，它的转移矩阵就是上面的\(dp[i][j]\)，\(w[i][j]\)是从第\(i\)堆石子到第\(j\)堆石子的总数量。

石子合并
题目描述：有n堆石子排成一排，每堆石子有一定的数量。将n堆石子并成为一堆。每次只能合并相邻的两堆石子，合并的花费为这两堆石子的总数。经过n-1次合并后成为一堆，求总的最小花费。
输入：测试数据第一行是整数n，表示有n堆石子。接下来的一行有n个数，分别表示这n堆石子的数目。
输出：总的最小花费。
输入样例：
3
2 4 5
输出样例：
17
提示：样例的计算过程是：第一次合并2+4=6；第二次合并6+5=11；总花费6+11=17。

在阅读后面的讲解时，读者可以对照“石子合并”这个例子来理解。注意，石子合并有多种情况和解法，详情见本文的例题“洛谷P1880石子合并”。
\(dp[i][j]\)是一个转移矩阵，如何编码填写这个矩阵？复杂度是多少？如果直接写\(i、j、k\)的3层循环，复杂度\(O(n^3)\)。
注意3层循环的写法。\(dp[i][j]\)是大区间，它从小区间\(dp[i][k]\)和\(dp[k+1][j]\)转移而来，所以应该先计算小区间，再逐步扩展到大区间。

for(int i=1; i<=n; i++)
    dp[i][i] = 0;                       //初始值
for(int len = 2; len <= n; len++)       //len：从小区间扩展到大区间
	for(int i = 1; i <= n-len+1; i++){  // 区间起点i
   		int j = i + len - 1;            // 区间终点j
   		for(int k = i; k < j; k++) //大区间[i,j]从小区间[i,k]和[k+1,j]转移而来
   			dp[i][j] = min(dp[i][j], dp[i][k] + dp[k + 1][j] + w[i][j]);
	}

3 四边形不等式优化

只需一个简单的优化操作，就能把上面代码的复杂度变为\(O(n^2)\)。这个操作就是把循环\(i ≤ k < j\)改为：
\(s[i][j-1] ≤ k ≤ s[i+1][j]\)
其中\(s[i][j]\)记录从i到j的最优分割点。在计算\(dp[i][j]\)的最小值时得到区间\([i, j]\)的分割点\(k\)，记录在\(s[i][j]\)中，用于下一次循环。
这个优化被称为四边形不等式优化。下面给出优化后的代码，优化见注释的几行代码。

for(i = 1;i <= n;i++){
    dp[i][i] = 0;                        
    s[i][i] = i;                        //s[][]的初始值
}
for(int len = 2; len <= n; len++)       
	for(int i = 1; i <= n-len+1; i++){   
   		int j = i + len - 1;            
   		for(k = s[i][j - 1]; k <= s[i + 1][j]; k++){   //缩小循环范围
            if(dp[i][j] > dp[i][k] + dp[k + 1][j] + w[i][j]){  //是否更优
   			   dp[i][j] = dp[i][k] + dp[k + 1][j] + w[i][j];
               s[i][j] = k;                 //更新最佳分割点
            }
   		}
	}

代码的复杂度是多少？
代码中\(i\)和\(k\)这2个循环，优化前是\(O(n^2)\)的。优化后，每个\(i\)内部的\(k\)的循环次数是\(s[i + 1][j] - s[i][j - 1]\)，其中\(j = i + len - 1\)。那么：
\(i = 1\)时，\(k\)循环\(s[2][len] - s[1][len-1]\)次。
\(i = 2\)时，\(k\)循环\(s[3][len+1] - s[2][len]\)次。
…
\(i = n-len+1\)时，\(k\)循环\(s[n-len+2][n] - s[n-len+1][n+1]\)次。
上述次数相加，总次数：
\(s[2][len] - s[1, len-1] + s[3][len+1] - s[2, len] + … + s[n+1,n] - s[n][n]\)
\(= s[n-len+2][n] - s[1][len-1]\)
\(< n\)
\(i\)和\(k\)循环的时间复杂度优化到了\(O(n)\)。总复杂度从\(O(n^3)\)优化到了\(O(n^2)\)。
在后面的四边形不等式定理证明中，将更严谨地证明复杂度。
下图给出了四边形不等式优化的效果，\(s_1\)是区间\([i, j-1]\)的最优分割点，\(s_2\)是区间\([i+1, j]\)的最优分割点。

图1 四边形不等式优化效果

读者对代码可能有2个疑问：
（1）为什么能够把\(i <= k < j\)缩小到\(s[i][j-1] ≤ k ≤ s[i+1][j]\)？
（2）\(s[i][j-1] ≤ s[i+1][j]\)成立吗？
下面几节给出四边形不等式优化的正确性和复杂度的严谨证明，解答了这2个问题。

4 四边形不等式定义和单调性定义

在四边形不等式DP优化中，对于\(w\)，有2个关键内容：四边形不等式定义、单调性。
（1）四边形不等式定义1：设\(w\)是定义在整数集合上的二元函数，对于任意整数\(i ≤ i' ≤ j ≤ j'\)，如果有 \(w(i, j) + w(i', j') ≤ w(i, j') + w(i', j)\)，则称\(w\)满足四边形不等式。
四边形不等式可以概况为：两个交错区间的\(w\)和，小于等于小区间与大区间的\(w\)和。
为什么被称为“四边形”？把它变成一个几何图，画成平行四边形，见下面图中的四边形\(i'ijj'\)。图中对角线长度和\(ij+i'j'\)大于平行线长度和\(ij'+i'j\)，这与四边形的性质是相反的，所以可以理解成“反四边形不等式”。请读者注意，这个“四边形”只是一个帮助理解的示意图，并没有严谨的意义。也有其他的四边形画法，下面这种四边形是储枫论文中的画法。当中间两个点\(i' = j\)时，四边形变成了一个三角形。

图2 四边形不等式 w(i, j) + w(i', j') ≤ w(i, j') + w(i', j)

定义1的特例是定义2。
（2）四边形不等式定义2：对于整数\(i < i+1 ≤ j < j+1\)，如果有 \(w(i, j) + w(i+1, j+1)≤ w(i, j+1) + w(i+1, j)\)，称\(w\)满足四边形不等式。
定义1和定义2实际上是等价的，它们可以互相推导^[4]。

（3）单调性：设w是定义在整数集合上的二元函数，如果对任意整数\(i ≤ i' ≤ j ≤ j'\)，有\(w(i, j') ≥ w(i', j)\)，称w具有单调性。
单调性可以形象地理解为，如果大区间包含于小区间，那么大区间的\(w\)值超过小区间的\(w\)值。

图3 w的单调性w(i, j') ≥ w(i', j)

在石子合并问题中，令w[i][j]等于从第i堆石子加到第j堆石子的石子总数。它满足四边形不等式的定义、单调性：
\(w[i][j'] ≥ w[i'][ j]\)，满足单调性；
\(w[i][j] + w[i'][j'] = w[i][j'] + w[i'][j]\)，满足四边形不等式定义。
利用\(w\)的四边形不等式、单调性的性质，可以推导出四边形不等式定理，用于DP优化。

5 四边形不等式定理（Knuth-Yao DP Speedup Theorem）

在储枫的论文中，提出并证明了四边形不等式定理。
四边形不等式定理：如果\(w(i, j)\)满足四边形不等式和单调性，则用DP计算\(dp[][]\)的时间复杂度是\(O(n^2)\)的。
这个定理是通过下面2个更详细的引理来证明的。
引理1：状态转移方程 \(dp[i][j] = min(dp[i][k] + dp[k + 1][j] + w[i][j])\)，如果\(w[i][j]\)满足四边形不等式和单调性，那么\(dp[i][j]\)也满足四边形不等式。
引理2：记\(s[i][j] = k\)是\(dp[i][j]\)取得最优值时的\(k\)，如果\(dp\)满足四边形不等式，那么有\(s[i][j-1] ≤ s[i][j] ≤ s[i+1][j]\)，即\(s[i][j-1] ≤ k ≤ s[i+1][j]\)。
定理2直接用于DP优化，复杂度\(O(n^2)\)。

6 证明四边形不等式定理

这里翻译储枫论文中对引理1和引理2的证明，并加上了本作者的一些说明。
定义方程\(c(i, j)\)：
\(c(i, i) = 0\)
\(c(i, j) = w(i, j) + min(c(i, k-1) + c(k, j))\) \(i < k ≤ j\) \((6-1)\)
前面的例子\(dp[i][j]\)和这里的\(c(i, j)\)略有不同，\(dp[i][j] = min(dp[i][k] + dp[k + 1][j] + w[i][j])\)，其中\(w[i][j]\)在\(min()\)内部。证明过程是一样的。
公式(6-1)的\(w\)要求满足四边形不等式：
\(w(i, j) + w(i', j') ≤ w(i', j) + w(i, j')\) \(i ≤ i' ≤ j ≤ j'\) \((6-2)\)
而且要求\(w\)是单调的：\(w(i', j) ≤ w(i, j')\) \([i', j]\subseteq[i, j']\)
（1）证明引理1
引理1：如果\(w(i, j)\)满足四边形不等式和单调性，那么\(c(i, j)\)也满足四边形不等式：
\(c(i, j) + c(i', j') ≤ c(i', j) + c(i, j')\) \(i≤i'≤j≤j'\) \((6-3)\)
下面证明(6-3)。
当\(i = i'\)或\(j = j'\)时(6-3)显然成立，下面考虑另外2个情况：A). \(i < i' = j < j'\)和B).\(i < i' < j < j'\)。

case A). i < i' = j < j'
代入公式(6-3)，得到一个“反”三角形不等式（图4的三角形\(ijj'\)，两边的和小于第三边）：
\(c(i, j) + c(j, j') ≤ c(i, j')\) \(i < j < j'\) \((6-4)\)
现在证明公式(6-4)。
假设\(c(i, j')\)在\(k = z\)处有最小值，即\(c(i, j') = c_z(i, j')\)。这里定义\(c_k(i, j)\)等于\(w(i, j) + c(i, k-1) + c(k, j)\)。
有2个对称情况A1)和A2)。
case A1). z ≤ j
\(z\)是\((i, j')\)区间的最优点，不是\((i, j)\)区间的最优点，所以有：
\(c(i, j) ≤ c_z(i, j) = w(i, j) + c(i, z-1) + c(z, j)\)
在两边加上\(c(j, j')\)：
\(c(i, j) + c(j, j') ≤ w(i, j) + c(i, z-1) + c(z, j) + c(j, j')\)
\(≤ w(i, j') + c(i, z-1) + c(z, j')\)
\(= c(i, j')\)
上面的推导时利用了下面2条：
1)\(w\)的单调性，有\(w(i, j)≤ w(i, j')\) ；
2)公式(6-4)的归纳假设：假设\(z ≤ j ≤ j'\)时成立，递推出\(i < j < j'\)时公式(6-4)也成立。观察下面的图，有\(c(z, j) + c(j, j') ≤ c(z, j')\)，它满足反三角形不等式。

图4 储枫论文图-引理1的case A1

case A2). \(z ≥ j\)。是A1)的对称情况。

case B). \(i < i' < j < j'\)
假设公式(6-3)右边的小区间\(c(i', j)\)和大区间\(c(i, j')\)分别在\(k = y\)和\(k = z\)处有最小值，记为：
\(c(i', j) = c_y(i', j)\)
\(c(i, j') = c_z(i, j')\)
同样有2个对称情况B1)和B2)。
case B1). \(z ≤ y\)
有 \(c(i', j') ≤ c_y(i', j')\)
和 \(c(i, j) ≤ c_z(i, j)\)
两式相加得：
\(c(i, j) + c(i', j')\)
\(≤ c_z(i, j) + c_y(i', j')\)
\(= w(i, j) + w(i', j') + c(i, z-1) + c(z, j) + c(i', y-1) + c(y, j')\) \((6-5)\)
公式(6-5)的进一步推导利用了下面2条：
1)根据\(w\)的四边形不等式，有\(w(i, j) + w(i', j') ≤ w(i', j) + w(i, j')\)；
2)根据公式(6-3)的归纳假设，即假设\(z ≤ y < j < j'\)时成立。观察下图，有\(c(z, j) + c(y, j') ≤ c(y, j) + c(z, j')\)，满足反四边形不等式。

图5 储枫论文图-引理1的case B1

则公式(6-5)变为：
\(c(i, j) + c(i', j')\)
\(≤ w(i', j) + w(i, j') + c(i, z-1) + c(i', y-1) + c(y, j) + c(z, j')\)
\(≤ c_y(i', j) + c_z(i, j')\)
\(= c(i', j) + c(i, j')\)
case B2). \(z ≥ y\)。是B1)的对称情况。
引理1证毕。

（2）证明引理2
用\(K_c(i, j)\)表示\(max\{k|c_k(i, j) = c(i, j)\}\)，也就是使\(c(i, j)\)得到最小值的那些\(k\)中，最大的那个是\(K_c(i, j)\)。定义\(K_c(i, i)=i\)。\(K_c(i, j)\)就是前面例子中的\(s[i][j]\)。
引理2： \(K_c(i, j) ≤ K_c(i, j+1) ≤ K_c(i+1, j+1)\) \((6-6)\)
下面是证明。
\(i = j\)时显然成立，下面假设\(i < j\)。
先证明公式(6-6)的第一部分\(K_c(i, j) ≤ K_c(i, j+1)\)。这等价于证明：对于\(i < k ≤ k' ≤ j\)，有
\(c_{k'}(i, j) ≤ c_k(i, j) \Rightarrow c_{k'}(i, j+1) ≤ c_k(i, j+1)\) \((6-7)\)
公式(6-7)的意思是：如果\(c_{k'}(i, j) ≤ ck(i, j)\)成立，那么\(c_{k'}(i, j+1) ≤ c_k(i, j+1)\)也成立。\(c_{k'}(i, j) ≤ c_k(i, j)\)的含义是，在\([i, j]\)区间，\(k'\)是比\(k\)更好的分割点，可以把\(k'\)看成\([i, j]\)的最优分割点。扩展到区间\([i, j+1]\)时，有\(c_{k'}(i, j+1) ≤ c_k(i, j+1)\)，即\(k'\)仍然是比\(k\)更好的分割点。也就是说，区间\([i, j+1]\)的最优分割点肯定大于等于\(k'\)。
下面证明公式(6-7)。
根据四边形不等式，在\(k ≤ k' ≤ j < j+1\)时，有
\(c(k, j) + c(k', j+1) ≤ c(k', j) + c(k, j+1)\)
在两边加上 \(w(i, j) + w(i, j+1) + c(i, k-1) + c(i, k'-1)\)，得：
\(c_k(i, j) + c_{k'}(i, j+1) ≤ c_{k'}(i, j) + c_k(i, j+1)\)
把ck(i, j) 移到右边：\(c_{k'}(i, j+1) ≤ c_{k'}(i, j) + c_k(i, j+1) -c_k(i, j)\) \((6-8)\)
把(6-7)的\(c_{k'}(i, j) ≤ c_k(i, j)\)的两边加上\(c_k(i, j+1)\)：
\(c_{k'}(i, j)+ c_k(i, j+1) ≤ c_k(i, j)+ c_k(i, j+1)\)
\(c_{k'}(i, j)+ c_k(i, j+1) - c_k(i, j) ≤ c_k(i, j+1)\)
结合(6-8)，得\(c_{k'}(i, j+1) ≤ c_k(i, j+1)\)，公式(6-7)成立。
同样可以证明，公式(6-6)的右半部分\(K_c(i, j+1) ≤ K_c(i+1, j+1)\)，在\(i < i+1≤ k ≤ k'\)时成立。
引理2说明当\(i、j\)增大时，\(K_c(i, j)\)是非递减的。

（3）证明四边形不等式定理
利用引理2，可推论出四边形不等式定理，即用DP计算所有的\(c(i, j)\)的时间复杂度是\(O(n^2)\)的。下面对这一结论进行说明。
用DP计算\(c(i, j)\)时，是按\(\delta= j - i = 0, 1, 2, ..., n-1\)的间距逐步增加进行递推计算的。具体过程请回顾前面第2节求dp[i][j]的代码。从\(c(i, j)\)递推到\(c(i, j+1)\)时，只需要\(K_c(i+1, j+1) - K_c(i, j)\)次最少限度的操作就够了。总次数是多少呢？对一个固定的\(\delta\)，计算所有的\(c(i, j)，1≤ i ≤ n-\delta，j = i+\delta\)，次数是：
i = 1时：\(K_c(1+1, 1+\delta+1) - K_c(1, \delta+1) = K_c(2, \delta+2) - K_c(1, \delta+1)\)
i = 2时：\(K_c(2+1, 2+\delta+1) - K_c(2, \delta+2) = K_c(3, \delta+3) - K_c(2, \delta+2)\)
i = 3时：\(K_c(3+1, 3+\delta+1) - K_c(3, \delta+3) = K_c(4, \delta+4) - K_c(3,\delta+3)\)
...
\(i = n-\delta\)时：\(K_c(n-\delta+1, n-\delta+\delta+1) - K_c(n-\delta, \delta+n-\delta) = K_c(n-\delta+1, n+1) - K_c(n-\delta, n)\)
以上式子相加，次数 \(= K_c(n-\delta+1, n+1) - K_c(1, \delta+1)\)，小于\(n\)。
对一个\(\delta\)，计算次数是\(O(n)\)的；有\(n\)个\(\delta\)，总计算复杂度是\(O(n^2)\)的。
以上证明了四边形不等式定理。
（4）\(min\)和\(max\)
前面讨论的都是\(min\)，如果是\(max\)，也可以进行四边形不等式优化。此时四边形不等式是“反”的：
\(w(i, j) + w(i', j') ≥ w(i', j) + w(i, j')\) \(i ≤ i' ≤ j ≤ j'\)
定义：
\(c(i, j) = w(i, j) + max(a(i, k) + b(k, j))\) \(i ≤ k ≤ j\)
引理3：若\(w、a、b\)都满足反四边形不等式，那么\(c\)也满足反四边形不等式。
引理4：如果\(a\)和\(b\)满足反四边形不等式，那么：
\(K_c(i, j) ≤ K_c(i, j+1) ≤ K_c(i+1, j+1)\) \(i ≤ j\)
证明与引理1和引理2的证明类似。

7 一维线性DP的四边形不等式优化

上述二维DP的四边形不等式优化，在一维DP的情况下也能优化。
李煜东《算法竞赛进阶指南》“0x5B四边形不等式”指出：状态转移方程 \(F[i] = min0≤j<i{F[j] + val(j, i)}\)，若\(val\)满足四边形不等式，则\(F\)具有决策单调性，可以把DP计算\(F[i]\)的复杂度从\(O(N^2)\)优化到\(O(NlogN)\)。

8 例题

拿到题目后，先判断w是否单调、是否满足四边形不等式，再使用四边形不等式优化DP。
8.1 石子合并

洛谷 P1880 https://www.luogu.com.cn/problem/P1880
题目描述：在一个圆形操场的四周摆放N堆石子，现要将石子有次序地合并成一堆。规定每次只能选相邻的2堆合并成新的一堆，并将新的一堆的石子数，记为该次合并的得分。
试设计出一个算法，计算出将 N 堆石子合并成1堆的最小得分和最大得分。
输入：
数据的第 1 行是正整数 N，表示有 N 堆石子。
第 2 行有 N 个整数，第 i 个整数 ai表示第 i 堆石子的个数。
输出：
输出共 2 行，第 1 行为最小得分，第 2 行为最大得分。
样例输入：
4
4 5 9 4
样例输出：
43
54

题解：
（1）如果石子堆没有顺序，可以任意合并，用贪心法，每次选择最小的两堆合并。
（2）本题要求只能合并相邻的两堆，不能用贪心法。贪心操作是每次合并时找石子数相加最少的两堆相邻石子。例如环形石子堆开始是{2, 4, 7, 5, 4, 3}，下面用贪心得到最小值64，但是另一种方法得到63。

（3）用四边形优化DP求解石子合并的最小值，复杂度是\(O(n^2)\)。
状态转移矩阵\(dp[i][j]\)前文已有说明，这里不再赘述。
最小值用四边形不等式优化DP，\(w\)在四边形不等式中取等号：\(w[i][j] + w[i'][j'] = w[i][j'] + w[i'][j]\)。
本题的石子堆是环状的，转换为线形的更方便处理。复制和原来一样的数据，头尾接起来，使\(n\)的数列转化为\(2n\)的数列，变成线形的。
（4）这一题除了求最小值，还求最大值。虽然最大值也用DP求解，但是它不满足反四边形不等式的单调性要求，不能优化。而且也没有必要优化，可以用简单的推理得到：区间\([i, j]\)的最大值，等于区间\([i, j-1]\)和\([i+1, j]\)中的最大值加上\(w(i, j)\)。
（5）石子合并问题的最优解法是GarsiaWachs算法，复杂度O(nlogn)。读者可以参考“洛谷P5569 石子合并”，这题\(N ≤ 40000\)，用DP会超时。

8.2 最优二叉搜索树
最优二叉搜索树是Knuth（高纳德）解决的经典问题，是四边形不等式优化的起源。

Optimal Binary Search Tree
uva10304 https://vjudge.net/problem/UVA-10304
题目描述：给定\(n\)个不同元素的集合\(S =(e_1, e_2, ..., e_n)\)，有\(e_1 < e_2 < ... < e_n\)，把\(S\)的元素建一棵二叉搜索树，希望查询频率越高的元素离根越近。
访问树中元素\(e_i\)的成本\(cost(e_i)\)等于从根到该元素结点的路径边数。给定元素的查询频率\(f(e_1)，f(e_2)，...，f(e_n)\)，定义一棵树的总成本是：
\(f(e_1) ∗cost(e_1) + f(e_2) ∗cost(e_2) + ... + f(e_n) ∗ cost(e_n)\)
总成本最低的树就是最优二叉搜索树。
输入：
输入包含多个实例，每行一个。每行以\(1≤n≤250\)开头，表示\(S\)的大小。在\(n\)之后，在同一行中，有\(n\)个非负整数，它们表示元素的查询频率，\(0 ≤ f(e_i) ≤ 100\)。
输出：
对于输入的每个实例，输出一行，打印最优二叉搜索树的总成本。
样例输入：
1 5
3 10 10 10
3 5 10 20
样例输出：
0
20
20

题解：
二叉搜索树（BST）的特点是每个结点的值，比它的左子树上所有结点的值大，比右子树上所有值小。二叉搜索树的中序遍历，是从小到大的排列。第3个样例的最优二叉搜索树的形状见下图，它的总成本是\(5*2+10*1=20\)。

图6 二叉搜索树

题目给的元素已经按照从小到大排列，可以方便地组成一棵BST。
设\(dp[i][j]\)是区间\([i, j]\)的元素组成的BST的最小值。把区间\([i, j]\)分成两部分\([i, k-1]\)和\([k+1, j]\)，\(k\)在\(i\)和\(j\)之间滑动。用区间\([i, j]\)建立的二叉树，\(k\)是根结点。这是典型的区间DP，状态转移方程：
\(dp[i][j] = min\{dp[i][k-1] + dp[k+1][j] + w(i, j) - e[k]\}\)
\(w(i, j)\)是区间和，\(w(i, j) = f_i +f_{i+1}+...+ f_j\)。当把两棵左右子树连在根结点上时，本身的深度增加\(1\)，所以每个元素都多计算一次，这样就解决了\(cost(e_i)\)的计算。最后，因为根节点\(k\)的层数是0，所以减去根节点的值\(e[k]\)。
w(i, j)符合四边形不等式优化的条件，所以\(dp[i][j]\)可以用四边形不等式优化。

8.3 其他题目
很多区间DP问题都能用四边形不等式优化。
hdu 3516 Tree Construction http://acm.hdu.edu.cn/showproblem.php?pid=3516
hdu 2829 Lawrence http://acm.hdu.edu.cn/showproblem.php?pid=2829
hdu 3506 Monkey Party http://acm.hdu.edu.cn/showproblem.php?pid=3506
洛谷P1912 诗人小G https://www.luogu.com.cn/problem/P1912
洛谷 P4767 邮局 https://www.luogu.com.cn/problem/P4767
HDU 3480 Division http://acm.hdu.edu.cn/showproblem.php?pid=3480

Donald E. Knuth. Optimum binary search trees. Acta Informatica, 1:14–25, 1971. ↩︎
F. Frances Yao. Efficient dynamic programming using quadrangle inequalities. In Proceedings of the 12th Annual ACM Symposium on Theory of Computing, pages 429–435, 1980.
论文下载：http://www.cs.ust.hk/mjg_lib/bibs/DPSu/DPSu.Files/p429-yao.pdf ↩︎
参考《算法竞赛入门到进阶》7.3节区间DP，“石子合并”问题。 ↩︎
读者可以自己证明。证明过程参考《算法竞赛进阶指南》李煜东，河南电子音像出版社，329页，“0x5B 四边形不等式”。 ↩︎

算法竞赛专题解析（10）：DP优化(1)--四边形不等式