引入

四边形不等式应用于DP优化，相信大家大多是接触区间DP问题才看到了这个知识点，关于它的起源，网上绝大多数文章都没有提到，这个问题最初来源于高德纳(Knuth)教授1971年研究最优二叉搜索树问题的一篇论文，后来储枫教授深入研究了这个东西，并在1980年提出并证明了它，四边形不等式可以将区间DP从O(n³)的时间复杂度优化到O(n²)

内容

不等式介绍

首先什么是四边形不等式呢？设w是整数定义下的一个二元函数，形式如下
$设a\leq b\leq c\leq d$ $有w(a,c)+w(b,d)\leq w(a,d)+w(b,c)$
在一般的文章中都使用的是i、i’、j、j’这四个元素，比较正规，但是 ’ 这个符号不太好辨认，所以这里我用a,b,c,d代替
为什么叫四边形不等式？我画一个四边形如下
在这个四边形里面， $ad+bc\gt ac+bd$ 显然成立，为什么？考虑 $\triangle oac$ 和 $\triangle obd$ ，根据三角形性质，显然有 $oa+oc\gt ac$ $ob+od\gt bd$ 两边分别相加有 $oa+od+oc+ob\gt ac+bd$ 也就是 $ad+bc\gt ac+bd$ ，那什么时候相等，当abcd四点共线的时候相等，这也就是四边形不等式 $ad+bc\geq ac+bd$

优化DP

最常见的区间DP问题是石子合并问题，可以参考洛谷上面的石子合并这道题是区间DP问题，N只有100，O(n³)也可以，但是HDU上面还有一道类似问题题目链接，这道题n的范围放到了1000，这时候O(n³)显然不行，那么需要进行优化。这两道题属于环形区间DP问题，其实也不是很友好，但是由于HDU这道题数据比较强，所以还是以这两道题作为例子。首先给出这道题不优化的程序，

#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <vector>
#include <cmath>
#include <queue>
#include <stack>
#include <map>
using namespace std;
typedef long long ll;
const int INF = 0x3f3f3f3f;
const int MAXN = 1e6 + 100;
const double eps = 1e-6;
int Data[MAXN];
int SUM[MAXN];
int dp[2050][2050];
int s[2050][2050];
int main(){
    
    
    int n;
    while(cin >> n){
    
    
        for(int i=1;i<=n;i++){
    
    
            cin >> Data[i];
            Data[i + n] = Data[i];
        }
        for(int i=1;i<=2*n;i++){
    
    
            SUM[i] = SUM[i - 1] + Data[i];
        }
        for(int i=1;i<=2*n;i++){
    
    
            dp[i][i] = 0;
        }
        for(int len = 1; len < n; len++){
    
    
            for(int i=1;i<=2*n-len;i++){
    
    
                int j=i+len;
                dp[i][j] = INF;
                for(int k=i;k<j;k++){
    
    
                    dp[i][j] = min(dp[i][j], dp[i][k] + dp[k + 1][j] + SUM[j] - SUM[i - 1]);
                }
            }
        }
        int ans = INF;
        for(int i=1;i<=n;i++){
    
    
            ans = min(ans, dp[i][i + n - 1]);
        }
        cout << ans << "\n";
    }
    return 0;
}

上面的程序是区间DP问题的一般性框架，可以看到，第一圈for循环是区间长度，不可省略，第二圈for循环是区间的左端点，也不能省略，这两圈是必要的，那么唯一可以优化的就是第三圈的for，这个for是在干嘛呢，这个for循环的作用是寻找区间 $[i, j]$ 内的最优分割点，四边形优化就是在这里将 $[i, j]$ 缩小，设 $d p [i, j]$ 表示动态规划的一个状态量，定义 $s [i, j]$ 为 $d p [i, j]$ 取得最小值对应的 $k$ 值，可以证明 $s[i][j-1]\leq s[i][j]\leq s[i+1][j]$ 也就是 $s[i][j-1]\leq k\leq s[i+1][j]$ 利用这个不等式，我们可以将k的枚举范围从 $[i, j]$ 缩小到 $[s [i] [j - 1], s [i + 1] [j]]$ ，优化后的程序如下

#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <vector>
#include <cmath>
#include <queue>
#include <stack>
#include <map>
using namespace std;
typedef long long ll;
const int INF = 0x3f3f3f3f;
const int MAXN = 1e6 + 100;
const double eps = 1e-6;
int Data[MAXN];
int SUM[MAXN];
int dp[2050][2050];
int s[2050][2050];
int main(){
    
    
    int n;
    while(cin >> n){
    
    
        for(int i=1;i<=n;i++){
    
    
            cin >> Data[i];
            Data[i + n] = Data[i];
        }
        for(int i=1;i<=2*n;i++){
    
    
            SUM[i] = SUM[i - 1] + Data[i];
        }
        for(int i=1;i<=2*n;i++){
    
    
            dp[i][i] = 0;
            s[i][i] = i;
        }
        for(int len = 1; len < n; len++){
    
    
            for(int i=1;i<=2*n-len;i++){
    
    
                int j=i+len;
                dp[i][j] = INF;
                for(int k=s[i][j-1];k<=s[i+1][j];k++){
    
    
                    int tmp = dp[i][k] + dp[k + 1][j] + SUM[j] - SUM[i - 1];
                    if(dp[i][j] > tmp){
    
    
                        dp[i][j] = tmp;
                        s[i][j] = k;
                    }
                }
            }
        }
        int ans = INF;
        for(int i=1;i<=n;i++){
    
    
            ans = min(ans, dp[i][i + n - 1]);
        }
        cout << ans << "\n";
    }
    return 0;
}

这样就可以通过这道题

原理证明

下面讨论的都是取最小值的四边形优化。下面来证明 $s[i][j-1]\leq s[i][j]\leq s[i+1][j]$ 考虑右侧不等号
设 $m_k[i,j]=m[i,k]+m[k,j]$ $s [i] [j] = d$ 如果说 $d$ 是最优分割，因为取得是最小值，那么应该有 $m_k[i,j]\geq m_d[i,j]$ 现在 $d$ 是最优分割，那么扩展到下一个区间的时候， $d$ 也仍然应该是最优分割，也就是 $m_k[i+1,j]\geq m_d[i+1,j]$ 仍然成立，那么根据数学归纳法，如果能够证明这个式子，也就能够说明 $s[i][j]\leq s[i+1][j]$ ，注意根据数学归纳法，我们现在已知条件是 $m_k[i,j]\geq m_d[i,j]$ ，要证明的是 $m_k[i+1,j]\geq m_d[i+1,j]$
将这两个式子整体作差，得到
$m_k[i+1,j]-m_d[i,j])-(m_k[i,j]-m_d[i,j])$ 根据 $m_k[i+1,j]=m[i+1,k]+m[k,j]$ $m_k[i,j]=m[i,k]+m[k,j]$ $m_d[i+1,j]=m[i+1,d]+m[d,j]$ $m_d[i,j]=m[i,d]+m[d,j]$ 全部代入化简得到 $m [i + 1, k] - m [i, k] + m [i, d] - m [i + 1, d]$ 因为 $i\lt i+1\leq k\leq d$ 根据四边形不等式，有 $m[i,k]+m[i+1,d]\leq m[i,d]+m[i+1,k]$ 整理得到 $m[i+1.k]-m[i,k]+m[i,d]-m[i+1,d]\geq 0$ 正好对应刚才的化简结果，而这个结果正好对应着 $m_k[i+1,j]-m_k[i,j]\geq m_d[i+1,j]-m_d[i,j]$ 再移项，回头看一眼已知条件，可以得到 $m_k[i+1,j]-m_d[i+1,j]\geq m_k[i,j]-m_d[i,j]\geq 0$ 也就是 $m_k[i+1,j]\geq m_d[i+1,j]$
右侧 $\leq$ 证明完成，左侧 $\leq$ 证明方式类似，只不过改为考虑 $j$ 而不是 $i$

时间复杂度分析

这三层 $f o r$ 循环最外侧是 $O (n)$ 的，现在考虑内侧两层 $f o r$ ，这里还是以石子合并问题作为例子，但是降低难度，不要环形，改成直线，程序如下

#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <vector>
#include <cmath>
#include <queue>
#include <stack>
#include <map>
using namespace std;
typedef long long ll;
const int INF = 0x3f3f3f3f;
const int MAXN = 1e6 + 100;
const double eps = 1e-6;
int Data[MAXN];
int SUM[MAXN];
int dp[2050][2050];
int s[2050][2050];
int main(){
    
    
    int n;
    while(cin >> n){
    
    
        for(int i=1;i<=n;i++){
    
    
            cin >> Data[i];
            Data[i + n] = Data[i];
            SUM[i] = SUM[i - 1] + Data[i];
            dp[i][i] = 0;
            s[i][i] = i;
        }
        for(int len = 1; len < n; len++){
    
    
            for(int i=1;i<=n-len;i++){
    
    
                int j=i+len;
                dp[i][j] = INF;
                for(int k=s[i][j-1];k<=s[i+1][j];k++){
    
    
                    int tmp = dp[i][k] + dp[k + 1][j] + SUM[j] - SUM[i - 1];
                    if(dp[i][j] > tmp){
    
    
                        dp[i][j] = tmp;
                        s[i][j] = k;
                    }
                }
            }
        }
        cout << dp[1][n] << "\n";
    }
    return 0;
}

考虑内侧两层 $f o r$ ，每个 $k$ 的循环次数是 $s [i + 1 [j] - s [i] [j - 1] + 1$ 次，那么经过 $n - l e n$ 次循环过后，内侧两层 $f o r$ 循环次数为（累加） $\sum_{i=1}^{n-len}s[i+1][j]-s[i][j-1]+1=s[2][j]-s[n-len][j-1]+n-len$ $= n - l e n + s [2] [j] - s [n - l e n] [j - 1]$ n后面都是常数，所以内侧两层 $f o r$ 的时间复杂度是 $O (n)$ ，所以三层 $f o r$ 总的时间复杂度为 $O(n^2)$

总结

上面的证明是比较粗略的，储枫教授在她的论文中详细证明了四边形不等式在DP上面的应用，里面用到了几个引理，证明的过程很多，非常完整详细，如果想深入研究可以拿来作为参考，论文是全英的。其实也没有必要弄通它的全部，还是那句话，吾生也有涯，而知也无涯，以有涯逐无涯，殆矣。

参考文献

算法竞赛入门到进阶区间DP
罗老师的博客https://blog.csdn.net/weixin_43914593/article/details/105150937
百度百科

四边形优化原理

四边形不等式

引入

内容

不等式介绍

优化DP

原理证明

时间复杂度分析

总结

参考文献

猜你喜欢