一、前言

1.给定一个n个矩阵的序列（矩阵链）（A1,A2,…,An），我们希望计算它们的乘积 A1A2…An
为了计算表达式，我们可以先用括号明确计算次序，然后利用标准的矩阵相乘算法进行计算。完全括号化(fully parenthesized)：它是单一矩阵，或者是两个完全括号化的矩阵乘积链的积。
例如如果有矩阵链为（A1,A2,A3,A4）,则共有5种完全括号化的矩阵乘积链。
(A1(A2(A3A4)))、(A1((A2A3)A4))、((A1A2)(A3A4))、((A1(A2A3))A4)、((A1(A2A3))A4)

二、两矩阵相乘

对矩阵链加括号的方式会对乘积运算的代价产生巨大影响。我们先来分析两个矩阵相乘的代价。下面的伪代码的给出了两个矩阵相乘的标准算法，属性rows和columns是矩阵的行数和列数。


MATRIX-MULTIPKLY(A,B)
if A.columns≠B.rows 
    error "incompatible dimensions"
else let C be a new A.rows×B.columns matrix
    for i = 1 to A.rows
         for j = 1 to B.columns
          c(ij)=0
           for k = 1 to A.columns
             c(ij)=c(ij)+a(ik)*b(kj)
return C

2.下面是两矩阵相乘算法的C++语言实现：

#include<iostream>
#include<vector>//容器
#include<ctime>//包含srand()和rand()，用于生成随机数
#include<iomanip>//包含输出格式控制函数
using namespace std;

//如果觉得二维容器书写太麻烦可以用typedef取别名替换。
//typedef vector<vector<int>> tdvec;

//计算两矩阵相乘的函数，Matrix：矩阵，multiply：相乘
vector<vector<int>> TwoMatrixMultiply(vector<vector<int>>a, vector<vector<int>>b);
//容器随机数初始化函数
int VectorRandomInit(vector<vector<int>>& v);

int main()
{
    vector<int>t1(3,0);
    vector<int>t2(4,0);
    vector<vector<int>>a(2,t1);
    vector<vector<int>>b(3,t2);

    VectorRandomInit(a);//用随机数初始化矩阵a
    VectorRandomInit(b);//用随机数初始化矩阵b

    vector<vector<int>>c;
    c=TwoMatrixMultiply(a,b);

    cout<<"两矩阵相乘的结果矩阵为："<<endl;
    //控制输出格式为左对齐
    cout<<setiosflags(ios::left);
    for(int i=1;i<=a.size();i++){
        for(int j=1;j<=b[0].size();j++){
            cout<<setw(4)<<c[i-1][j-1];
        }
        cout<<endl;
    }

    return 0;
}

//容器随机数初始化函数
int VectorRandomInit(vector<vector<int>>& v)
{
    cout<<"随机数生成的"<<v.size()<<"X";
    cout<<v[0].size()<<"矩阵如下："<<endl;
    cout<<setiosflags(ios::left);
    srand((unsigned)time(NULL));//利用系统时间获取随机数种子
    //v.size()是容器v对应的行数，v[0].size()计算容器的列数
    for(int i=0;i<v.size();i++){
        for(int j=0;j<v[0].size();j++){
            v[i][j]=rand()%10;//产生[0,10)的随机数
            cout<<setw(4)<<v[i][j];
        }
        cout<<endl;
    }
    cout<<endl;
    return 0;
}

//两矩阵相乘函数
vector<vector<int>> TwoMatrixMultiply(vector<vector<int>>a, vector<vector<int>>b)
{
    if(a[0].size() != b.size()){
        printf("error");
        vector<vector<int>>c;
        return c;
    }
    else{
        vector<int>t(b[0].size(),0);
        vector<vector<int>>c(a.size(),t);
        for(int i=1;i<=a.size();i++){
            for(int j=1;j<=b[0].size();j++){
                int s=0;
                for(int k=1;k<=a[0].size();k++){
                    s+=a[i-1][k-1]*b[k-1][j-1];
                }
                c[i-1][j-1]=s;
            }
        }
        return c;
    }
}

两个矩阵A和B只有相容(compatible)，即A的列数等于B的行数时，才能相乘。如果A是p×q的矩阵，B是q×r的矩阵，那么乘积C是p×r的矩阵。计算C所需要时间由第8行的标量乘法的次数决定的，即pqr。
以矩阵链（A1,A2,A3）为例，来说明不同的加括号方式会导致不同的计算代价。假设三个矩阵的规模分别为10×100、100×5和5×50。
如果按照((A1A2)A3)的顺序计算，为计算A1A2(规模10×5)，需要做10*100*5=5000次标量乘法，再与A3相乘又需要做10*5*50=2500次标量乘法，共需7500次标量乘法。
如果按照(A1(A2A3))的顺序计算，为计算A2A3(规模100×50)，需100*5*50=25000次标量乘法，再与A1相乘又需10*100*50=50000次标量乘法，共需75000次标量乘法。因此第一种顺序计算要比第二种顺序计算快10倍。
矩阵链乘法问题(matrix-chain multiplication problem)可描述如下：给定n个矩阵的链（A1,A2,…,An），矩阵Ai的规模为p(i-1)×p(i) (1<=i<=n)，求完全括号化方案，使得计算乘积A1A2…An所需标量乘法次数最少。
因为括号方案的数量与n呈指数关系，所以通过暴力搜索穷尽所有可能的括号化方案来寻找最优方案是一个糟糕策略。

三、动态规划法求矩阵链乘法

下面用动态规划方法来求解矩阵链的最优括号方案，我们还是按照之前提出的4个步骤进行：
1.刻画一个最优解的结构特征
2.递归地定义最优解的值
3.计算最优解的值，通常采用自底向上的方法(最优实施方案所求出的代价)
4.利用计算出的信息构造一个最优解(最优实施方案)
接下来按顺序进行这几个步骤，清楚地展示针对本问题每个步骤应如何做。

步骤1：最优括号化方案的结构特征

动态规划的第一步是寻找最优子结构，然后就可以利用这种子结构从子问题的最优解构造出原问题的最优解。在矩阵链乘法问题中，我们假设A(i)A(i+1)…A(j)的最优括号方案的分割点在A(k)和A(k+1)之间。那么，继续对“前缀”子链A(i)A(i+1)..A(k)进行括号化时，我们应该直接采用独立求解它时所得的最优方案。
我们已经看到，一个非平凡(i≠j)的矩阵链乘法问题实例的任何解都需要划分链，而任何最优解都是由子问题实例的最优解构成的。为了构造一个矩阵链乘法问题实例的最优解，我们可以将问题划分为两个子问题(A(i)A(i+1)…A(k)和A(k+1)A(k+2)..A(j)的最优括号化问题)，求出子问题实例的最优解，然后将子问题的最优解组合起来。我们必须保证在确定分割点时，已经考察了所有可能的划分点，这样就可以保证不会遗漏最优解。

步骤2：一个递归求解方案

下面用子问题的最优解来递归地定义原问题最优解的代价。对于矩阵链乘法问题，我们可以将对所有1<=i<=j<=n确定A(i)A(i+1)…A(j)的最小代价括号化方案作为子问题。令m[i,j]表示计算矩阵A(i..j)所需标量乘法次数的最小值，那么，原问题的最优解—计算A(1..n)所需的最低代价就是m[1,n]。
我们可以递归定义m[i,j]如下。对于i=j时的平凡问题，矩阵链只包含唯一的矩阵A(i..j)=A(i)，因此不需要做任何标量乘法运算。所以，对所有i=1,2,…,n，m[i,i]=0。若i< j，我们利用步骤1中得到的最优子结构来计算m[i,j]。我们假设A(i)A(i+1)…A(j)的最优括号化方案的分割点在矩阵A(k)和A(k+1)之间，其中i<=k< j。那么，m[i,j]就等于计算A(i..k)和A(k+1..j)的代价加上两者相乘的代价的最小值。由于矩阵Ai的大小为p(i-1)*pi，易知A(i..k)和A(k+1..j)相乘的代价为p(i-1)p(k)p(j)次标量乘法运算。因此，我们得到
m[i,j]=m[i,k]+m[k+1,j]+ p(i-1)p(k)p(j)
此递归公式假定最优分割点k是已知的，但实际上我们是不知道。不过，k只有j-i种可能的取值，即k=i,i+1,…,j-1。由于最优分割点必在其中，我们只需检查所有可能情况，找到最优者即可。
因此，A(i)A(i+1)…A(j)的最小代价括号化方案的递归求解公式变为：
①如果i=j，m[i,j]=0
②如果i< j，m[i,j]=min{m[i,k]+m[k+1,j]+p(i-1)p(k)p(j)} i<=k< j
m[i,j]的值给出了子问题最优解的代价，但它并未提供足够的信息来构造最优解。为此，我们用s[i,j]保存最优括号化方案的分割点位置k，即使得m[i,j]=m[i,k]+[k+1,j]+p(i-1)p(k)p(j)成立的k值。

步骤3：计算最优代价

现在，我们可以很容易地基于递归公式写出一个递归算法，但递归算法是指数时间的，并不必检查若有括号化方案的暴力搜索方法更好。注意到，我们需要求解的不同子问题的数目是相对较少的：每对满足1<=i<=j<=n 的i和j对应一个唯一的子问题，共有n^2(最少)。递归算法会在递归调用树的不同分支中多次遇到同一个子问题。这种子问题重叠的性质是应用动态规划的另一标识(第一个标识是最优子结构)。
我们采用自底向上表格法代替递归算法来计算最优代价。此过程假定矩阵Ai的规模为p(i-1)×pi(i=1,2,…,n)。它的输入是一个序列p=< p0,p1,…,pn >，其长度为p.length=n+1。过程用一个辅助表m[1..n,1..n]来保存代价m[i,j]，用另一个辅助表s[1..n-1,2..n](s[1,2]..s[n-1,n]这里i< j)记录最优值m[i,j]对应的分割点k。我们就可以利用表s构造最优解。
对于矩阵A(i)A(i+1)…A(j)最优括号化的子问题，我们认为其规模为链的长度j-i+1。因为j-i+1个矩阵链相乘的最优计算代价m[i,j]只依赖于那么少于j-i+1个矩阵链相乘的最优计算代价。因此，算法应该按长度递增的顺序求解矩阵链括号化问题。C++代码实现如下：

#include<iostream>
//容器
#include<vector>
using namespace std;

//用于存放最优代价和最优分割方案
class MatrixAndPrint{
public:
    vector<vector<int>>m;
    vector<vector<int>>s;
};
//求解矩阵链最优分割方案和最少代价
MatrixAndPrint MatrixChainOrder(vector<int>p);
//打印最佳括号分割方案
int PrintOptimalParens(vector<vector<int>>s, int i, int j);

int main()
{
    vector<int>p(7,0);
    int a[7]={30,35,15,5,10,20,25};
    for(int i=0;i<p.size();i++){
        p[i]=a[i];
    }
    MatrixAndPrint ms;
    ms=MatrixChainOrder(p);
    cout<<ms.m[1][6]<<endl;
    PrintOptimalParens(ms.s, 1, 6);
    return 0;
}

//求解矩阵链最优分割方案和最少代价
MatrixAndPrint MatrixChainOrder(vector<int>p)
{
    int n=p.size()-1;
    vector<int>t(n+1,0);
    vector<vector<int>>m(n+1,t);
    vector<vector<int>>s(n+1,t);
    for(int l=2;l<=n;l++){
        for(int i=1;i<=n-l+1;i++){
            int j=i+l-1;
            m[i][j]=0x7ffffffe;
            for(int k=i;k<=j-1;k++){
                int q=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
                if(m[i][j]>q){
                    m[i][j]=q;
                    s[i][j]=k;
                }
            }
        }
    }
    MatrixAndPrint ms;
    ms.m=m;
    ms.s=s;
    return ms;
}

//打印最优括号分割方案
int PrintOptimalParens(vector<vector<int>>s, int i, int j)
{
    if(i==j){
        cout<<"A"<<i;
    }
    else{
        cout<<"(";
        PrintOptimalParens(s, i, s[i][j]);
        PrintOptimalParens(s, s[i][j]+1, j);
        cout<<")";
    }
    return 0;
}

步骤4：构造最优解

1.虽然MATRIX_CHAIN_ORDER求出了计算矩阵链乘积所需的最少标量乘法运算次数，但它并未直接指出如何进行这种最优代价的矩阵链乘法计算。表s[i,j]记录了一个k值，指出A(i)A(i+1)…A(j)的最优括号化方案的分割点应在A(k)和A(k+1)之间。

因此，我们A(1..n)的最优计算方案中最后一次矩阵乘法运算应该是以s[1,n]为分界的A(1..s[1,n])*A(s[1,n]+1..n)。我们可以用相同的方法递归地求出更早的矩阵乘法的具体计算过程，因为s[1,s[1,n]]指出了计算A(1..s[1,n])时应进行的最后一次矩阵乘法运行；s[s[1,n]+1,n]指出了计算A(s[1,n]+1..n)时应进行的最后一次矩阵乘法运算。下面给出的递归过程可以输出< A(i),A(i+1),…,A(j) >的最优括号化方案。


void PRINT_OPTIMAL_PARENS(int s[][M],int i,int j)
{
    if(i == j) cout<<"A"<<i;
    else
    {
        cout<<"(";
        PRINT_OPTIMAL_PARENS(s,i,s[i][j]);
        PRINT_OPTIMAL_PARENS(s,s[i][j]+1,j);
        cout<<")";
    }
}

2.C++代码实现：

int PrintOptimalParens(vector<vector<int>>s, int i, int j)
{
    if(i==j){
        cout<<"A"<<i;
    }
    else{
        cout<<"(";
        PrintOptimalParens(s, i, s[i][j]);
        PrintOptimalParens(s, s[i][j]+1, j);
        cout<<")";
    }
    return 0;
}

动态规划二：矩阵链乘法