最长公共子序列(DP,动态规划)

最长公共子序列

题目描述
给你一个序列X和另一个序列Z,当Z中的所有元素都在X中存在,并且在X中的下标顺序是严格递增的,那么就把Z叫做X的子序列。
例如:Z=<a,b,f,c>是序列X=<a,b,c,f,b,c>的一个子序列,Z中的元素在X中的下标序列为<1,2,4,6>。
现给你两个序列X和Y,请问它们的最长公共子序列的长度是多少?

输入
输入包含多组测试数据。每组输入占一行,为两个字符串,由若干个空格分隔。每个字符串的长度不超过100。

输出
对于每组输入,输出两个字符串的最长公共子序列的长度。

样例输入
abcfbc abfcab
programming contest
abcd mnp

样例输出
4
2
0

子序列:与原序列顺序相关的一个原序列的一个子集

例如:ABCSCY 的一个子序列 BSY

公共子序列即两个序列共有的一段子序列,例如ABCSCY和ABFSGP都有BSY序列

所以最长公共子序列即是两端字符串的公共子序列最长的一段

问题求解

1.暴力法

这里涉及到排列组合,与字符串的长度呈指数相关

2.动态规划

2.1找子问题,考虑两条子序列的最后一位

设A= a1,a2,a3,a4…ax B = b1,b2,b3,…by 求最长公共子序列Lcs(x,y)=Z=z1,z2…zm;Z的长度计为lcs(x,y)

(1)ax = by

假设Ax和By的最后一位 ax=by=t , 则 Z的最后一位Lcs(x,y)=zm=t

证明:(反证法)Lcs(x,y)的最后一位为Aa=Bb不为t,且a<x,b<y,则可以把t加到公共子序列的后面得到更长的序列,与假设矛盾

所以zm=t

有了zm=t 就可以得到 当Ax = By时 有 lcs(x,y) = lcs(x-1,y-1)+1

(2)Ax≠By

这里设Lcs(x,y)的最后一位为t

(2.1)t≠ax,有lcs(x,y)=lcs(x-1,y)

(2.2)t≠by,有lcs(x,y)=lcs(x,y-1)

由于两种情况都可能发生 所以根据最长公共子序列的定义 lcs(x,y)=max(lcs(x-1,y),lcs(x,y-1))

(3)当Ax或By为空序列的时候lcs(x,y)=0

所以得到以下递推关系式

lcs(x,y) =

(1)lcsx-1,y-1)+1(ax=by=t)

(2)max(lcs(x-1,y),lcs(x,y-1))(t≠ax,t≠by)

(3)0 Ax或By为空

找到了递推关系式,就有了两种想法:①利用递推关系式递归,从后往前退②利用动态规划,从前往后推,这里由于递推关系式中存在过多的重叠子问题例如:lcs(x-1,y)中就包括lcs(x-1,y-1)在求解的时候就会多次重复求解,造成时间复杂度提高,所以这里选择使用动态规划从前往后推,将子问题的解存储到数组中备用,从而降低时间复杂度

由上面的递推关系式很容易就会想到用一个二维数组c[m][n]存子问题的结果

以下是数组的递推表达式

由这个二维数组可以很容易得到最长公共子序列的长度,但如何得到最长功能公共子序列本身呢?

通过回溯二维数组,以下面这张图为例,我们可以很容易看到二维数组的求解过程

当发生ax=by=t时即图中斜箭头地方,记录发生位置打印字符,遍历完数组的时候,最长公共子序列也就打印完了、

在这里插入图片描述

#include<stdio.h>
#include<string.h>
int f(int a,int b)
{
    
    
    if(a>=b)
    return a;
    else
    return b;
}
int main()
{
    
    
    char a[101],b[101];
    int i,x,y,j,k,n,m,l;
    while(scanf("%s%s",a,b)!=EOF)
    {
    
    
        int t=0;int d[101][101];
        x=strlen(a),y=strlen(b);
        for(i=0;i<x;i++)
        for(j=0;j<y;j++)
        d[i][j]=0;
        for(i=1;i<=x;i++)
        {
    
    
            for(j=1;j<=y;j++)
          {
    
    
               
              if(a[i-1]==b[j-1])
               d[i][j]=d[i-1][j-1]+1;
               else
               d[i][j]=f(d[i-1][j],d[i][j-1]);//这里可以用C++的max函数
          } 
         
        }
        /*for(i=1;i<=x;i++)
        {
           for(j=1;j<=y;j++)
           printf("%d ",d[i][j]);
            printf("\n");
        }*/
        printf("%d\n",d[x][y]);
    }
    return 0;
}

猜你喜欢

转载自blog.csdn.net/m0_46381590/article/details/111417511