LIS&LCS总结(最长上升子序列与最长公共子序列)

\(LIS\)

首先区分一组概念
子序列:一个序列的子集,可以是连续也可以是不连续的。
子串:一个序列的子集,必须是连续的。
最长上升子序列的意思就不多说了

\(1.\)朴素做法\(O(n^2)\)

\(dp[i]\)表示以\(i\)为结尾的最长子序列的长度
在遍历的同时让\(j\)\(1到i-1\)遍历,如果\(a[i]>a[j]\)那么\(dp[i]=max(dp[i],dp[j]+1)\),这是很显然的,由前面的状态转移而来
最终答案\(ans=max(ans,dp[i])\)

\(Code\)

    for(int i=1;i<=n;i++)
    {
        dp[i]=1;//初始化 
        for(int j=1;j<i;j++)//枚举i之前的每一个j 
        if(data[j]<data[i] && dp[i]<dp[j]+1)
        //用if判断是否可以拼凑成上升子序列,
        //并且判断当前状态是否优于之前枚举
        //过的所有状态,如果是,则↓ 
        dp[i]=max(dp[i],dp[j]+1);//更新最优状态 

    }

\(2.\)贪心+二分\(O(logn)\)

对于上面的\(n^2\)代码我们会发现相当于枚举了所以转移,其中包括很多无意义的转移
我们用\(dp[len]\)表示长度为\(len\)的最长上升子序列的末尾项的最小值
为什么是最小值呢,我们一会说
我们还是遍历这个序列,初始默认把\(dp\)数组赋值为\(INF\)\(len=1,dp[1]=a[1]\),同时记录\(len\)的变化,当\(a[i]>dp[len]\)时就代表这个数可以接上去,于是\(dp[++len]=a[i]\)
很显然,我们这么做使得\(dp[i]\)单调递增
那么当\(a[i]<=dp[len]\)时,我们不能接上去,但我们可以考虑把\(dp[i]\)换掉\((dp[i]>a[i],i<=len)\),为什么要这么做呢,因为我们替换掉之后它更小了,具有更大的更新后面的潜力
为了满足正确性,我们需要将大于他的最小的\(dp[i]\)替换掉,那么很明显我们可以用二分得出那个位置,整个程序时间复杂度\(O(nlogn)\)
为了方便理解,下面放几张图
数据:
11
1 2 3 100 101 4 5 6 7 8 9



接上去



二分发现100是比4大的最小值,是替换的值,我们发现这里替换对后面的答案其实是有贡献的,当前结尾的值越小,越有可能更新后面的

因为100已经没了,所以这次二分的位置是101

后面是索然无味的不停往后接,就不放图了,明显最长长度为9。

\(Code\)

#include<cstdio>
#include<iostream>
#include<cstring>
#define maxn 10010
#define re register
#define inf 0x3f3f3f3f
using namespace std;
int dp[maxn],n,a[maxn],len=1;
int main()
{
    scanf("%d",&n);
    memset(dp,inf,sizeof(dp));
    for(re int i=1;i<=n;++i)
    {
        scanf("%d",&a[i]);
    }
    dp[1]=a[1];
    for(re int i=2;i<=n;++i)
    {
        int l=1,r=len,mid;
        if(a[i]>dp[len]) dp[++len]=a[i];
        else
        {
            while(l<=r)
            {
                mid=(l+r)>>1;
                if(dp[mid]>a[i]) r=mid-1;
                else l=mid+1;
            }
        //  if(l<=0) l=1;
            dp[l]=a[i];
        }
    }
    printf("%d",len);
    return 0;
}

求解的个数及输出路径问题

求解的个数问题比较简单(在\(O(n^2)DP\)中),我们在\(DP\)结束后\(n^2\)遍历\(dp\)数组,如果\(dp[j]=dp[i]-1&&a[j]<a[i]\),那么说明\(dp[i]\)可以由\(dp[j]\)转移而来,这时候让\(ans[i]+=ans[j]即可\)
最后对于每一个符合最大长度的结尾相加即可

#include <cstdio>
#include <algorithm>
 
using namespace std;
 
const int MAXN = 1000;
typedef pair<int, int> P;
 
int a[MAXN];
P dp[MAXN];     //dp[i].first表示以a[i]结尾的最长上升子序列长度,dp[i].second表示满足该长度的子序列个数
 
int main()
{
    //输入序列
    int n;
    scanf("%d", &n);
    for (int i = 0; i < n; i++) {
        scanf("%d", &a[i]);
    }
    
    int lis = 0;
    for (int i = 0; i < n; i++) {
        dp[i].first = 1;
        for (int j = 0; j < i; j++) {
            if (a[j] < a[i]) {
                dp[i].first = max(dp[i].first, dp[j].first + 1);
            }
        }
        
        //满足最长上升子序列长度的序列个数为长度为dp[i].first-1且a[j]<a[i]的个数
        //即将a[i]填入长度为dp[i].first-1的序列末尾
        for (int j = i - 1; j >= 0; j--) {
            if (dp[j].first == dp[i].first - 1 && a[j] < a[i]) {
                dp[i].second+=dp[j].second;
            }
        }
        
        lis = max(lis, dp[i].first);
    }
    
    printf("%d\n", lis);
    
    int ans = 0;
    for (int i = 0; i < n; i++) {
        if (dp[i].first == lis) {
            ans += dp[i].second;
        }
    }
    
    printf("%d\n", ans);
    
    return 0;
}

输出路径:只要记录前驱,然后递归输出即可

#include <iostream>
using namespace std;
const int MAXN = 1000 + 10;
int n, data[MAXN];
int dp[MAXN]; 
int from[MAXN]; 
void output(int x)
{
    if(!x)return;
    output(from[x]);
    cout<<data[x]<<" ";
    //迭代输出 
}
int main()
{
    cin>>n;
    for(int i=1;i<=n;i++)cin>>data[i];

    // DP
    for(int i=1;i<=n;i++)
    {
        dp[i]=1;
        from[i]=0;
        for(int j=1;j<i;j++)
        if(data[j]<data[i] && dp[i]<dp[j]+1)
        {
            dp[i]=dp[j]+1;
            from[i]=j;//逐个记录前驱 
        }
    }

    int ans=dp[1], pos=1;
    for(int i=1;i<=n;i++)
        if(ans<dp[i])
        {
            ans=dp[i];
            pos=i;//由于需要递归输出
    //所以要记录最长上升子序列的最后一
    //个元素,来不断回溯出路径来 
        }
    cout<<ans<<endl;
    output(pos);

    return 0;
}

\(LCS\)问题

\(LCS\)问题是求两个序列最长的公共子序列,也不一定是连续的
看下面的样例

\(1,4,5\)这个序列在序列\(A,B\)中都存在,是公共子序列,而且是最长的,所以就是我们要求的最长公共子序列

\(O(nm)DP\)

\(dp[i][j]\)表示在第一个串的前\(i\)位和第二个串的前\(j\)位匹配的最长公共子序列
首先我们是在逐个比较,一位一位往前挪动,所以状态的继承应该为\(dp[i][j]=max(dp[i-1][j],dp[i][j-1])\)
如果相同的话,可以由比较的上一位继承而来,也就是\(dp[i][j]=max(dp[i][j],dp[i-1][j-1]+1)\)

那么为什么不能是\(dp[i][j]++\)呢,这有一个反例:

\(s1:a\) \(s2:aa\)

很明显\((1,2)\)的正确答案应该是\(1\),如果由\((1,1)\)继承而来再\(++\)的话就会变成\(2\)
下面是这个过程的流程图

\(Code\)

#include<iostream>
using namespace std;
int dp[1001][1001],a1[2001],a2[2001],n,m;
int main()
{
    //dp[i][j]表示两个串从头开始,直到第一个串的第i位 
    //和第二个串的第j位最多有多少个公共子元素 
    cin>>n>>m;
    for(int i=1;i<=n;i++)scanf("%d",&a1[i]);
    for(int i=1;i<=m;i++)scanf("%d",&a2[i]);
    for(int i=1;i<=n;i++)
     for(int j=1;j<=m;j++)
      {
        dp[i][j]=max(dp[i-1][j],dp[i][j-1]);
        if(a1[i]==a2[j])
        dp[i][j]=max(dp[i][j],dp[i-1][j-1]+1);
        //因为更新,所以++; 
      }
    cout<<dp[n][m];
}

例题:\(Luogu P1439\)


题目大意:给出\(1-n\)的两个排列\(P1\)\(P2\),求它们的最长公共子序列。
\(n≤100000\)

这道题用\(O(nm)DP\)明显不行,
我们寻找条件发现题目中说这两个序列都是\(1-n\)的排列,也就是说,将序列\(A , B\)间相同的元素连边,会形成一一对应的映射关系,我们可以用\(map\)数组记录这种映射关系

上方红字表示\(map\)数组

因为最长公共子序列是按位向后比对的,所以a序列每个元素在b序列中的位置如果递增,就说明b中的这个数在a中的这个数整体位置偏后

换而言之,因为\(a\)数组的下标是单调上升的,如果\(map\)数组表示的映射也就是相同的数在\(b\)中的位置也是单调上升的,那么就一定可以构成公共子序列

要求最长公共子序列,只需要在\(map\)数组中求最长上升子序列即可。复杂度\(O(nlogn)\)

当然这种做法仅仅适用于这种特殊题目,当不存在这种一一映射关系时,这种方法能使用。

\(Code\)

#include<cstdio>
#include<iostream>
#include<cstring>
#define maxn 100001
#pragma GCC optimize(3)
#define re register
using namespace std;
int a[maxn],b[maxn],c[maxn],dp[maxn],n,len=1;
int main()
{
    scanf("%d",&n);
    for(re int i=1;i<=n;++i){scanf("%d",&a[i]);}
    for(re int i=1;i<=n;++i){scanf("%d",&b[i]);c[b[i]]=i;}
    memset(dp,0x3f3f3f3f,sizeof(dp));
    dp[1]=c[a[1]];
    for(re int i=2;i<=n;++i)
    {
        int l=1,r=len,mid;
        if(c[a[i]]>dp[len]) dp[++len]=c[a[i]];
        else
        {
            while(l<=r)
            {
                mid=(l+r)>>1;
                if(dp[mid]>c[a[i]]) r=mid-1;
                else l=mid+1;
            }
            dp[l]=c[a[i]];
        }
    }
    
    printf("%d",len);
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/Liuz8848/p/11226435.html
今日推荐