J - 后缀数组三·重复旋律3 HihoCoder - 1415

描述
小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后发现很多作品中的旋律有共同的部分。

旋律是一段连续的数列,如果同一段旋律在作品A和作品B中同时出现过,这段旋律就是A和B共同的部分,比如在abab 在 bababab 和 cabacababc 中都出现过。小Hi想知道两部作品的共同旋律最长是多少?

解题方法提示

×
解题方法提示
小Ho:这一次的问题该如何解决呢?

小Hi:嗯,这次的问题是经典的最长公共子串问题。

小Ho:我以前学过kmp,但是似乎不适用这道题目。

小Hi:是的。问题的关键就出在kmp求的是完整的匹配,而本题需要支持子串的匹配。

小Ho:那怎么用后缀数组解决呢?后缀数组求的是一个串的呀。

小Hi:对。但是你有没有想过可以把两个串拼起来成为一个串?

小Ho:啊!好妙的思路。

小Hi:我们不妨将两个串用一个没出现过的#字符隔开。对这个拼接串求后缀数组和height 数组。

扫描二维码关注公众号,回复: 2895927 查看本文章

小Ho:喔!既然height和两两后缀之间的最长公共前缀有关,那是不是height的最大值就是答案呀?

小Hi:只说对了一部分。直接这样子做是不对的。举个例子abab和a,我们对abab#a求后缀数组,得到:

suffix sa height belong
a 5 0 /
a 6 0 a
ab#a 3 1 abab
abab#a 1 2 abab
b#a 4 0 abab
bab#a 2 1 abab
我们发现height的最大值是2,而正确答案显然是1。

小Ho:这是为什么?

小Hi:由于例子中ab#a和abab#a两个后缀的开始位置同属于前一个字符串,导致计算出了前一个字符串内部的”公共子串”。

小Ho:哦,我明白了。我想想怎么修改这个算法…

小Hi:其实很简单,强行把他们分离就好了。

小Ho:是不是我们只需求排名相邻,原来不在同一个字符串的 height 值的最大值。

小Hi:为什么?

小Ho:你想啊,如果两个后缀在不同串中,计算它们最长前缀时必定要跨越过这些height值。举个例子,比如上面例子中求abab和a的最长前缀时(对应后缀数组中第4个和第2个),我们跨越了第2个后缀和第3个后缀这个不同串的“分界处”。

小Hi:说的太对了!

小Ho:我这就去实现一下!

小Hi:这个做法可以推广到做任意多个串的最长公共子串,如果你有兴趣也可以好好想想。

小Ho:嗯,应该也难不倒我。就把独立思考留给我吧!

Close
输入
共两行。一行一个仅包含小写字母的字符串。字符串长度不超过 100000。

输出
一行一个整数,表示答案。

Sample Input
abcdefg
abacabca
Sample Output
3

后缀数组有那么一点点感觉了
这道题就像他题目里所讲的一样,rank值相邻并且不是同一字符串里的后缀就可能有最长公共前缀,因为两个公用前缀的话,就说明他们的rank值是相邻的,然后只需要判断一下他们的sa值是否不在同一个字符串内就好了QAQ

#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
using namespace std;
#define ll long long
const int MAXN =(int)1e6+10;
int wa[MAXN],wb[MAXN],wv[MAXN],we[MAXN],rk[MAXN];
int cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}
void build_sa(int *r,int *sa,int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++)we[i]=0;
    for(i=0;i<n;i++)we[x[i]=r[i]]++;
    for(i=1;i<m;i++)we[i]+=we[i-1];
    for(i=n-1;i>=0;i--)sa[--we[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p){
        for(p=0,i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<n;i++)wv[i]=x[y[i]];
        for(i=0;i<m;i++)we[i]=0;
        for(i=0;i<n;i++)we[wv[i]]++;
        for(i=1;i<m;i++)we[i]+=we[i-1];
        for(i=n-1;i>=0;i--)sa[--we[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
int height[MAXN],n,m;
void calheight(int *r,int *sa,int n){
    int i,j,k=0;
    for(i=1;i<=n;i++)rk[sa[i]]=i;
    for(i=0;i<n;height[rk[i++]]=k){
        for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++);
    }
}
int sa[MAXN],a[MAXN];
//sa是从1-n,开始的值是0,rk是从0- n-1,开始的值是1
char s1[MAXN],s2[MAXN];
int main()
{
    scanf("%s%s",s1,s2);
    n=strlen(s1);
    m=strlen(s2);
    for(int i=0;i<m;i++)
        s1[n+i]=s2[i];
    n=n+m;
    for(int i=0;i<n;i++)
        a[i]=s1[i]-'a'+1;
    build_sa(a,sa,n+1,100);
    calheight(a,sa,n);
    int maxn=0;
    for(int i=2;i<=n;i++)
    {
        if((sa[i]<=n-m-1&&sa[i-1]>=n-m)||(sa[i]>=n-m&&sa[i-1]<=n-m-1))
            maxn=max(maxn,height[i]);
    }
    printf("%d\n",maxn);
    return 0;
}

猜你喜欢

转载自blog.csdn.net/tianyizhicheng/article/details/82017982
今日推荐