URAL 1297 Palindrome(后缀数组)

URAL 1297 Palindrome(后缀数组)

题意

  给出一个字符串,找到它的最长回文子串。

解题思路

  按照论文中说的,只需要将整个字符串反过来写在原串的后面,中间用一个特殊字符隔开,然后再求这个新字符串的最长公共前缀,然后只需要注意最小下标。但是这样并非完全正确,给出样例串zzdcddzz,那么它得到的串为zzdcddzz~zzddcdzz,这个数组一共有三处最大height[i],分别如下

1.第一组

dcddzz~zzddcdzz

dcdzz

这一组height[i]=3,min(sa[i],sa[i-1])=3,其实这一组就是正确答案

2.第二组

dzz

dzz~zzddcdzz

这一组height[i]=3,min(sa[i],sa[i-1])=6,这一组对原逻辑没什么影响

3.第三组

扫描二维码关注公众号,回复: 2636063 查看本文章

zzdcddzz~zzddcdzz

zzddcdzz

这一组height[i]=3,min(sa[i],sa[i-1])=1,问题就出在这一组,按照原逻辑是直接会将pos更新到1,那么得到的串为zzd,即如果字符串里后缀反过来可能与前缀匹配上,这就是bug所在。

  为了解决这个bug,我在更新结果的时候,判了一下得到的串是否为回文串,效果目测还行。

代码

#include <cstdio>
#include <iostream>
#include <cstring>
#define  LL long long
#define  ULL unsigned long long
using namespace std;
const int maxn= 1e4+50;

int wa[maxn],wb[maxn],wv[maxn],wt[maxn];

int cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(char r[],int sa[],int n,int m)
{
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0; i<m; i++) wt[i]=0;
    for(i=0; i<n; i++) wt[x[i]=r[i]]++;
    for(i=1; i<m; i++) wt[i]+=wt[i-1];
    for(i=n-1; i>=0; i--) sa[--wt[x[i]]]=i;
    for(j=1,p=1; p<n; j*=2,m=p)
    {
        for(p=0,i=n-j; i<n; i++) y[p++]=i;
        for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0; i<n; i++) wv[i]=x[y[i]];
        for(i=0; i<m; i++) wt[i]=0;
        for(i=0; i<n; i++) wt[wv[i]]++;
        for(i=1; i<m; i++) wt[i]+=wt[i-1];
        for(i=n-1; i>=0; i--) sa[--wt[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
    return;
}
int sa[maxn],rankk[maxn],height[maxn],n;

void getheight(char *r,int *sa,int n)
{
    int i,j,k=0;
    for(i=1; i<=n; i++) rankk[sa[i]]=i;
    for(i=0; i<n; height[rankk[i++]]=k)
        for(k?k--:0,j=sa[rankk[i]-1]; r[i+k]==r[j+k]; k++);
    for(int i=n; i>=1; --i) ++sa[i],rankk[i]=rankk[i-1];
}

char arr[maxn],str[maxn];

int main()
{
#ifdef DEBUG
    freopen("in.txt","r",stdin);
#endif // DEBUG
    scanf("%s",str);
    int n=strlen(str);
    for(int i=0; i<n; i++) arr[i]=str[i];
    arr[n]=(char)126;
    for(int i=n+1,j=n-1; j>=0; i++,j--) arr[i]=str[j];
    arr[n*2+1]='\0';
    int len=n*2+1;
    da(arr,sa,len+1,200);
    getheight(arr,sa,len);
//    for(int i=1;i<=len;i++)
//    {
//        for(int j=sa[i];j<=len;j++)
//            printf("%c",arr[j-1]);
//        printf("\n");
//    }
    int ans=1,pos=1;
    for(int i=2; i<=len; i++)
    {
        if((sa[i]/n)^(sa[i-1]/n))
        {
            int sam=sa[i],sim=sa[i-1],flag=0;
            if(sam<sim) swap(sam,sim);
            for(int k=sim-1,j=sim+height[i]-2; k<j; k++,j--)  //判断找到的串是否为回文串
                if(arr[k]!=arr[j])
                {
                    flag=1;
                    break;
                }
            if(flag) continue;
            if(height[i]>ans) ans=height[i],pos=sim;
            else if(height[i]==ans) pos=min(pos,sim);
        }
    }

    for(int i=0; i<ans; i++) printf("%c",arr[i+pos-1]);
    printf("\n");
    return 0;
}

猜你喜欢

转载自blog.csdn.net/qq_36258516/article/details/81502664
今日推荐