BZOJ3277 串(后缀数组+二分答案+主席树)

  因为不会SAM,考虑SA。将所有串连起来并加分隔符,每次考虑计算以某个位置开始的子串有多少个合法。

  对此首先二分答案,找到名次数组上的一个区间,那么只需要统计有多少个所给串在该区间内出现就可以了。这是一个主席树的经典问题,对每个数找到上次出现位置扔进去即可。这样就做到O(nlog2n)了。

  可以进一步优化到O(nlogn),不是很会。

  以及我又不会写SA了,没救。

#include<iostream> 
#include<cstdio>
#include<cmath>
#include<cstdlib>
#include<cstring>
#include<algorithm>
using namespace std;
int read()
{
    int x=0,f=1;char c=getchar();
    while (c<'0'||c>'9') {if (c=='-') f=-1;c=getchar();}
    while (c>='0'&&c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar();
    return x*f;
}
#define N 200010
int n,m,tot,pos[N],cnt[N],end[N],sa[N],sa2[N],rk[N<<1],tmp[N<<1],h[N],lg2[N],f[N][19],root[N],pre[N],p[N],cnt2=0;
long long ans[N];
struct data{int l,r,x;
}tree[N<<5];
char s[N],c[N];
void make(int n)
{
    int m=0;
    for (int i=1;i<=n;i++) cnt[rk[i]=s[i]]++,m=max(m,(int)s[i]);
    for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];
    for (int i=n;i>=1;i--) sa[cnt[rk[i]]--]=i;
    for (int k=1;k<=n;k<<=1)
    {
        int p=0;
        for (int i=n-k+1;i<=n;i++) sa2[++p]=i;
        for (int i=1;i<=n;i++) if (sa[i]>k) sa2[++p]=sa[i]-k;
        memset(cnt,0,sizeof(cnt));
        for (int i=1;i<=n;i++) cnt[rk[i]]++;
        for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];
        for (int i=n;i>=1;i--) sa[cnt[rk[sa2[i]]]--]=sa2[i];
        memcpy(tmp,rk,sizeof(rk));
        p=rk[sa[1]]=1;
        for (int i=2;i<=n;i++)
        {
            if (tmp[sa[i]]!=tmp[sa[i-1]]||tmp[sa[i]+k]!=tmp[sa[i-1]+k]) p++;
            rk[sa[i]]=p;
        }
        m=p;if (m>=n) break;
    }
    for (int i=1;i<=n;i++)
    {
        h[i]=max(h[i-1]-1,0);
        while (s[i+h[i]]==s[sa[rk[i]-1]+h[i]]) h[i]++;
    }
    for (int i=1;i<=n;i++) f[i][0]=h[sa[i]];
    lg2[1]=0;
    for (int i=2;i<=n;i++)
    {
        lg2[i]=lg2[i-1];
        if ((2<<lg2[i])<=i) lg2[i]++;
    }
    for (int j=1;j<=18;j++)
        for (int i=1;i<=n;i++)
        f[i][j]=min(f[i][j-1],f[min(i+(1<<j-1),n)][j-1]);
}
int query(int x,int y)
{
    if (x>y) swap(x,y);
    x++;if (x>y) return N;
    return min(f[x][lg2[y-x+1]],f[y-(1<<lg2[y-x+1])+1][lg2[y-x+1]]);
}
void ins(int &k,int l,int r,int x)
{
    tree[++cnt2]=tree[k],k=cnt2;tree[k].x++;
    if (l==r) return;
    int mid=l+r>>1;
    if (x<=mid) ins(tree[k].l,l,mid,x);
    else ins(tree[k].r,mid+1,r,x);
}
bool Query(int x,int y,int l,int r,int p,int m)
{
    if (m<=0) return 1;
    if (!y) return 0;
    if (l==r) return m<=tree[y].x-tree[x].x;
    int mid=l+r>>1;
    if (p<=mid) return Query(tree[x].l,tree[y].l,l,mid,p,m);
    else return Query(tree[x].r,tree[y].r,mid+1,r,p,m-tree[tree[y].l].x+tree[tree[x].l].x);
}
void build()
{
    for (int i=1;i<=tot;i++) pre[i]=p[pos[sa[i]]],p[pos[sa[i]]]=i;
    for (int i=1;i<=tot;i++)
    {
        root[i]=root[i-1];
        ins(root[i],0,tot,pre[i]);
    }
}
bool check(int x,int k,int m)
{
    int p,q,l=1,r=x;
    while (l<=r)
    {
        int mid=l+r>>1;
        if (query(mid,x)>=k) p=mid,r=mid-1;
        else l=mid+1;
    }
    l=x,r=tot;
    while (l<=r)
    {
        int mid=l+r>>1;
        if (query(mid,x)>=k) q=mid,l=mid+1;
        else r=mid-1;
    }
    return Query(root[p-1],root[q],0,tot,p-1,m);
}
int main()
{
#ifndef ONLINE_JUDGE
    freopen("bzoj3277.in","r",stdin);
    freopen("bzoj3277.out","w",stdout);
    const char LL[]="%I64d ";
#else
    const char LL[]="%lld ";
#endif
    n=read(),m=read();
    for (int i=1;i<=n;i++)
    {
        scanf("%s",c+1);int m=strlen(c+1);
        for (int j=1;j<=m;j++) s[++tot]=c[j],pos[tot]=i;
        s[++tot]='$',pos[tot]=i;end[i]=tot;
    }
    make(tot);
    build();
    for (int i=1;i<=tot;i++)
    if (s[i]!='$')
    {
        int l=1,r=end[pos[i]]-i,x=0;
        while (l<=r)
        {
            int mid=l+r>>1;
            if (check(rk[i],mid,m)) x=mid,l=mid+1;
            else r=mid-1;
        }
        ans[pos[i]]+=x;
    }
    for (int i=1;i<=n;i++) printf(LL,ans[i]);
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/Gloid/p/9693469.html