BZOJ3277 串 和 BZOJ3473 字符串

字符串

Problem 3473. -- 字符串

3473: 字符串

Time Limit: 20 Sec   Memory Limit: 256 MB
Submit: 1198   Solved: 547
[ Submit][ Status][ Discuss]

Description

给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?

Input

第一行两个整数nk
接下来n行每行一个字符串

Output

一行n个整数,第i个整数表示第i个字符串的答案

Sample Input

3 1
abc
a
ab

Sample Output

6 1 3

HINT



对于 100% 的数据,1<=n,k<=10^5,所有字符串总长不超过10^5,字符串只包含小写字母。

Source

[ Submit][ Status][ Discuss]

HOME Back

分析

参照自为风月马前卒Candy?的题解。

广义后缀自动机不就是把很多串的SAM建到了一个SAM上,建每个串的时候都从root开始(last=root)就行了........
广义后缀自动机是Trie树的后缀自动机,可以解决多主串问题
这样的在线构造算法复杂度为O(G(T)),G(T)为Trie树上所有叶子节点深度和,发现G(T)<=所有主串总长度

对于这题,首先我们要知道几个定理

  1. 节点i表示的本质不同的字符串可以由len[i]−len[fa[i]]得到
  2. 一个串的子串 等价于 一个串所有前缀的所有后缀

这样子串就转换为求一个串的前缀的所有后缀的问题

前缀可以枚举,问题转换为求一个字符串的各个后缀在其他字符串中出现了多少次

这样我们可以把广义后缀自动机建出来,然后暴力沿着parent边跑,这样可以枚举出所有后缀

同时为了不重复枚举,我们需要记录下每个后缀是否已经被枚举过了

这样最坏情况下复杂度为O(L^3/2),发生在n=L的时候(均值不等式啊)

这样我们就可以知道一个状态出现的次数是否>=K,接下来我们只要统计出这个状态出现的次数就行了
DP出f[i]为i及其Parent祖先出现次数>=k有多少字符串(注意一个状态贡献的字符串为t[par].val-t[u].val),然后在跑一遍每个字符串得到答案就行了

然后就做完了。时间复杂度\(O(L^{1.5})\)

代码

#include<bits/stdc++.h>
#define rg register
#define il inline
#define co const
typedef long long ll;
using namespace std;

co int N=2e5;
string s[N];
int last=1,tot=1;
int ch[N][26],fa[N],len[N];
void extend(int c){
    int p=last,cur=last=++tot;
    len[cur]=len[p]+1;
    for(;p&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
    if(!p) fa[cur]=1;
    else{
        int q=ch[p][c];
        if(len[q]==len[p]+1) fa[cur]=q;
        else{
            int clone=++tot;
            memcpy(ch[clone],ch[q],sizeof ch[q]);
            fa[clone]=fa[q],len[clone]=len[p]+1;
            fa[cur]=fa[q]=clone;
            for(;ch[p][c]==q;p=fa[p]) ch[p][c]=clone;
        }
    }
}
int vis[N],times[N],sum[N];
void dfs(int x){
    if(x==1||vis[x]) return;
    vis[x]=1;
    dfs(fa[x]);
    sum[x]+=sum[fa[x]];
}
int main(){
    ios::sync_with_stdio(0);
    int n,k;
    cin>>n>>k;
    for(int i=1;i<=n;++i){
        cin>>s[i];
        last=1;
        for(int j=0;j<s[i].length();++j) extend(s[i][j]-'a');
    }
    // GetTimes
    for(int i=1;i<=n;++i){
        int now=1;
        for(int j=0;j<s[i].length();++j){
            now=ch[now][s[i][j]-'a'];
            for(int t=now;t&&vis[t]!=i;t=fa[t]) vis[t]=i,++times[t];
        }
    }
    for(int i=1;i<=tot;++i) sum[i]=(times[i]>=k)*(len[i]-len[fa[i]]);
    memset(vis,0,sizeof vis);
    for(int i=1;i<=tot;++i) dfs(i);
    for(int i=1;i<=n;++i){
        int ans=0,now=1;
        for(int j=0;j<s[i].length();++j)
            now=ch[now][s[i][j]-'a'],ans+=sum[now];
        printf("%d ",ans);
    }
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/autoint/p/10823942.html