SAM练习 spoj1811 LCS;spoj1812 LCS2;spoj8222

SAM的若干性质:

1、每个节点所代表的后缀一定是连续长度的。

2、x节点代表的[l1,r1],pre[x]代表[l2,r2],其中l1=r2+1。

3、pre指针的包含关系。

4、l排序满足拓扑排序。

spoj1811 LCS

n<=100000 两个串的LCS

做的时候是在好久以前刚刚学完SAM的时候。。

当时naive啊。。好多SAM的性质都没理解上来照猫画虎硬搞。。

之后还给学弟口胡了几句。。。

按照第一个串建立SAM,然后将第二个串在上边匹配,如果匹配成功,ans++;否则,按照pre指针跳,直到匹配成功,ans=l[now]+1;

因为pre指针的包含关系,成功匹配了now,一定可以成功匹配pre[now]。

#include<iostream>
#include<cstdio>
#include<cstring>
#define N 2000005
using namespace std;
int ch[N][26],pre[N],dis[N];
char a[N],b[N];
int sz=0,n,m,p,q,np,nq,now,last,S,ans=0,len=0;
void ins(int x){
    p=last;np=++sz;last=sz;
    dis[np]=dis[p]+1;
    for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
    if(!p) {pre[np]=S;return;}
    q=ch[p][x];
    if(dis[q]==dis[p]+1) pre[np]=q;
    else{
        nq=++sz;dis[nq]=dis[p]+1;
        memcpy(ch[nq],ch[q],sizeof(ch[q]));
        pre[nq]=pre[q];
        pre[q]=pre[np]=nq;
        for(;ch[p][x]==q;p=pre[p])ch[p][x]=nq;
    }
}
void getans(int x){
    if(ch[now][x]) len++,now=ch[now][x];
    else{
        while(now&&!ch[now][x]) now=pre[now];
        if(now==0) now=S,len=0;
        else len=dis[now]+1,now=ch[now][x];
    }
    printf("%d\n",len);
}
int main(){
    freopen("in.txt","r",stdin);
    freopen("out.txt","w",stdout);
    scanf("%d %d\n",&n,&m);
    scanf("%s\n%s\n",a,b);
    now=last=S=++sz;
    for(int i=0;i<n;i++) ins(a[i]-'a');
    for(int i=0;i<m;i++) getans(b[i]-'a');
    return 0;
}

spoj1812 LCS2

求n个串的LCS n<=10,L<=100000

对第一个串建立SAM,然后用剩下的串匹配。

每次匹配,每个节点记录该节点匹配的最长串。然后每个节点需要根据拓扑序更新到pre[x]上。

然后每次更新ans[],记录的是前k个串匹配到i节点的最长长度。显然是对每次的答案去min。

然后最后枚举每个点,更新最终答案即可。

#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#define N 200005
using namespace std;
int p,q,np,nq,last,S;
char s[11][N];
int l[N],pre[N],ch[N][26];
int n,sz=0;
int ll[N],ans[N],r[N],c[N],len,now,ret;
void ins(int x){
	p=last;np=++sz;last=np;
	l[np]=l[p]+1;
	for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
	if(p==0){pre[np]=S;return;}
	q=ch[p][x];
	if(l[q]!=l[p]+1){
		nq=++sz;
		l[nq]=l[p]+1;
		memcpy(ch[nq],ch[q],sizeof(ch[q]));
		pre[nq]=pre[q];
		pre[q]=pre[np]=nq;
		for(;ch[p][x]==q;p=pre[p]) ch[p][x]=nq;
	}else pre[np]=q;
}
void getans(char *s){
	memset(ll,0,sizeof(ll));
	now=S;len=0;
	for(int i=1;s[i];i++){
		int x=s[i]-'a';
		if(ch[now][x]) {
			len++;now=ch[now][x];
		}
		else{
			for(;now&&!ch[now][x];now=pre[now]);
			if(now==0) {len=0;now=S;}
			else {len=l[now]+1;now=ch[now][x];}
		}
		ll[now]=max(len,ll[now]);
	}
	for(int i=sz;i>=1;i--) if(ll[r[i]]) ll[pre[r[i]]]=l[pre[r[i]]];
	for(int i=sz;i>=1;i--) ans[i]=min(ans[i],ll[i]);
}
int main(){
	freopen("in.txt","r",stdin);
	freopen("out.txt","w",stdout);
	n=0;while(scanf("%s",s[++n]+1)!=EOF);n--;
	S=last=++sz;
	for(int i=1;s[1][i];i++) ins(s[1][i]-'a');
	for(int i=1;s[1][i];i++) c[i]=0;
	for(int i=1;i<=sz;i++) c[l[i]]++;
	for(int i=1;s[1][i];i++) c[i]+=c[i-1];
	for(int i=1;i<=sz;i++) r[c[l[i]]--]=i;
	memset(ans,127,sizeof(ans));
	for(int i=2;i<=n;i++) getans(s[i]);
	for(int i=1;i<=sz;i++) if(ret<ans[i]) ret=ans[i]; 
	printf("%d\n",ret);
	return 0;
}

spoj8222

给定字符串s,求f[1..n],表示出现i次的字符串的最大长度。n<=100000

建立后缀自动机,然后对于每一个状态所表示的最长子串,我们发现它所出现的次数就在于他的后继中有多少个不同接受态。所以我们用类似基数排序的东西处理出一个拓扑序列,然后自下而上更新pre节点。注意要先对所有主链上的点赋初值1,这是因为这其实等价于对于每次插入后缀的那个节点,而那个节点正是一个合法的接受态。然后一边更新一边统计长度i的最大值f[i]最后又因为我们处理的都是每个状态的最长子串重复次数,所以最后还要再倒着推一次f[i]:=max(f[i],f[i+1])最后输出就行了。

#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#define N 500005
using namespace std;
int l[N],ch[N][26],pre[N],c[N],t[N],v[N],dp[N];
int S,last,now,sz;
char s[N];
void ins(int x){
	int p=last;int np=++sz;last=np;
	l[np]=l[p]+1;
	for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
	if(p==0) {pre[np]=S;return;}
	int q=ch[p][x];
	if(l[q]==l[p]+1) pre[np]=q;
	else{
		int nq=++sz;
		l[nq]=l[p]+1;
		memcpy(ch[nq],ch[q],sizeof(ch[q]));
		pre[nq]=pre[q];
		pre[q]=pre[np]=nq;
		for(;ch[p][x]==q;p=pre[p]) ch[p][x]=nq;
	}
}
int main(){
	S=last=now=++sz;
	scanf("%s",s+1);int n=strlen(s+1);
	for(int i=1;i<=n;i++) ins(s[i]-'a');
	for(int i=1;i<=n;i++) printf("%d ",pre[i]);
	for(int i=1;i<=n;i++) c[i]=0;
	for(int i=1;i<=sz;i++) c[l[i]]++;
	for(int i=1;i<=n;i++) c[i]+=c[i-1];
	for(int i=1;i<=sz;i++) t[c[l[i]]--]=i;
	for(int i=1;i<=n;i++){
		now=ch[now][s[i]-'a'];
		v[now]=1;
	}
	for(int i=sz;i;i--){
		now=t[i];
		v[pre[now]]+=v[now];
		dp[l[now]]=max(dp[l[now]],v[now]);
	}
	for(int i=n;i;i--)
		dp[i]=max(dp[i+1],dp[i]);
	for(int i=1;i<=n;i++) printf("%d\n",dp[i]);
	system("pause");
}

待更。

发布了87 篇原创文章 · 获赞 7 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/yxr0105/article/details/51602155