pku3294-后缀树组-3

 

 http://poj.org/problem?id=3294

题意:给定100个字符串,所有串的总字符数不超过100000,求最长的一个串保证这个串在>n/2的串中出现过。。如果有多个,按字典序输出。。

分析:一直木有写过后缀数组+二分的题目。。总是控制不好。。

和其他题目一样,可以想到用不同的字符隔开将这些串串成一个串。。。求得height数组,然后就是二分最长的串的长度,求得这个最大长度。。对每个长度进行判断时,扫描一遍height数组,看对每一个连续的>=temp_len的区间的后缀是不是来自大于n/2个原串。。。最后输出的话用判断时类似的方法即可。。。

同类题目:

pku 3080 求最长的串出现在所有串中。。。
pku 1226 求一个串出现在所有的(本串或其倒置的串)中。。。

注意:解决这类问题时n==1一定要单独考虑。。。填入的参数一定要大于字符的种数,否则RE。。。。。。

代码:

#include<stdio.h>
#include<string.h>

#define maxn 101001
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{
	return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
     int i,j,p,*x=wa,*y=wb,*t;
     for(i=0;i<m;i++) ws[i]=0;
     for(i=0;i<n;i++) ws[x[i]=r[i]]++;
     for(i=1;i<m;i++) ws[i]+=ws[i-1];
     for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
     for(j=1,p=1;p<n;j*=2,m=p)
     {
       for(p=0,i=n-j;i<n;i++) y[p++]=i;
       for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
       for(i=0;i<n;i++) wv[i]=x[y[i]];
       for(i=0;i<m;i++) ws[i]=0;
       for(i=0;i<n;i++) ws[wv[i]]++;
       for(i=1;i<m;i++) ws[i]+=ws[i-1];
       for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
       for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
       x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
     }
     return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
     int i,j,k=0;
     for(i=1;i<=n;i++) rank[sa[i]]=i;
     for(i=0;i<n;height[rank[i++]]=k)
     for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
     return;
}

int len1, len, n, up, mx;
char s[maxn], s1[maxn];
int sa[maxn], a[maxn], cate[maxn];
int flag[110];

int check(int tlen)
{
	int i, j, k, cnt;
	i = j = 1;
	while(i<=len && j<=len)
	{
		for(k=0; k<n; k++)
			flag[k] = 0;
		while(height[i]<tlen && i<=len)
			i++;
		j=i;
		while(height[j]>=tlen && j<=len)
			j++;
		if(j-i+2<=n/2)
		{
			i=j;
			continue;
		}
		for(k=i-1; k<j; k++)
		{
			if(cate[sa[k]]!=-1)//差了这一句,wa了好久啊啊啊 嗄。。。
				flag[cate[sa[k]]] = 1;
		}
		for(cnt=0,k=0; k<n; k++)
			cnt += flag[k];
		if(cnt>n/2)
			return 1;
		i = j;
	}
	return 0;
}
void print(int tlen)
{
	if(tlen==0)
	{
		printf("?\n");
		return;
	}
	int i, j, k, cnt;
	i = j = 1;
	while(i<=len && j<=len)
	{
		for(k=0; k<n; k++)
			flag[k] = 0;
		while(height[i]<tlen && i<=len)
			i++;
		j=i;
		while(height[j]>=tlen && j<=len)
			j++;
		if(j-i+2<=n/2)
		{
			i=j;
			continue;
		}
		for(k=i-1; k<j; k++)
		{
			if(cate[sa[k]]!=-1)
				flag[cate[sa[k]]] = 1;
		}
		for(cnt=0,k=0; k<n; k++)
			cnt += flag[k];
		if(cnt>n/2)
		{
			for(k=0; k<tlen; k++)
				printf("%c", a[sa[i]+k]-1);
			printf("\n");
		}
		i = j;
	}
}

void solve()
{
	int l, r, ans, mid;
	l=0, r=mx;
	while(l<=r)
	{
		mid = (l+r)>>1;
		if(check(mid))
			l = mid + 1;
		else
			r = mid - 1;
	}
	ans = r;
	//printf("%d.....\n", ans);//...
	print(ans);
}
int main()
{
	int i, j, k;
	scanf("%d", &n);
	while(1)
	{
		if(n==0)
			break;
		up = 140;
		mx = 1;
		for(i=0, j=0; i<n; i++)
		{
			scanf("%s", s1);
			len1 = strlen(s1);
			if(len1>mx)
				mx = len1;
			for(k=0; k<len1; k++)
			{
				cate[j] = i;
				a[j++] = s1[k]+1; //加1了的输出的时候注意一下。。
			}
			cate[j] = -1;
			a[j++] = up+i;
		}
		a[--j] = 0;
		len = j;
		
		if(n==1)
		{
			printf("%s\n", s1);
			continue;
		}
		da(a, sa, len+1, 250);
		calheight(a, sa, len);
		//for(i=0; i<=len; i++)//..................
		//	printf("i=%2d..%2d %2d..\n", i, sa[i], height[i]);
		solve();
		
		scanf("%d", &n);
		if(n==0)
			break;
		else
			printf("\n");
	}
	return 0;
}


 

猜你喜欢

转载自blog.csdn.net/ggggiqnypgjg/article/details/6724870