Crazy Search --(字符串hash)

给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串 

举个例子, n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5. 

Input

第一行是两个整数n,m,,一个空格隔开。 接下来一行是我们要解决的字符串.( 你可以认为字符串的长度不会超过一千六百万。)Orz我读错题了,并不是字符串长度不超过1600万,是合理hash之后的hash的值不超过1600万。Orz原谅我

Output

程序应该输出一个整数,对应于给定文本中所找到的大小为n的不同子字符串的数量。

输入数据

3 4
daababac

输出数据

5

Hint

输入数据量庞大,推荐使用scanf

#include <stdio.h>
#include <cstring>
#include <algorithm>
#define maxn 16000005
using namespace std;
int n,nc,m,num,has[maxn],a[500];
char str[maxn];
int main()
{
	while(scanf("%d%d%s",&n,&nc,str)!=EOF)
	{
		memset(has,0,sizeof(has));
		memset(a,0,sizeof(a));
	    m=strlen(str);
	    int k=0;
	    a[str[0]]=k++;
	    for(int i=1;i<m;i++)
	        if(a[str[i]]==0)
	           a[str[i]]=k++;
	    num=0;
	    for(int i=0;i<=m-n;i++)
	    {
		    int sum=0;
		    for(int j=0;j<n;j++)
		    {
			    sum=sum*k+a[str[i+j]]; 
		    }
		    if(has[sum]==0)   has[sum]=1,num++;
	    }
	    printf("%d\n",num);
	}
	return 0;
}

猜你喜欢

转载自blog.csdn.net/unikue/article/details/81810189
今日推荐