版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_37129433/article/details/83033065
String
题 意:给你一个串s,和m,l.问你有多少长度为m*l的s的子串满足该子串由m个长度为l且个不相同的子串组成的个数.问的是长度为m * l的子串的个数。
数据范围:
输入样例:
3 3
abcabcbcaabc
输出样例:
2
思 路:Hash + 一点套路,先o(n)求出整个串的Hash值,然后这么求某一段的Hash值呢?
;temp是以i为开始长度为l的字符串的Hash值。
如果直接枚举子串的位置那么复杂度最差可能是
,这样是不行的。那么我们可以选用这种套路,如果需要枚举所有位置求区间长度为l的啥啥啥。那么可以先枚举长度为起点为(1,l)的答案,然后再进行去头加尾。这样的复杂度是
的有点强。
收 获:对hash的套路更加了解了吧,收获了一个新的套路。
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<string>
#include<vector>
#include<map>
#include<queue>
#include<cmath>
#define lson l,m,rt<<1
#define rson m+1,r,rt<<11
#define IN freopen("input.txt","r",stdin)
#define mst(x,y) memset(x,y,sizeof(x));
#define debug(x) cout<< #x <<" = "<< (x) <<endl;
#define min(x,y) x>y?y:x
#define max(x,y) x>y?x:y
using namespace std;
typedef long long ll;
typedef pair<int,int> P;
typedef unsigned long long ull;
const int mod = 1e6+3;
const int INF = 0x3f3f3f3f;
const int LINF = 0x3f3f3f3f3f3f3f3f;
const int maxn = 1e5+5;
ull seed = 1313131;
ull Hash[maxn];
char s[maxn];
int l,m;
ull L[maxn];
map<ull,int>mp;
int main() {
//IN;
L[0] = 1;
for(int i=1; i<=maxn-1; i++)L[i] = L[i-1]*seed;
while(~scanf("%d %d",&m,&l)) {
scanf("%s",s+1);
int len = strlen(s+1);
int ans = 0;
for(int i=1; i<=len; i++)Hash[i] = Hash[i-1]*seed + (s[i]-'a'+1);
for(int i=1; i<=l && i+m*l-1<=len; i++) {
mp.clear();
for(int j=i; j<=i+m*l-1; j+=l) {
ull temp = Hash[j+l-1] - Hash[j-1]*L[l];
mp[temp]++;
}
if(mp.size() == m)ans++;
for(int j=i+m*l; j+l-1<=len; j+=l) {
ull temp = Hash[j-m*l+l-1]-Hash[j-m*l-1]*L[l];
if(--mp[temp]);
if(mp[temp] == 0)mp.erase(temp);//这个时候是需要减去的。
temp = Hash[j+l-1]-Hash[j-1]*L[l];
++mp[temp];
if(mp.size() == m)ans++;
}
}
printf("%d\n",ans);
}
return 0;
}