HDU - 4821 String(hash + 套路)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_37129433/article/details/83033065

String
题 意:给你一个串s,和m,l.问你有多少长度为m*l的s的子串满足该子串由m个长度为l且个不相同的子串组成的个数.问的是长度为m * l的子串的个数。
数据范围:
1 < = m l < = s 1<=m*l<=s
l e n ( s ) < = 1 e 5 len(s)<=1e5
输入样例:

3 3
abcabcbcaabc

输出样例:

2

思 路:Hash + 一点套路,先o(n)求出整个串的Hash值,然后这么求某一段的Hash值呢?
t e m p = H a s h [ i + l 1 ] H a s h [ i 1 ] L [ l ] temp = Hash[i+l-1]-Hash[i-1]*L[l] ;temp是以i为开始长度为l的字符串的Hash值。
如果直接枚举子串的位置那么复杂度最差可能是 o ( n 2 ) o(n^2) ,这样是不行的。那么我们可以选用这种套路,如果需要枚举所有位置求区间长度为l的啥啥啥。那么可以先枚举长度为起点为(1,l)的答案,然后再进行去头加尾。这样的复杂度是 O ( n ) O(n) 的有点强。
收 获:对hash的套路更加了解了吧,收获了一个新的套路。

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<string>
#include<vector>
#include<map>
#include<queue>
#include<cmath>
#define lson l,m,rt<<1
#define rson m+1,r,rt<<11
#define IN freopen("input.txt","r",stdin)
#define mst(x,y) memset(x,y,sizeof(x));
#define debug(x) cout<< #x <<" = "<< (x) <<endl;
#define min(x,y) x>y?y:x
#define max(x,y) x>y?x:y
using namespace std;
typedef long long ll;
typedef pair<int,int> P;
typedef unsigned long long ull;
const int mod = 1e6+3;
const int INF = 0x3f3f3f3f;
const int LINF = 0x3f3f3f3f3f3f3f3f;
const int maxn = 1e5+5;
ull seed = 1313131;
ull Hash[maxn];
char s[maxn];
int l,m;
ull L[maxn];
map<ull,int>mp;
int main() {
    //IN;
    L[0] = 1;
    for(int i=1; i<=maxn-1; i++)L[i] = L[i-1]*seed;
    while(~scanf("%d %d",&m,&l)) {
        scanf("%s",s+1);
        int len = strlen(s+1);
        int ans = 0;
        for(int i=1; i<=len; i++)Hash[i] = Hash[i-1]*seed + (s[i]-'a'+1);
        for(int i=1; i<=l && i+m*l-1<=len; i++) {
            mp.clear();
            for(int j=i; j<=i+m*l-1; j+=l) {
                ull temp = Hash[j+l-1] - Hash[j-1]*L[l];
                mp[temp]++;
            }
            if(mp.size() == m)ans++;
            for(int j=i+m*l; j+l-1<=len; j+=l) {
                ull temp = Hash[j-m*l+l-1]-Hash[j-m*l-1]*L[l];
                if(--mp[temp]);
                if(mp[temp] == 0)mp.erase(temp);//这个时候是需要减去的。
                temp = Hash[j+l-1]-Hash[j-1]*L[l];
                ++mp[temp];
                if(mp.size() == m)ans++;
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}

猜你喜欢

转载自blog.csdn.net/qq_37129433/article/details/83033065