《算法竞赛进阶指南》0x10 基本数据结构 Hash

Hash的基本知识

字符串hash算法
将字符串看成p进制数字,再将结果mod q
例如:abcabcdefg 将字母转换位数字
(1231234567)=(1*p9+2*p8+3*p7+1*p6+2*p5+3*p4+4*p3+5*p2+6*p1+7*p0)%q
=0~q-1
经验值 p=131,1331时,冲突最小
q取2^64(unsigned long long)

例如abd
=(124)131
=(1*131^2+2*131^1+4*131^0)
=hash("abd")溢出不用管

先预处理出字符串前缀的hash
例如 已知hash("abc"),求hash("abcd")
hash("abcd")=hash("abc")*131+4

h[]数组存放字符串的前缀字串
可用 h[r] - h[l - 1] * p[r - l + 1]求出【l,r】区间内的任意字串
p[]存放q的次方
137. 雪花雪花雪花(https://www.acwing.com/problem/content/139/)

有N片雪花,每片雪花由六个角组成,每个角都有长度。

第i片雪花六个角的长度从某个角开始顺时针依次记为ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6。

因为雪花的形状是封闭的环形,所以从任何一个角开始顺时针或逆时针往后记录长度,得到的六元组都代表形状相同的雪花。

例如ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6和ai,2,ai,3,,ai,6ai,1ai,2,ai,3,…,ai,6,ai,1就是形状相同的雪花。

ai,1,ai,2,,ai,6ai,1,ai,2,…,ai,6和ai,6,ai,5,,ai,1ai,6,ai,5,…,ai,1也是形状相同的雪花。

我们称两片雪花形状相同,当且仅当它们各自从某一角开始顺时针或逆时针记录长度,能得到两个相同的六元组。

求这N片雪花中是否存在两片形状相同的雪花。

输入格式

第一行输入一个整数N,代表雪花的数量。

接下来N行,每行描述一片雪花。

每行包含6个整数,分别代表雪花的六个角的长度(这六个数即为从雪花的随机一个角顺时针或逆时针记录长度得到)。

同行数值之间,用空格隔开。

输出格式

如果不存在两片形状相同的雪花,则输出:

No two snowflakes are alike.

如果存在两片形状相同的雪花,则输出:

Twin snowflakes found.

数据范围

1n1000001≤n≤100000,
0ai,j<100000000≤ai,j<10000000

输入样例:

2
1 2 3 4 5 6
4 3 2 1 6 5

输出样例:

Twin snowflakes found.

 
138. 兔子与兔子(https://www.acwing.com/problem/content/140/)

很久很久以前,森林里住着一群兔子。

有一天,兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

输出格式

对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

数据范围

1length(S),m10000001≤length(S),m≤1000000

输入样例:

aabbaabb
3
1 3 5 7 1 3 6 8 1 2 1 2 

输出样例:

Yes
No
Yes
#include<iostream>
#include<string.h>
#include<cstdio>
using namespace std;
const int MAXN = 1000000 + 2;
const int base = 131;
char str[MAXN];
int p[MAXN];//p[i]存放base的次方
int h[MAXN];
int  get1(int x,int y)
{
    return h[y] - h[x - 1] * p[y - x + 1];
}
int main()
{
    scanf("%s", str + 1);
    int num = strlen(str + 1);
    int m;
    cin >> m;
    p[0] = 1;
    for (int i = 1; i <= num; i++)
    {
        h[i] = h[i - 1] * base + str[i] - 'a' + 1;
        p[i] = p[i - 1] * base;
    }
    while (m--)
    {
        int l1, l2, r1, r2;
        cin >> l1 >> r1 >> l2 >> r2;
        if (get1(l1, r1) == get1(l2, r2)) 
            cout << "Yes" << endl;
        else 
            cout << "No" << endl;
    }
    return 0;
}
 
 
139. 回文子串的最大长度(https://www.acwing.com/problem/content/141/)

如果一个字符串正着读和倒着读是一样的,则称它是回文的。

给定一个长度为N的字符串S,求他的最长回文子串的长度是多少。

输入格式

输入将包含最多30个测试用例,每个测试用例占一行,以最多1000000个小写字符的形式给出。

输入以一个以字符串“END”(不包括引号)开头的行表示输入终止。

输出格式

对于输入中的每个测试用例,输出测试用例编号和最大回文子串的长度(参考样例格式)。

每个输出占一行。

输入样例:

abcbabcbabcba
abacacbaaaab
END

输出样例:

Case 1: 13
Case 2: 6

#include <iostream>
#include<string.h>
#include<cmath>
#include<cstdio>
#define ull unsigned long long
using namespace std;
const int maxn = 2000005;
const int base = 131;
ull p[maxn];
char str[maxn];
ull h1[maxn],h2[maxn];
ull get(ull h[],int l,int r)
{
    return h[r]-h[l-1]*p[r-l+1];
}
int main()
{
    int t=1;
    while(scanf("%s",str+1),strcmp(str+1,"END"))
    {
        int n = strlen(str+1);
        for(int i= n *2 ;i;i-=2)
        {
            str[i]=str[i/2];
            str[i-1]= 'z' + 1;
        }
        n*=2;
        p[0]=1;
        for(int i=1,j=n;i<=n;i++,j--)
        {
            h1[i] = h1[i-1]*base+str[i]-'a'+1;
            h2[i] = h2[i-1]*base+str[j]-'a'+1;
            p[i]=p[i-1]*base;
        }
         int res = 0;
        for(int i=1;i<=n;i++)
        {
            int l=0,r=min(i-1,n-i);
            while(l<r)
            {
                int mid=l+r+1>>1;
                if(get(h1,i-mid,i-1)!=get(h2,n-(i+mid)+1,n-(i+1)+1))
                {
                    r=mid-1;
                }
                else
                {
                    l=mid;
                }
            }
            if(str[i-l]<='z') res=max(res,l+1);
            else res=max(res,l);
        }
        printf("Case %d: %d\n",t++,res);
    }
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/wjc2021/p/10747484.html