bzoj 4503: 两个串【脑洞+FFT】

真实脑洞题
因为通配符所以导致t串实际有指数级别个,任何字符串相关算法都没有用
考虑一个新的匹配方法:设a串(模板串)长为n,从m串的i位置开始匹配:\( \sum_{i=0}^{n-1}(a[j]-b[i+j])^2a[j] \)
这个东西只有在从i开始的长为n的a串子串与b串完全匹配的时候才为0,因为首先如果两个字符相同,差的平方和才为0,令t中的'?'值为0,这样某一位为0就是这一位的字符匹配上或者a串的这一位通配
然后考虑优化这个n^2的东西
\[ c[i]=\sum_{i=0}^{n-1}(a[j]-b[i+j])^2a[j] \]
\[ =\sum_{i=0}^{n-1}a[j]^3+a[j]b[i+j]^2-2a[j]^2b[i+j] \]
\[ =\sum_{i=0}^{n-1}a[j]^3+\sum_{i=0}^{n-1}a[j]b[i+j]^2-2\sum_{i=0}^{n-1}a[j]^2b[i+j] \]
前面的是常数,所以我们只需要考虑快速计算形如\( \sum_{i=0}^{n-1}a[j]b[i+j] \) 的东西即可,设na nb分别是a b数组倒过来(也就是reverse一下)
\[ \sum_{i=0}^{n-1}a[j]b[i+j] \]
\[ =\sum_{i=0}^{n-i-1}a[j]b[i+j]+\sum_{i=n-i}^{n-1}a[j]b[i+j] \]
\[ =\sum_{i=0}^{n-i-1}a[j]nb[n-i-1-j]+\sum_{i=0}^{i-1}a[n-i+j]b[n+j] \]
\[ =\sum_{i=0}^{n-i-1}a[j]nb[(n-i-1)-j]+\sum_{i=0}^{i-1}na[(i-1)-j]b[n+j] \]
这样就两部分卷积可以用FFT优化了

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
using namespace std;
const int N=500005;
int n,m,bt,lm,re[N],tot;
double ans[N],sm;
char s[N],t[N];
struct cd
{
    double a,b;
    cd(double A=0,double B=0)
    {
        a=A,b=B;
    }
    cd operator + (const cd &x) const
    {
        return cd(a+x.a,b+x.b);
    }
    cd operator - (const cd &x) const
    {
        return cd(a-x.a,b-x.b);
    }
    cd operator * (const cd &x) const
    {
        return cd(a*x.a-b*x.b,a*x.b+b*x.a);
    }
}a[N],b[N],a2[N],b2[N],na[N],nb[N],na2[N],nb2[N];
void dft(cd a[],int f)
{
    for(int i=0;i<lm;i++)
        if(i<re[i])
            swap(a[i],a[re[i]]);
    for(int i=1;i<lm;i<<=1)
    {
        cd wi=cd(cos(M_PI/i),f*sin(M_PI/i));
        for(int k=0;k<lm;k+=(i<<1))
        {
            cd w=cd(1,0),x,y;
            for(int j=0;j<i;j++)
            {
                x=a[j+k],y=w*a[i+j+k];
                a[j+k]=x+y,a[i+j+k]=x-y;
                w=w*wi;
            }
        }
    }
    if(f==-1)
        for(int i=0;i<lm;i++)
            a[i].a/=lm;
}
void fft(cd a[],cd b[])
{
    dft(a,1);
    dft(b,1);
    for(int i=0;i<lm;i++)
        a[i]=a[i]*b[i];
    dft(a,-1);
}
int main()
{
    scanf("%s%s",s,t);
    m=strlen(s),n=strlen(t);
    for(int i=0;i<n;i++)
        a[i].a=(t[i]=='?')?0:t[i]-'a'+1,a2[i].a=a[i].a*a[i].a,sm+=a[i].a*a[i].a*a[i].a;
    for(int i=0;i<m;i++)
        b[i].a=s[i]-'a'+1,b2[i].a=b[i].a*b[i].a;
    for(int i=0;i<m;i++)
        na[i]=a[m-i-1],nb[i]=b[m-i-1],na2[i]=a2[m-i-1],nb2[i]=b2[m-i-1];
    for(bt=0;(1<<bt)<=2*m;bt++);
    lm=1<<bt;
    for(int i=0;i<lm;i++)
        re[i]=(re[i>>1]>>1)|((i&1)<<(bt-1));
    fft(a,nb2);
    fft(b2,na);
    fft(a2,nb);
    fft(b,na2);
    for(int i=0;i<=m-n;i++)
    {
        ans[i]=sm+(int)(a[m-i-1].a+0.5)-2*(int)(a2[m-i-1].a+0.5);
        if(i>0)
            ans[i]+=(int)(b2[i-1].a+0.5)-2*(int)(b[i-1].a+0.5);
        tot+=(ans[i]==0);
    }
    printf("%d\n",tot);
    for(int i=0;i<=m-n;i++)
        if(ans[i]==0)
            printf("%d ",i);
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/lokiii/p/10032311.html