分治FFT,就是求形如\(f[i]=\sum f[i-j] \times g[j]\)之类的东西,其中\(g\)数组为给定数组。
我们发现\(f\)数组只有左边能对右边产生贡献,类似于\(CDQ\)分治,我们将一个区间分成两半,先计算左边的值,再算左边对右边的贡献,最后算右边的值。中间有用到卷积的地方可以用\(FFT\)优化。
需要注意的细节呢,就是算左边对右边的贡献的时候,卷积的一部分是没有用的,我们应该把有用的部分累加到\(f\)数组里。
代码:
#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1000009,M=998244353;
int G=3,invG,a[N],b[N],n,m,L,l,r[N],f[N],c[N];
int ksm(int a,int b)
{
int res=1;
while(b)
{
if(b&1)
res=1LL*res*a%M;
b>>=1,a=1LL*a*a%M;
}
return res;
}
void NTT(int a[],int type)
{
for (int i=0;i<L;i++)
if(r[i]<i)
swap(a[r[i]],a[i]);
for (int i=2;i<=L;i<<=1)
{
int Wn=ksm(type==1?G:invG,(M-1)/i),I=i>>1;
for (int j=0;j<L;j+=i)
{
int W=1;
for (int k=j;k<j+I;k++,W=1LL*W*Wn%M)
{
int t1=a[k],t2=1LL*a[k+I]*W%M;
a[k]=(t1+t2)%M,a[k+I]=(t1-t2)%M;
}
}
}
}
void work_1(int a[],int b[],int n,int m)
{
L=1,l=0;
while(L<=n+m) L<<=1,l++;
for (int i=0;i<L;i++) r[i]=(r[i>>1]>>1)|((i&1)<<l-1);
for (int i=n+1;i<L;i++) a[i]=0;
for (int i=m+1;i<L;i++) b[i]=0;
NTT(a,1),NTT(b,1);
for (int i=0;i<L;i++) a[i]=1LL*a[i]*b[i]%M;
NTT(a,-1);
int invL=ksm(L,M-2);
for (int i=0;i<L;i++) a[i]=1LL*a[i]*invL%M;
}
void init()
{
scanf("%d",&n),n--;
for (int i=1;i<=n;i++)
scanf("%d",&a[i]);
invG=ksm(G,M-2),f[0]=1;
}
void CDQ(int l,int r)
{
if(l==r)
return;
int mid=l+r>>1;
CDQ(l,mid);
for (int i=l;i<=r;i++)
b[i-l]=f[i],c[i-l]=a[i-l];
work_1(b,c,mid-l,r-l);
for (int i=mid+1;i<=r;i++)
f[i]=(f[i]+b[i-l])%M;
CDQ(mid+1,r);
}
void work()
{
CDQ(0,n);
for (int i=0;i<=n;i++)
printf("%d ",(f[i]+M)%M);puts("");
}
int main()
{
init();
work();
return 0;
}