Loj 3058. 「HNOI2019」白兔之舞

Loj 3058. 「HNOI2019」白兔之舞

题目描述

有一张顶点数为 \((L+1)\times n\) 的有向图。这张图的每个顶点由一个二元组 \((u,v)\) 表示 \((0\le u\le L,1\le v\le n)\)。这张图不是简单图,对于任意两个顶点 \((u_1,v_1),(u_2,v_2)\),如果 \(u_1<u_2\),则从 \((u_1,v_1)\)\((u_2,v_2)\) 一共有 \(w(v_1,v_2)\) 条不同的边,如果 \(u_1\ge u_2\) 则没有边。

白兔将在这张图上上演一支舞曲。白兔初始时位于该有向图的顶点 \((0,x)\)

白兔将会跳若干步。每一步,白兔会从当前顶点沿任意一条出边跳到下一个顶点。白兔可以在任意时候停止跳舞(也可以没有跳就直接结束)。当到达第一维为 \(L\) 的顶点就不得不停止,因为该顶点没有出边。

假设白兔停止时,跳了 \(m\) 步,白兔会把这只舞曲给记录下来成为一个序列。序列的第 \(i\) 个元素为它第 \(i\) 步经过的边。

问题来了:给定正整数 \(k\)\(y\ (1\le y\le n)\),对于每个 \(t\ (0\le t<k)\),求有多少种舞曲(假设其长度为 \(m\))满足 \(m \bmod k=t\),且白兔最后停在了坐标第二维为 \(y\) 的顶点?

两支舞曲不同定义为它们的长度(\(m\))不同或者存在某一步它们所走的边不同。

输出的结果对 \(p\) 取模。

输入格式

第一行六个用空格隔开的整数 \(n,k,L,x,y,p\)

接下来 \(n\) 行,每行有 \(n\) 个用空格隔开的整数,第 \(i\) 行的第 \(j\) 个数表示 \(w(i,j)\)

输出格式

依次输出 \(k\) 行,每行一个数表示答案对 \(p\) 取模的结果。

样例

样例输入 1

2 2 3 1 1 998244353
2 1
1 0

样例输出 1

16
18

样例输入 2

3 4 100 1 3 998244353
1 1 1
1 1 1
1 1 1

样例输出 2

506551216
528858062
469849094
818871911

数据范围与提示

对于全部数据,\(p\) 为一个质数,\(10^8<p<2^{30}\)\(1\le n\le 3\)\(1\le x\le n\)\(1\le y\le n\)\(0\le w(i,j)<p\)\(1\le k\le 65536\)\(k\)\(p-1\) 的约数,\(1\le L\le 10^8\)

对于每组测试点,特殊限制如下:

  • 测试点 \(1,2\)\(L\le 10^5\)
  • 测试点 \(3\)\(n=1,w(1,1)=1\)\(k\) 的最大质因子为 \(2\)
  • 测试点 \(4\)\(n=1\)\(k\) 的最大质因子为 \(2\)
  • 测试点 \(5\)\(n=1,w(1,1)=1\)
  • 测试点 \(6\)\(n=1\)
  • 测试点 \(7,8\)\(k\) 的最大质因子为 \(2\)

\(\\\)

湖南的题好神啊,只能\(Orz\)了。

先考虑从\(x\)\(L\)步到\(y\),假设每次向右只走一格的方案数。很容易写出一个\(DP\)方程,然后用矩阵快速幂优化。我们读进来的矩阵\(A\)就是转移矩阵。所以方案数就是\([A^i]_{x,y}\)

计算答案的时候就枚举走了\(i\)步:
\[ ans_t=\sum_{i=0}^L[i\%k==t]\binom{L}{i}[A^i]_{x,y}\\ =\sum_{i=0}^L\frac{1}{k}\sum_{j=0}^{k-1}\omega_k^{(i-t)*j}\binom{L}{i}[A^i]_{x,y}\\ =\frac{1}{k}\sum_{j=0}^{k-1}\omega_k^{-jt} \sum_{i=0}^L\binom{L}{i}(\omega_k^{ij} [A^i]_{x,y})\\ =\frac{1}{k}\sum_{j=0}^{k-1}\omega_k^{-jt}[(\omega_k^jA+I)^L]_{x,y}\\ \]
其中:
\[ I=\begin{bmatrix} 1&0&0\\ 0&1&0\\ 0&0&1\\ \end{bmatrix} \]
上面最后一步变换实质上就是二项式定理\(\sum_{i=0}^n\binom{n}{i}x_i=(1+x)^n\)的运用。

设:
\[ f_j=[(\omega_k^jA+I)^L]_{x,y} \]
则:
\[ ans_t=\frac{1}{k}\sum_{j=0}^{k-1}\omega_{k}^{-jt}f_j\\ \]
然后就是一个很牛逼的套路:
\[ -tj=\binom{t}{2}+\binom{j}{2}-\binom{t+j}{2} \]
所以:
\[ ans_t=\frac{1}{k}\sum_{j=0}^{k-1}\omega_k^{\binom{t}{2}+\binom{j}{2}-\binom{t+j}{2}}f_j\\ =\frac{1}{k}\omega_k^{\binom{t}{2}}\sum_{j=0}^{k-1}\omega_k^{\binom{j}{2}}f_j\cdot\omega_k^{-\binom{t+j}{2}} \]
\(ans_i\)的生成函数可以写成下面两个函数卷积。
\[ F(n)=\omega_k^{\binom{i}{2}}\cdot f_n\\ G(n)=\omega_k^{-\binom{2*k-1-n}{2}}\\ \]
代码:

#include<bits/stdc++.h>
#define ll long long
#define K 200005

using namespace std;
inline ll Get() {ll x=0,f=1;char ch=getchar();while(ch<'0'||ch>'9') {if(ch=='-') f=-1;ch=getchar();}while('0'<=ch&&ch<='9') {x=(x<<1)+(x<<3)+ch-'0';ch=getchar();}return x*f;}

ll n,k,L,x,y,mod;
ll g,W,w[K];
ll f[K];
ll ksm(ll t,ll x) {
    ll ans=1;
    for(;x;x>>=1,t=t*t%mod)
        if(x&1) ans=ans*t%mod;
    return ans;
}

vector<int>fac;
void work(int t) {
    for(int i=2,maxx=sqrt(t);i<=maxx;i++) {
        if(t%i==0) fac.push_back(i);
        while(t%i==0) t/=i;
    }
    if(t>1) fac.push_back(t);
}

ll Find_root() {
    for(int i=2;i<mod;i++) {
        if(ksm(i,mod-1)!=1) continue ;
        int flag=1;
        for(int j=0;j<fac.size();j++) {
            if(ksm(i,(mod-1)/fac[j])==1) {
                flag=0;
                break;
            }
        }
        if(flag) return i;
    }
}

struct matrix {
    ll a[4][4];
    void Init() {memset(a,0,sizeof(a));}
}A,B;

matrix operator *(const matrix &a,const matrix &b) {
    static matrix tem;
    tem.Init();
    for(int i=1;i<=n;i++) {
        for(int j=1;j<=n;j++) {
            for(int k=1;k<=n;k++)
                tem.a[i][j]+=a.a[i][k]*b.a[k][j]%mod;
                tem.a[i][j]%=mod;
        }
    }
    return tem;
}

matrix ksm(matrix g,ll x) {
    static matrix ans;
    ans.Init();
    for(int i=1;i<=n;i++) ans.a[i][i]=1;
    for(;x;x>>=1,g=g*g)
        if(x&1) ans=ans*g;
    return ans;
}

ll C_2(ll n) {return n*(n-1)/2%k;}
struct Com {
    long double r,v;
    Com() {}
    Com(long double _r,long double _v) {r=_r,v=_v;}
};

Com operator *(const Com &a,const Com &b) {return Com(a.r*b.r-a.v*b.v,a.r*b.v+a.v*b.r);}
Com operator +(const Com &a,const Com &b) {return Com(a.r+b.r,a.v+b.v);}
Com operator -(const Com &a,const Com &b) {return Com(a.r-b.r,a.v-b.v);}
Com operator /(const Com &a,const long double &b) {return Com(a.r/b,a.v/b);}
const long double pi=acos(-1);
void FFT(Com *a,int d,int flag) {
    int n=1<<d;
    static int rev[K<<2];
    for(int i=0;i<n;i++) rev[i]=(rev[i>>1]>>1)|((i&1)<<d-1);
    for(int i=0;i<n;i++) if(i<rev[i]) swap(a[i],a[rev[i]]);
    for(int s=1;s<=d;s++) {
        int len=1<<s,mid=len>>1;
        Com w(cos(2*flag*pi/len),sin(2*flag*pi/len));
        for(int i=0;i<n;i+=len) {
            Com t(1,0);
            for(int j=0;j<mid;j++,t=t*w) {
                Com u=a[i+j],v=a[i+j+mid]*t;
                a[i+j]=u+v;
                a[i+j+mid]=u-v;
            }
        }
    }
    if(flag==-1) {for(int i=0;i<n;i++) a[i]=a[i]/n;}
}

ll F[K<<2],G[K<<2],ans[K<<2];
void mul(ll *a,ll *b,ll *c,int d) {
    Com A[K<<2],B[K<<2],C[K<<2],D[K<<2];
    Com f1[K<<2],f2[K<<2],f3[K<<2],f4[K<<2];
    ll maxx=sqrt(mod);
    int n=1<<d;
    for(int i=0;i<n;i++) {
        A[i]=Com(a[i]/maxx,0);
        B[i]=Com(a[i]%maxx,0);
        C[i]=Com(b[i]/maxx,0);
        D[i]=Com(b[i]%maxx,0);
    }
    FFT(A,d,1),FFT(B,d,1);
    FFT(C,d,1),FFT(D,d,1);
    for(int i=0;i<n;i++) {
        f1[i]=A[i]*C[i];
        f2[i]=A[i]*D[i];
        f3[i]=B[i]*C[i];
        f4[i]=B[i]*D[i];
    }
    FFT(f1,d,-1),FFT(f2,d,-1);
    FFT(f3,d,-1),FFT(f4,d,-1);
    for(int i=0;i<n;i++) {
        c[i]=((ll)(f1[i].r+0.5)*maxx%mod*maxx%mod+(ll)(f2[i].r+0.5)*maxx%mod+(ll)(f3[i].r+0.5)*maxx+(ll)(f4[i].r+0.5))%mod;
    }
}

int main() {
    n=Get(),k=Get(),L=Get(),x=Get(),y=Get(),mod=Get();
    for(int i=1;i<=n;i++)
        for(int j=1;j<=n;j++)
            A.a[i][j]=Get();
    
    work(mod-1);
    g=Find_root();
    
    w[0]=1;
    w[1]=ksm(g,(mod-1)/k);
    for(int i=2;i<k;i++) w[i]=w[i-1]*w[1]%mod;
    
    for(int j=0;j<k;j++) {
        B=A;
        for(int i=1;i<=n;i++) {
            for(int k=1;k<=n;k++) {
                B.a[i][k]=B.a[i][k]*w[j];
                if(i==k) B.a[i][k]++;
                B.a[i][k]%=mod;
            }
        }
        B=ksm(B,L);
        f[j]=B.a[x][y];
    }
    
    for(int i=0;i<k;i++) F[i]=w[C_2(i)]*f[i]%mod;
    for(int i=0;i<2*k;i++) G[i]=w[(k-C_2(i))%k]%mod;
    
    reverse(G,G+2*k);
    
    int d=ceil(log2(3*k));
    mul(F,G,ans,d);
    
    ll invk=ksm(k,mod-2);
    for(int i=0;i<k;i++) {
        cout<<ans[2*k-1-i]*invk%mod*w[C_2(i)]%mod<<"\n";
    }
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/hchhch233/p/10698752.html