特征多项式实现线性递推学习笔记

用途

求解形如
\[ g_i=\sum_{i=1}^kg_{n-i}a_i(i>k)\\ g_i=s_i(1\le i\le k) \]
的常系数线性齐次递推的\(g_n\),其中\(n\)很大,\(k\)较小。

暴力

老师,我会暴力!

直接\(O(nk)\)暴力递推,没什么分。

老师,我会矩阵快速幂!

\(O(k^3\log n)\),比上面的做法优一些,但\(k\le 2000\)时就上天了。

优化

最暴力的做法没什么营养,不管它,考虑优化矩阵快速幂的做法。

矩阵快速幂慢在了哪里呢?

设转移矩阵为\(A\),复杂度瓶颈就在于在于要求出\(A^{n-1}\)

设初始列向量\(s={[g_k,g_{k-1},\cdots,g_1]}^T\),\(A\times s\)即为\({[g_{k+1},g_{k},\cdots,g_2]}^T\)

接下来引入一个概念:

特征多项式

\(A\)为一矩阵,那么\(A\)的特征多项式就为\(f(\lambda)=|\lambda I-A|\),其中\(I\)为单位矩阵,\(|A|\)表示\(A\)的行列式。

特征多项式的\(\lambda\)可以代入实数、多项式、矩阵……几乎所有东西。

回到正题。考虑\(A\)的特征多项式,可以发现
\[ \lambda I-A=\left\{ \begin{matrix} \lambda-a_1&-a_2&-a_3&-a_4&\cdots&-a_m\\ -1&\lambda&0&0&\cdots&0\\ 0&-1&\lambda&0&\cdots&0\\ 0&0&-1&\lambda&\cdots&0\\ \cdots&\cdots&\cdots&\cdots&\ddots&\vdots\\ 0&0&0&0&-1&\lambda \end{matrix} \right\} \]
把它在第一行展开,用余子式计算行列式。

可以发现每一个余子式的主对角线都是满的,而且长得像是一个台阶的样子,可以很方便地削成上三角/下三角矩阵。

于是它的行列式就是主对角线的乘积。

于是推一波就会发现
\[ f(\lambda)=\lambda^k-\sum_{i=0}^{k-1} a_{k-i}\lambda^i \]

同时,由\(f(\lambda)​\)的定义可知,\(f(A)=0​\)

现在要求\(A^{n-1}\)

\(Q(A)=A^{n-1}\ \text{mod}\ f(A)\),由\(f(A)=0\)可知\(A^{n-1}=Q(A)\)

(也许你会觉得不能对\(0\)取模,但\(f(A)\)是一个多项式,对其取模相当于减去若干个\(f(A)\),所以没有问题)

又因为\(Q(A)\)是不超过\(k\)次的多项式,所以我们大大减小了计算量,现在只需要求\(Q(A)\times G\)


\[ Q(A)=\sum_{i=0}^{k-1} c_iA^i \]
那么答案就是
\[ \sum_{i=0}^{k-1}c_iA^iG \]
的第\(k\)行。

仔细思考,\(A^iG\)的第\(k\)行的意义是什么?

就是\(s_{i+1}\)

于是答案就是
\[ \sum_{i=0}^{k-1}c_is_{i+1} \]
大功告成。

复杂度瓶颈在多项式快速幂+取模,暴力\(k^2\log n\),NTT、FFT优化可以到\(k\log k\log n\)。(加上\(\ln,\exp\)甚至可以\(O(k(\log k+\log n))\)?)

代码

这里以bzoj4161 Shlw loves matrixI为例。

注意该题中给出的是\(s_{0,\cdots, k-1}\),需要对上方式子进行一定修改。

#include<bits/stdc++.h>
//clock_t t=clock();
namespace my_std{
    using namespace std;
    #define pii pair<int,int>
    #define fir first
    #define sec second
    #define MP make_pair
    #define rep(i,x,y) for (int i=(x);i<=(y);i++)
    #define drep(i,x,y) for (register int i=(x);i>=(y);--i)
    #define go(x) for (int i=head[x];i;i=edge[i].nxt)
    #define templ template<typename T>
    #define sz 4040
    #define mod 1000000007ll 
    typedef long long ll;
    typedef double db;
//  mt19937 rng(chrono::steady_clock::now().time_since_epoch().count());
//  templ inline T rnd(T l,T r) {return uniform_int_distribution<T>(l,r)(rng);}
    templ inline bool chkmax(T &x,T y){return x<y?x=y,1:0;}
    templ inline bool chkmin(T &x,T y){return x>y?x=y,1:0;}
    templ inline void read(T& t)
    {
        t=0;char f=0,ch=getchar();double d=0.1;
        while(ch>'9'||ch<'0') f|=(ch=='-'),ch=getchar();
        while(ch<='9'&&ch>='0') t=t*10+ch-48,ch=getchar();
        if(ch=='.'){ch=getchar();while(ch<='9'&&ch>='0') t+=d*(ch^48),d*=0.1,ch=getchar();}
        t=(f?-t:t);
    }
//  template<typename T,typename... Args>inline void read(T& t,Args&... args){read(t); read(args...);}
    char __sr[1<<21],__z[20];int __C=-1,__zz=0;
    inline void Ot(){fwrite(__sr,1,__C+1,stdout),__C=-1;}
    inline void print(register int x)
    {
        if(__C>1<<20)Ot();if(x<0)__sr[++__C]='-',x=-x;
        while(__z[++__zz]=x%10+48,x/=10);
        while(__sr[++__C]=__z[__zz],--__zz);__sr[++__C]='\n';
    }
    void file()
    {
        #ifndef ONLINE_JUDGE
        freopen("a.in","r",stdin);
        #endif
    }
//  inline void chktime()
//  {
//      #ifndef ONLINE_JUDGE
//      cout<<(clock()-t)/1000.0<<'\n';
//      #endif
//  }
    #ifdef mod
    ll ksm(ll x,int y){ll ret=1;for (;y;y>>=1,x=x*x%mod) if (y&1) ret=ret*x%mod;return ret;}
    ll inv(ll x){return ksm(x,mod-2);}
    #else
    ll ksm(ll x,int y){ll ret=1;for (;y;y>>=1,x=x*x) if (y&1) ret=ret*x;return ret;}
    #endif
//  inline ll mul(ll a,ll b){ll d=(ll)(a*(double)b/mod+0.5);ll ret=a*b-d*mod;if (ret<0) ret+=mod;return ret;}
}
using namespace my_std;

int n,K;
ll a[sz],s[sz];
ll f[sz];
ll c[sz],tmp[sz],tmp2[sz];

void mul(ll *a,ll *b,ll *ret)
{
    rep(i,0,K+K) tmp2[i]=0;
    rep(i,0,K-1) rep(j,0,K-1) (tmp2[i+j]+=a[i]*b[j])%=mod;
    drep(i,K+K-2,K)
        drep(j,K-1,0)   
            (tmp2[i-(K-j)]-=f[j]*tmp2[i])%=mod;
    rep(i,0,K-1) ret[i]=tmp2[i];
}

int main()
{
    file();
    read(n),read(K);
    rep(i,1,K) read(a[i]);
    rep(i,0,K-1) read(s[i]);
    f[K]=1;rep(i,0,K-1) f[i]=mod-a[K-i];
    tmp[1]=1;c[0]=1;
    for (int y=n;y;y>>=1,mul(tmp,tmp,tmp)) if (y&1) mul(tmp,c,c);
    ll ans=0;
    rep(i,0,K-1) (ans+=c[i]*s[i])%=mod;
    cout<<(ans+mod)%mod;
    return 0;
}

毒瘤洛谷\(k\le 32000\)不能暴力了……改天我再补个NTT吧。

猜你喜欢

转载自www.cnblogs.com/p-b-p-b/p/10726848.html