【定理简介】
- Cayley-Hamilton定理的叙述如下:设\(A\)是数域\(P\)上的\(N\)阶矩阵,其特征多项式\(p(\lambda)=|\lambda E-A|=\lambda^N+b_1\lambda^{N-1}+b_2\lambda^{N-2}+...+b_{N-1}\lambda+b_N\)。
- 则\(p(A)=A^N+b_1A^{N-1}+b_2A^{N-2}+...+b_{N-1}A+b_N=O\),即\(p(\lambda)\)为化零多项式。
- 由Cayley-Hamilton定理,我们可以将常系数其次线性递推的矩阵乘法优化的时间复杂度从\(O(N^3LogK)\)优化至\(O(N^2LogK)\)乃至\(O(NLogNLogK)\)(本文不对此进行讨论)。
【算法流程】
- 考虑常系数其次线性递推\(h_i=\sum_{j=1}^{N}a_j*h_{i-j}(i>N)\)的转移矩阵\(M\)的特征多项式\(p(\lambda)\),将行列式按第一行展开,有\(p(\lambda)=\lambda^N-a_1\lambda^{N-1}-a_2\lambda^{N-2}-...-a_N\),因此有\(p(M)=M^N-a_1M^{N-1}-a_2M^{N-2}-...-a_NE=0\),
即\(M^N=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\)。- 因此,对于任意\(i\),\(M^i\)都可以表示成\(E,M,M^2,...,M^{N-1}\)的线性组合。
- 由\(M^N=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\),显然\(M^{N+X}=a_1M^{N+X-1}+a_2M^{N+X-2}+...+a_NM^X\)同样成立。
- 令\(M^X=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\),\(M^Y=b_1M^{N-1}+b_2M^{N-2}+...+b_NE\),则有\(M_{X+Y}=\sum_{i=0}^{2N-2}M^{i}\sum_{j+k=i}a_j*b_k\)。
- 我们发现\(M^{X+Y}\)的各项系数恰好是\(M^X\)和\(M^Y\)各项系数的卷积形式,将得到的系数对\(M^N\)的各项系数进行多项式取模,就可以得到\(M^{X+Y}\)的各项系数。
- 现在我们希望求得\(M^k*B\),那么我们可以先求得\(M^k=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\),那么\(M^k*B\)即为\(M^k*B=a_1M^{N-1}*B+a_2M^{N-2}*B+...+a_NE*B\)。
- 同时由于\(M^x*B\)对应了原数列的第\(x,x+1,x+2,...,x+N-1\)项,预处理数列的前\(2N\)项即可计算得出\(M^k*B\)。
- 如果用暴力实现卷积,取模,其时间复杂度为\(O(N^2LogK)\)。
【代码】
- 模板题【BZOJ4161】
#include<bits/stdc++.h> using namespace std; const int MAXN = 4005; const int P = 1e9 + 7; template <typename T> void chkmax(T &x, T y) {x = max(x, y); } template <typename T> void chkmin(T &x, T y) {x = min(x, y); } template <typename T> void read(T &x) { x = 0; int f = 1; char c = getchar(); for (; !isdigit(c); c = getchar()) if (c == '-') f = -f; for (; isdigit(c); c = getchar()) x = x * 10 + c - '0'; x *= f; } template <typename T> void write(T x) { if (x < 0) x = -x, putchar('-'); if (x > 9) write(x / 10); putchar(x % 10 + '0'); } template <typename T> void writeln(T x) { write(x); puts(""); } int n, k; int a[MAXN], now[MAXN]; int res[MAXN], h[MAXN]; void times(int *x, int *y) { static int tmp[MAXN]; memset(tmp, 0, sizeof(tmp)); for (int i = 0; i <= k - 1; i++) for (int j = 0; j <= k - 1; j++) tmp[i + j] = (tmp[i + j] + 1ll * x[i] * y[j]) % P; for (int i = 2 * k - 2; i >= k; i--) { for (int j = 1; j <= k; j++) tmp[i - j] = (tmp[i - j] + 1ll * tmp[i] * a[j]) % P; tmp[i] = 0; } for (int i = 0; i <= k - 1; i++) x[i] = tmp[i]; } int main() { read(n), read(k); for (int i = 1; i <= k; i++) { read(a[i]); if (a[i] < 0) a[i] += P; } for (int i = 0; i <= k - 1; i++) { read(h[i]); if (h[i] < 0) h[i] += P; } if (n <= k - 1) { writeln(h[k]); return 0; } n -= k - 1; res[0] = now[1] = 1; while (n != 0) { if (n & 1) times(res, now); n >>= 1; times(now, now); } for (int i = k; i <= 2 * k - 2; i++) for (int j = 1; j <= k; j++) h[i] = (h[i] + 1ll * h[i - j] * a[j]) % P; int ans = 0; for (int i = 0; i <= k - 1; i++) ans = (ans + 1ll * h[k - 1 + i] * res[i]) % P; writeln(ans); return 0; }