【学习笔记】Cayley-Hamilton定理

【定理简介】

Cayley-Hamilton定理的叙述如下：设\(A\)是数域\(P\)上的\(N\)阶矩阵，其特征多项式\(p(\lambda)=|\lambda E-A|=\lambda^N+b_1\lambda^{N-1}+b_2\lambda^{N-2}+...+b_{N-1}\lambda+b_N\)。

则\(p(A)=A^N+b_1A^{N-1}+b_2A^{N-2}+...+b_{N-1}A+b_N=O\)，即\(p(\lambda)\)为化零多项式。

由Cayley-Hamilton定理，我们可以将常系数其次线性递推的矩阵乘法优化的时间复杂度从\(O(N^3LogK)\)优化至\(O(N^2LogK)\)乃至\(O(NLogNLogK)\)（本文不对此进行讨论）。

【算法流程】

考虑常系数其次线性递推\(h_i=\sum_{j=1}^{N}a_j*h_{i-j}(i>N)\)的转移矩阵\(M\)的特征多项式\(p(\lambda)\)，将行列式按第一行展开，有\(p(\lambda)=\lambda^N-a_1\lambda^{N-1}-a_2\lambda^{N-2}-...-a_N\)，因此有\(p(M)=M^N-a_1M^{N-1}-a_2M^{N-2}-...-a_NE=0\)，
即\(M^N=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\)。

因此，对于任意\(i\)，\(M^i\)都可以表示成\(E,M,M^2,...,M^{N-1}\)的线性组合。

由\(M^N=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\)，显然\(M^{N+X}=a_1M^{N+X-1}+a_2M^{N+X-2}+...+a_NM^X\)同样成立。

令\(M^X=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\)，\(M^Y=b_1M^{N-1}+b_2M^{N-2}+...+b_NE\)，则有\(M_{X+Y}=\sum_{i=0}^{2N-2}M^{i}\sum_{j+k=i}a_j*b_k\)。

我们发现\(M^{X+Y}\)的各项系数恰好是\(M^X\)和\(M^Y\)各项系数的卷积形式，将得到的系数对\(M^N\)的各项系数进行多项式取模，就可以得到\(M^{X+Y}\)的各项系数。

现在我们希望求得\(M^k*B\)，那么我们可以先求得\(M^k=a_1M^{N-1}+a_2M^{N-2}+...+a_NE\)，那么\(M^k*B\)即为\(M^k*B=a_1M^{N-1}*B+a_2M^{N-2}*B+...+a_NE*B\)。

同时由于\(M^x*B\)对应了原数列的第\(x,x+1,x+2,...,x+N-1\)项，预处理数列的前\(2N\)项即可计算得出\(M^k*B\)。

如果用暴力实现卷积，取模，其时间复杂度为\(O(N^2LogK)\)。

【代码】

模板题【BZOJ4161】

#include<bits/stdc++.h>
using namespace std;
const int MAXN = 4005;
const int P = 1e9 + 7;
template <typename T> void chkmax(T &x, T y) {x = max(x, y); }
template <typename T> void chkmin(T &x, T y) {x = min(x, y); } 
template <typename T> void read(T &x) {
	x = 0; int f = 1;
	char c = getchar();
	for (; !isdigit(c); c = getchar()) if (c == '-') f = -f;
	for (; isdigit(c); c = getchar()) x = x * 10 + c - '0';
	x *= f;
}
template <typename T> void write(T x) {
	if (x < 0) x = -x, putchar('-');
	if (x > 9) write(x / 10);
	putchar(x % 10 + '0');
}
template <typename T> void writeln(T x) {
	write(x);
	puts("");
}
int n, k;
int a[MAXN], now[MAXN];
int res[MAXN], h[MAXN];
void times(int *x, int *y) {
	static int tmp[MAXN];
	memset(tmp, 0, sizeof(tmp));
	for (int i = 0; i <= k - 1; i++)
	for (int j = 0; j <= k - 1; j++)
		tmp[i + j] = (tmp[i + j] + 1ll * x[i] * y[j]) % P;
	for (int i = 2 * k - 2; i >= k; i--) {
		for (int j = 1; j <= k; j++)
			tmp[i - j] = (tmp[i - j] + 1ll * tmp[i] * a[j]) % P;
		tmp[i] = 0;
	}
	for (int i = 0; i <= k - 1; i++)
		x[i] = tmp[i];
}
int main() {
	read(n), read(k);
	for (int i = 1; i <= k; i++) {
		read(a[i]);
		if (a[i] < 0) a[i] += P;
	}
	for (int i = 0; i <= k - 1; i++) {
		read(h[i]);
		if (h[i] < 0) h[i] += P;
	}
	if (n <= k - 1) {
		writeln(h[k]);
		return 0;
	}
	n -= k - 1; res[0] = now[1] = 1;
	while (n != 0) {
		if (n & 1) times(res, now);
		n >>= 1;
		times(now, now);
	}
	for (int i = k; i <= 2 * k - 2; i++)
	for (int j = 1; j <= k; j++)
		h[i] = (h[i] + 1ll * h[i - j] * a[j]) % P;
	int ans = 0;
	for (int i = 0; i <= k - 1; i++)
		ans = (ans + 1ll * h[k - 1 + i] * res[i]) % P;
	writeln(ans);
	return 0;
}

【学习笔记】Cayley-Hamilton定理

猜你喜欢