(1) 灰色系统

(2) GM(1,1) 模型

最初的非负数据列： $x^{(0)}=(x^{(0)}(1),x^{(0)}(2),\dots,x^{(0)}(n))$
对其进行一次累加得到新的生成数据列：
$x^{(1)}=(x^{(1)}(1),x^{(1)}(2),\dots,x^{(1)}(n))$
其中 $x^{(1)}(k)=\displaystyle\sum_{i=1}^kx^{(0)}(i)$ $(k=1,2,\dots,n)$
求出对应的紧邻均值生成数列：
$z^{(1)}=(z^{(1)}(1),z^{(1)}(2),\dots,z^{(1)}(n))$
其中 $z^{(1)}(k)=\theta x^{(1)}(k)+(1-\theta)x^{(1)}(k-1)$ $k=2,3,\dots,n$ 且 $\theta=0.5$ 相当于是对两个相邻值做平均。

写出模型的基本形式：
$x^{(0)}(k)+az^{(1)}(k)=b~~~~k=(2,3,\dots,n)$
$b$ 表示灰作用量， $- a$ 表示发展系数。
转化成矩阵形式：
$u=\left[ \begin{matrix} a\\b \end{matrix} \right] ~~Y= \left[ \begin{matrix} x^{(0)}(2)\\ x^{(0)}(3)\\ \vdots \\ x^{(0)}(n) \end{matrix} \right] \left[ \begin{matrix} -z^{(1)}(2)& 1\\ -z^{(1)}(3)& 1\\ \vdots &\vdots \\ -z^{(1)}(n)&1 \end{matrix} \right]$

$Y = B u$
使用最小二乘法得到参数 $a, b$ 的估计值：
$\hat{u}=\left[ \begin{matrix} \hat{a}\\\hat{b} \end{matrix} \right]=(B^TB)^{-1}B^TY$

⚠️ 注意这里 $B^TB$ 必须要可逆，也就是 $B$ 不发生列向量的相关，不存在完全共线性。
⭐️实际上就是类比 $x^{(0)}(k)=b-az^{(1)}(k)\leftrightarrow y=mx+b$ 进行回归，求出系数 $m$ 和 $b$ 。

根据之前的最小二乘法估计出的 $\hat{a}$ 与 $\hat{b}$ 得到方程 $x^{(0)}(k)=-\hat{a}z^{(1)}(k)+\hat{b}\leftrightarrow x^{(1)}(k)-x^{(1)}(k-1)=-\hat{a}z^{(1)}(k)+\hat{b}$
使用定积分进行转化 $x^{(1)}(k)-x^{(1)}(k-1)=\int_{k-1}^k\frac{dx^{(1)}(t)}{dt}dt$
$z^{(1)}(k)=\frac{x^{(1)}(k)+x^{(1)}(k-1)}{2}\approx\int_{k-1}^kx^{(1)}(t)dt$
代入以上两个式子可以将灰色微分方程转化成为白化方程
$\frac{dx^{(1)}(t)}{dt}=-\hat{a}x^{(1)}(t)+\hat{b}$

取初始值 $\hat{x}^{(1)}(t)|_{t=1}=x^{(0)}(1)$
得到对应解 $\hat{x}^{(1)}(t)=[x^{(0)}(1)-\dfrac{\hat{b}}{\hat{a}}]e^{-\hat{a}(t-1)}+\dfrac{\hat{b}}{\hat{a}}$ ，也就是 $\hat{x}^{(1)}(m+1)=[x^{(0)}(1)-\dfrac{\hat{b}}{\hat{a}}]e^{-\hat{a}m}+\dfrac{\hat{b}}{\hat{a}}~~(m=1,2,\dots,n-1)$
通过作差解出对原始值的预测
$\hat{x}^{(0)}(m+1)=\hat{x}^{(1)}(m+1)-\hat{x}^{(1)}m=(1-e^{\hat{a}})[x^{(0)}(1)-\dfrac{\hat{b}}{\hat{a}}]e^{-\hat{a}m}~~(m=1,2,\dots,n-1)$

⭐️ 进行预测只需要在 $n$ 的后面取 $m$ 的值就可以了。

⚠️ 注意灰色预测只对指数趋势的数据有较好的预测结果。

定义序列 $x^{(1)}$ 的级比 $\sigma(k)=\frac{x^{(1)}(k)}{x^{(1)}(k-1)}=1+\frac{x^{(0)}(k)}{x^{(1)}(k-1)}$
定义序列 $x^{(0)}$ 的光滑比 $\rho(k)=\frac{x^{(0)}(k)}{x^{(1)}(k-1)}$
准指数规律要求对 $\forall k,~~\sigma(k)\in[a,b]$ 并且 $b - a < 0.5$ ，由于当 $k$ 很大时， $\rho(k)$ 接近于 $0$ ，因此要求 $\rho(k)\in(0,0.5)$ 即可。
实际建模中，要计算 $\rho(k)\in(0,0.5)$ 的占比，占比越高越好，并且一般 $\rho(2)$ 和 $\rho(3)$ 可能不符合要求，因此更关心后面的期数。

⚠️ 要在预测其它的数据前进行。

$①$ 残差检验

绝对残差： $\epsilon(k)=x^{(0)}(k)-\hat{x}^{(0)}(k)~(k=2,3,\dots,n)$
相对残差： $\epsilon_r(k)=\dfrac{|x^{(0)}(k)-\hat{x}^{(0)}(k)|}{x^{(0)}(k)}\times100\%~(k=2,3,\dots,n)$
平均相对残差： $\overline{\epsilon}_r=\frac{1}{n-1}\sum_{k=2}^n\epsilon_r(k)$
$\overline{\epsilon}_r<20\%$ 达到一般要求
$\overline{\epsilon}_r<10\%$ 拟合效果比较好

$②$ 级比偏差检验

计算原始数据的级比 $\sigma(k)=\frac{x^{(0)}(k)}{x^{(0)}(k-1)}~(k=2,3,\dots,n)$
根据预测的发展系数 $-\hat{a}$ 求出级比偏差
$\eta(k)=|1-\frac{1-0.5\hat{a}}{1+0.5\hat{a}}\frac{1}{\sigma(k)}|$
$\overline{\eta}=\frac{\displaystyle\sum_{k=2}^n\eta(k)}{n-1}$
$\overline{\eta}<20\%$ 达到一般要求
$\overline{\eta}<10\%$ 拟合效果比较好

原始数据序列为 $x^{(0)}=(x^{(0)}(1),x^{(0)}(2),\dots,x^{(0)}(n))$

$①$ 新信息模型

使用原始数据序列预测出 $x^{(0)}(n+1)$ 。
将预测出的数再加入到原始序列中进行下一次预测 $x^{(0)}=(x^{(0)} (1),x^{(0)}(2),\dots,x^{(0)}(n),x^{(0)}(n+1))$
⚠️ 一定要注意，下一次预测取值取的期数还是 $n$ 。

$②$ 新陈代谢模型 ✔️ 一般预测效果最好

使用原始数据序列预测出 $x^{(0)}(n+1)$ 。
将预测出的数再加入到原始序列中，并去掉第一个值之后再进行下一次预测 $x^{(0)}=(x^{(0)}(2),\dots,x^{(0)}(n),x^{(0)}(n+1))$
⚠️ 一定要注意，下一次预测取值取的期数还是 $n$ 。
随着系统的发展，老数据的信息的意义将逐步降低，在不断补充新数据的同时去掉老数据可以使模型更加优化。