马尔可夫链预测 (Markov Chain)

一、人寿保险案例(两状态）

人寿保险公司把人的健康状态分为健康和疾病两种，以一年为一个时段，研究健康状态的转变。假设对某一年龄段的人来说，今年健康，明年继续保持健康的概率为0.8，即明年转为疾病的概率为0.2;而今年患病，明年转为健康的概率为0.7，即明年继续保持疾病状态的概率为0.3。

由于投保人处于健康和疾病状态是随机的，故设Xn表示第n年的状态，Xn=1表示健康，Xn=2表示疾病，n=0,1,2,3,….ai(n)表示第n年处于状态i的概率，i=1,2，即an(i)=P{Xn=i},用pij来表示今年处于状态i来年处于状态j的概率,即pij=P(Xn+1=j|Xn=i)，i=1,2.绘制成链图，见图（1）。

将上面的描述写成表格，如表1，

表1 两状态的状态转移

称P=(pij)2×2为状态转移概率矩阵。

根据全概率公式，有

简写为n=0,1,2,…【1】

由此可见，投保人第n+1时段的身体健康状态的概率，只与第n时段的状态概率和转移概率有关，与第n-1,n-2,…以前的状态概率无关，这种性质称为无后效性，也称为马尔可夫性质。

记a(n)为第n时段投保人的身体健康状态的概率分布向量，则公式【1】可以简写为矩阵和向量的形式【2】

称公式【1】或【2】为状态转移方程，矩阵P称为状态转移矩阵

下面假定投保人初始阶段的身体健康状态分布向量，分别取a(0)=[1,0]T,a(0)=[0,1]T,a(0)=[0,75,0.25]T,分别代入公式【2】,计算结果保留在表2中

p=[0.8 0.2;0.7 0.3];
a01=[1,0];a02=[0,1];a03=[0.75,0.25];
A01=[a01;a01*p;a01*p^2;a01*p^3;a01*p^4;a01*p^8];
A02=[a02;a02*p;a02*p^2;a02*p^3;a02*p^4;a02*p^8];
A03=[a03;a01*p;a03*p^2;a03*p^3;a03*p^4;a03*p^8];
A=[A01;A02;A03];

表2 不同初始状态状态转移数据

n	0	1	2	3	4	…	∞
a1(n)	1	0.8	0.78	0.778	0.7778	…	0.777778
a2(n)	0	0.2	0.22	0.222	0.2222	…	0.222222
a1(n)	0	0.7	0.77	0.777	0.7777	…	0.777778
a2(n)	1	0.3	0.23	0.223	0.2223	…	0.222222
a1(n)	0.75	0.8	0.7775	0.77775	0.777775	…	0.777778
a2(n)	0.25	0.2	0.2225	0.22225	0.222225	…	0.222222

从表2可以看出

无论初始状态的概率分布如何，经过有限次转移后，都会稳定在一个固定的概率分布；

从ai(∞）>0,i=1,2可以看出，无论初始状态i如何，总能以概率大于0达到所有状态j；（对于满足（2）的马氏链，称为正则马氏链。）

状态转移的每个阶段，转移矩阵P都相同，称为马氏链的时齐性，没有特殊说明，一般研究的马氏链都具有时齐性。

二、人寿保险案例（三状态）

保险公式将人的生存状态定义为三种：健康、疾病和死亡（第三中状态）,用Xn=3表示.今年健康，明年可能突发疾病或偶然事件而死亡；今年疾病，明年可能继续疾病、健康或死亡，而一旦死亡，则不能再转为健康或疾病。根据统计，三种状态相互转化的概率如表3.

表3 三状态的状态转移记ai(n)=P{Xn=i},pij=P{X(n+1)=i|X(n)=j},i,j=1,2,3;n=0,2,…则，此案例中的状态转移方程为【3】

将初始状态X01=[1,0,0]T,X02=[0,1,0]T和X03=[0.75,0.25,0]T代入公式【3】，经计算，结果填入表4.

X1=[1,0,0];X2=[0,1,0];X3=[0.75,0.25,0];
p=[0.8 0.18 0.02;0.25 0.65 0.1;0 0 1];
A1=[X1;X1*p;X1*p^2;X1*p^3;X1*p^30;X1*p^60];
A2=[X2;X2*p;X2*p^2;X2*p^3;X2*p^30;X2*p^60];
A3=[X3;X3*p;X3*p^2;X3*p^3;X3*p^30;X3*p^60];
A=[A1,A2,A3]'

表4 不同初始状态的转移结果的数据对比

时段n	0	1	2	3	30	60	∞
a1(n)	1	0.8000	0.6850	0.6133	0.1431	0.0307	0
a2(n)	0	0.1800	0.2610	0.2930	0.0859	0.0184	0
a3(n)	0	0.0200	0.0540	0.0938	0.7711	0.9509	1
a1(n)	0	0.2500	0.3625	0.4069	0.1192	0.0256	0
a2(n)	1	0.6500	0.4675	0.3691	0.0715	0.0154	0
a3(n)	0	0.1000	0.1700	0.2240	0.8092	0.9590	1
a1(n)	0.75	0.6625	0.6044	0.5617	0.1371	0.0294	0
a2(n)	0.25	0.2975	0.3126	0.3120	0.0823	0.0177	0
a3(n)	0	0.0400	0.0830	0.1264	0.7806	0.9529	1

从表4可以看出：无论初始状态如何，通过状态转移之后，终究会定格在状态3不改变；若转移概率矩阵中pii=1，称状态i为吸状态，称这样的马氏链为吸收链。

三、马氏链基本概念

1、马氏链及其基本方程

按系统的发展进程，时间离散化为n=0,1,2,…，对每个n，系统的状态为随机变量Xn表示，可以取k个值，Xn=1,2,…,k，记ai(n)=P{Xn=i},即状态概率(分布）,从Xn=i到xn+1=j的概率记为pij=P{Xn+1=j|Xn=i}，即转移概率。若Xn+1的取值取决于Xn的取值和转移概率，与前面的xn-1,xn-2,…的取值无关，称这种离散状态按照时间转移的过程为马氏链。

称状态转移概率矩阵，简称转移矩阵，它满足