随机过程:
每个随机过程是关于随机变量
t
的函数:
连续情况下
ζ(t),t∈[α,β]
;
离散情况下
ζ(t1)...ζ(tT),t=1,...,T
;
离散时间随机过程,状态序列
S1,...ST
,记
V=1,2,...,N
,即
St
取值为
V
中某个
i
,
St=i
P(S1,...,ST)=P(S1)⋅P(S2|S1)⋅P(S3|S1,S2)...⋅P(ST|S1,...,ST−1)
马尔科夫性
:前一个状态确定,后一个状态就只跟前一个状态有关,即
P(ST|S1,...,ST−1)=P(ST|ST−1)
所以:
P(S1,...,ST)=P(S1)⋅P(S2|S1)⋅P(S3|S2)...⋅P(ST|ST−1)=P(S1)∏t=2TP(St|St−1)
上式称为
马尔科夫过程/马尔科夫链
。
齐次马尔科夫过程
:
P(S2=j|S1=i)=P(S3=j|S2=i)
即(与
t
无关):
P(St=j|St−1=i)=aij
隐式马尔科夫模型(HMM, Hidden Markov Model)
S={1,2,...,N},N
个状态(股市的牛、熊、
Boring
);
初始状态概率分布
π=[π1,...,πN]
;
状态转移矩阵
A=[aij]N∗M,aij=P(St|St−1)
;
A=牛熊Boring⎡⎣⎢0.60.50.40.20.30.10.20.20.5⎤⎦⎥
V=V1,...,Vm
,每个状态下的观察符号为
M
(股票的升、降、平);
观察符号概率分布矩阵
B=[bjk]N∗M,bjk=P(Ot=Vk|St=j)
;
B=状态1−牛2−熊3−Bor升降平⎡⎣⎢0.60.50.40.20.30.10.20.20.5⎤⎦⎥
记观察序列为
O={O1,O2,...,OT},S={S1,...,ST}
P(O|A,B,π)=P(O|λ)=∑SP(O,S|λ)=∑SP(O|Sλ)⋅P(S|λ)
其中:
P(S|λ)=P(S1,...,ST|λ)=P(S1)P(S2|S1)...P(ST|ST−1)=πS1aS1S2...aST−1ST
P(O|S,λ)假定观察值独立−→−−−−−−−−=P(O1,...,OT|S1,...,ST,λ)=P(O1|S1)P(O2|S2)...P(OT|ST)=bS1O1...bSTOT
所以:
P(O|λ)=∑SπS1bS1O1aS1S2bS2O2...aST−1STbSTOT
由于其中序列S有N^T种可能,计算复杂度过高,引入
αt(i)=P(O1O2...Ot,St=i|λ)
则
α1(i)=P(O1,St=i|λ)=P(S1=i|λ)P(O1|S1=i,λ)=πibiO1
下证:
αt+1(j)=P(O1O2...Ot+1,St+1=j|λ)=(∑i=1Nαt(i)⋅aij)⋅bjOt+1
证明:
(∑i=1Nαt(i)⋅aij)⋅bjOt+1=[∑i=1NP(O1...Ot,St=i|λ)⋅P(St+1=j|St=i)]⋅P(Ot+1|St+1=j)=(∑i=1NP(O1...Ot,St=i,St+1=j|λ))⋅P(Ot+1|St+1=j))=P(O1...Ot,St+1=j|λ)⋅P(Ot+1|St+1=j))=P(O1...Ot+1,St+1=j|λ)
所以:
αT(i)=P(O1O2...OT,ST=i|λ)
P(O|λ)=∑i=1NP(O1...OT,ST=i|λ)=∑i=1NαT(i)
复杂度为
O(N2T)