Emmm...?
Emmm...!
接下来的几篇博客,我们来聊聊传说中的EM算法
Jensen不等式将在之后的EM算法的证明中发挥重要的作用,我们先来瞅一瞅
Jensen不等式
假设f为凸函数,X是一个随机变量
则有
E[f(X)]≥f[E(X)]
进一步地,若f是严格凸函数,则:
E[f(X)]>f[E(X)]
E[f(X)]=f[E(X)]成立的条件是P(X=E[X])=1
证明:
我们采用数学归纳法:
f(k=1∑nakxk)≤k=1∑nakf(xk)
当n=1时
有a1=1,因此f(a1x1)≤a1f(x1)显然成立
递归步,假设n=k−1(k≥2)时不等式成立
有:
f(k=1∑n−1akxk)≤k=1∑n−1akf(xk)
只需要证n=k成立
f(k=1∑nakxk)=f(anxn+(1−an)k=1∑n−11−anakxk)(1)
上式将第n项拎出,同时将(1−an)提出来,仅是恒等变换而已
你问我为何要做此恒等变换,可以想象凸函数的定义:
I是定义在凸集C上地某个区间,设f是定义在区间I上的函数,若在I上的任意两点x1,x2和任意的实数λ∈(0,1),总有
f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)
则称f为I上的凸函数,若将定义中的≤换成<也成立,对应可称函数f为对应区间上的严格凸函数
所以(1)式,即是为了配凑λ和(1−λ),我们配凑是有目的的,目的是为了将λ和(1−λ)提出:
f(k=1∑nakxk)=f(anxn+(1−an)k=1∑n−11−anakxk)≤anf(xn)+(1−an)f(k=1∑n−11−anakxk)(2)
接下来,我们用下,之前n=k−1时,假设的条件即可,即:
f(k=1∑n−11−anakxk)≤k=1∑n−11−anakf(xk)(3)
将(3)带入(2)式中,并将公因式(1−an)乘入:
f(k=1∑nakxk)=f(anxn+(1−an)k=1∑n−11−anakxk)≤anf(xn)+(1−an)f(k=1∑n−11−anakxk)≤anf(xn)+(1−an)k=1∑n−11−anakf(xk)≤anf(xn)+k=1∑n−1akf(xk)≤k=1∑nakf(xk)
所以,n=k(k≥2)时,不等式也成立
证毕