使用EM算法对含有缺失数据的联合泊松分布的参数进行极大似然估计

本文是对《ML estimation in the bivariate passion distribution in the presence of missing values via the em algorithm》K.Adamids & S.Loukas (1994)的研究总结。


前一段时间研究了含有缺失数据的联合正态分布参数的估计,应该说,对于连续性假设的研究是不够完整的,最近开始研究一种离散分布假设-联合泊松分布的参数估计方法,尽管在现实生活中很难找到服从联合泊松分布的案例,然而对于理论完整性的研究仍然是有必要的。
EM算法在很早的研究中就被用来作为一种估计含有潜变量参数的有效方法,典型的应用如混合高斯分布模型。然而,不同的分布潜变量的定义有所不同,以本文为例,联合泊松分布定义为:
假定X’, Y’, U 是各自服从参数为a,b,d的独立泊松随机变量,并且满足:
这里写图片描述
并且
这里写图片描述
在E步:
假设
这里写图片描述
满足
这里写图片描述
这里写图片描述
那么
在M步,我们可以通过求解下面概率密度函数的极大似然估计:
这里写图片描述
得到
这里写图片描述
根据估计的无偏性,可以得到:
这里写图片描述
因此我们只需要为a,b,d设置一个初始值,带入E步的等式中可以得到s1,s2,s3的期望,然后带入M步,更新三个参数的值。如此迭代,直到收敛。
假定a=b=2,d=1,通过实验,我们可以得到
这里写图片描述
以e-5作为收敛条件,可见,最后得到的估计结果a=2.053,b=041,c=0.965,与原始值还是很接近的。

猜你喜欢

转载自blog.csdn.net/iqqiqqiqqiqq/article/details/79919200