本文作者:合肥工业大学 管理学院 钱洋 email:[email protected] 内容可能有不到之处,欢迎交流。
未经本人允许禁止转载。
原因
今天晚上,老师在看LDA数学八卦的时候,问我一个问题,如下图所示:
这个多项式分布的参数,采用极大估计是怎么求的呢?当时想了想还真不知道,于是在网上找了资料,学习了一下,特此记录。
公式推导
很多情况下,假定一个变量
X
有
k
个状态,其中
k>2
,每个状态假定的可能性为
p1,p2,⋯,pk
,且
∑ki=1pi=1
,独立进行
n
次实验,用
n1,n2,⋯,nk
表示每个状态发生的次数,发生的次数服从多项式分布:
p(n1,n2,⋯,nk|p1,p2,⋯,pk)=n!∏ki=1ni!∏i=1kpnii
下面采用极大似然求解:
L(p1,p2,⋯,pk)=log(n!∏ki=1ni!∏i=1kpnii)
=log(n!)−∑i=1klognk!+∑i=1klogpk
对于有约束条件的极值求解问题可使用拉格朗日乘法:
Lagrange(p1,p2,⋯,pk,λ)=L(p1,p2,⋯,pk)−λ(∑i=1kpi−1)
求导(计算梯度):
∂Lagrange(p1,p2,⋯,pk,λ)∂pi=nipi−λ
进而有:
pi=niλ
由于
∑i=1kpiλ=1
得到:
λ=n
进而有:
pi^=nin