本课程来自
深度之眼,部分截图来自课程视频。
【第三章 概率论】3.3期望与方差
在线LaTeX公式编辑器
任务详解:
掌握矩估计和极大似然估计算法
1.矩估计
算一些矩的统计量。之前算的期望实际上是一阶矩统计
∫−∞+∞xf(x)dx
方差实际上是二阶矩统计
∫−∞+∞x2f(x)dx
下面看k阶矩统计。
设
X为连续型随机变量,其概率密度为
f(x;θ1,θ2,⋯,θk),或
X为离散型随机变量,其分布律为
P{X=x}=p(x;θ1,θ2,⋯,θk),其中
θ1,θ2,⋯,θk为待估参数,
X1,X2,⋯,Xn是来自
X的样本。假设总体
X的前
k阶矩:
连续型:
μl=E(Xl)=∫−∞+∞xlf(x;θ1,θ2,⋯,θk)dx,l=1,2,⋯,k
离散型:
μl=E(Xl)=x∈RX∑xlp(x;θ1,θ2,⋯,θk),l=1,2,⋯,k
k阶矩中,x都被积分积掉,或者求和求掉,所以这
k阶矩的
μ1(θ1,θ2,⋯,θk),μ2(θ1,θ2,⋯,θk),...,μl(θ1,θ2,⋯,θk)都是关于参数
θ函数。
样本矩:
Al=n1i=1∑nXil
一阶样本矩:
A1=nx1+x2+,,,+xn
二阶样本矩:
A2=nx12+x22+,,,+xn2
l阶样本矩:
Al=nx1l+x2l+,,,+xnl
然后样本矩与
k阶矩有相等的关系(这个就是矩估计的假设)
A1=μ1,A2=μ2,...,Al=μl
---------------------------------------------------------割你没商量1------------------------------------------------------
看不懂就看例子
例2设总体X在[a,b]上服从均匀分布,a,b未知.
X1,X2,⋯,Xn是来自X的样本,试求a,b的矩估计量。
解均匀分布的公式为:
f(x)=⎩⎨⎧b−a1,a<x<b0,其他
现在要解出a和b,所以要算两个矩统计的方程来解出a和b:
μ1=E(X)=(a+b)/2
μ2=E(X2)=D(X)+[E(X)]2=(b−a)2/12+(a+b)2/4
得到一组方程组:
{a+b=2μ1b−a=12(μ2−μ12)
解方程组得:
a=μ1−3(μ2−μ12)
,b=μ1+3(μ2−μ12)
然后用样本矩A来替换
μ,
A1=nx1+x2+,,,+xn=X
A2=nx12+x22+,,,+xn2
得到a,b的矩估计量分别为:
a
=A1−3(A2−A12)
b
=A1+3(A2−A12)
---------------------------------------------------------割你没商量1------------------------------------------------------
---------------------------------------------------------割你没商量2------------------------------------------------------
下面看一个高斯分布的例子:
例3设总体
X的均值
μ及方差
σ2都存在,且有
σ2>0但
μ,
σ2均为未知.
又设
X1,X2,⋯,Xn是来自
X的样本.试求
μ,
σ2的矩估计量。
解:
{μ1=E(X)=μ,μ2=E(X2)=D(X)+[E(X)]2=σ2+μ2
解得:
{μ=μ1,σ2=μ2−μ12
分别用
A1,A2代替
μ1,μ2,得
μ,
σ2的矩估计量
μ
=A1=X
σ2
=A2−A12=n1i=1∑nXi2−X2=n1i=1∑n(Xi−X)2
---------------------------------------------------------割你没商量2------------------------------------------------------
2.极大似然估计
设
X1,X2,⋯,Xn是来自
X的样本
联合概率分布:
P(x1,x2,⋯,xn;θ)=p(x1;θ)p(x2;θ)⋯p(xn;θ)
离散型写成:
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏np(xi;θ)
连续型写成:
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏nf(xi;θ)
要求参数
θ使得抽到样本
x1,x2,⋯,xn的联合概率最大,也就是把
θ看成变量,求函数
L(θ)的最大值,求极值的做法通常就是求导:
dθdL(θ)=0
由于函数
L(θ)是连乘的形式,不好求解,因此把连乘变成连加,套路就是取对数后求导(极大似然变成对数极大似然):
dθdlnL(θ)=0
---------------------------------------------------------割你没商量3------------------------------------------------------
例4:设
X∼b(1,p).
X1,X2,⋯,Xn是来自
X的样本,求参数p的最大似然估计量
解:设样本
x1,x2,⋯,xn是相应于样本
X1,X2,⋯,Xn的一个样本值。X的分布律为:
P{X=x}=px(1−p)1−x,x=0,1
故似然函数为(这里连乘的指数要累加起来):
L(p)=i=1∏npxi(1−p)1−xi=p∑i=1nxi(1−p)n−∑i=1nxi,
走对数似然函数的套路:
lnL(p)=(i=1∑nxi)lnp+(n−i=1∑nxi)ln(1−p),
令
dpdlnL(p)=p∑i=1nxi−1−pn−∑i=1nxi=0,
解得p的最大似然估计值
p
=n1i=1∑nxi=xˉ,
p的最大似然估计量为
p
=n1i=1∑nXi=Xˉ.
---------------------------------------------------------割你没商量3------------------------------------------------------
---------------------------------------------------------割你没商量4------------------------------------------------------
高斯分布用最大似然估计来搞搞。
例5:设
X∼N(μ,σ2),
μ,σ2为未知参数,
x1,x2,⋯,xn是来自
X的样本,求
μ,σ2的最大似然估计量。
解:X的概率密度为
f(x;u,σ2)=2πσ
1exp[−2σ21(x−μ)2]
似然函数为:
L(u,σ2)=i=1∏n2πσ
1exp[−2σ21(xi−μ)2]=(2π)−π/2(σ2)−π/2exp[−2σ21i=1∑n(xi−μ)2]
走对数似然套路:
lnL=−2nln(2π)−2nlnσ2−2σ21i=1∑n(xi−μ)2
令:
⎩⎪⎪⎨⎪⎪⎧∂μ∂lnL=σ21(∑i=1nxi−nμ)=0,∂σ2∂lnL=−2σ2n+2(σ2)21∑i=1n(xi−μ)2=0.
由前一式解得
μ
=n1∑i=1nxi=xˉ,代入后一式得
σ2^=n1∑i=1n(xi−xˉ)2,因此得
μ,σ2的最大似然估计量分别为:
μ
=X,σ2^=n1i=1∑n(Xi−Xˉ)2
---------------------------------------------------------割你没商量4------------------------------------------------------
---------------------------------------------------------割你没商量5------------------------------------------------------
均匀分布的最大似然估计
例2设总体X在[a,b]上服从均匀分布,a,b未知.
x1,x2,⋯,xn是来自X的样本,试求a,b的最大似然估计。
由于所有的样本都是在[a,b]上取的,均匀分布的
均匀分布的公式为:
f(x;a,b)=⎩⎨⎧b−a1,a≤x≤b0,其他
似然函数为(均匀分布每个样本取的概率都一样,乘起来就是下面):
L(a,b)=⎩⎨⎧(b−a)n1,a≤x1,x2,⋯,xn≤b0,其他
这里不用走对数似然的套路,直接分析,要使得似然函数最大,就要使得分母
(b−a)n最小,也就是b和a尽量接近,但是又要包含
x1,x2,⋯,xn这些样本,因此:
a^=minXi,b^=maxXi
---------------------------------------------------------割你没商量5------------------------------------------------------