点估计
设总体
X
的分布函数的形式已知,但它的一个或多个参数未知,借助于总体
X
的一个样本来估计总体未知参数的值得问题称为参数的点估计问题。
举例:
某炸药厂,一天中发生着火现象的次数
X
是一个随机变量,假设
X
服从
λ>0
泊松分布,即
X∼π(λ)
。根据现有的样本量估计参数
λ
着火次数k |
0 1 2 3 4 5 6 >=7 |
发生k次着火的天数 |
75 90 54 22 6 2 1 0 |
根据
λ=E(X)
,以上的数据表示
X=0
出现了75次,
X=1
出现了90次…,一共有250个样本
E(X)=0×75+1×90+2×54+3×22+4×6+5×2+6×1250=1.22
所以估计参数
λ=1.22
点估计:设总体
X
的分布函数
F(x;θ)
的形式为已知,
θ
是待估参数,
X1,X2,...,Xn
是
X
的一个样本,
x1,x2,...,xn
是对应的样本值。点估计问题是构造出一个适当的统计量
θ^(X1,X2,...,Xn)
,用它的观察值
θ^(x1,x2,...,xn)
作为未知参数
θ
的近似值,称
θ^(X1,X2,...,Xn)
为
θ
的估计量,
θ^(x1,x2,...,xn)
为
θ
的估计值。
下面介绍两种常用的构造估计量的方法:矩估计和最大似然估计
矩估计法
设
X
为连续型随机变量,其概率密度为
f(x:θ1,θ2,...,θk)
;或
X
为离散型随机变量,其概率密度为
P{X=x}=p(x;θ1,θ2,...,θk)
,其其中
θ1,θ2,...,θk
为待估参数。假设总体
X
前
k
阶矩为:
μl=E(Xl)=∫∞−∞xlf(x:θ1,θ2,...,θk)dx,(X是连续型)
μl=E(Xl)=∑x∈Rxxlp(x;θ1,θ2,...,θk),(X是离散型)
l=1,2,⋯,k
其中,
Rx
是
x
可能取值的范围。
X1,X2,...,Xn
是来自
X
的样本,样本矩为
Al=1n∑i=1nXli
样本矩依概率收敛于相应的总体矩
ul
,样本矩的连续函数依概率收敛于相应的总体矩的连续函数。因此,可以使用样本矩作为相应的总体矩的估计量,样本矩的连续函数作为相应的总体矩的连续函数的估计量,此估计法被称为矩估计法。具体做法如下:
⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪μ1=μ1(θ1,θ2,⋯,θk)μ2=μ2(θ1,θ2,⋯,θk)⋯μk=μk(θ1,θ2,⋯,θk)
这是包含
k
个未知数
θ1,θ2,⋯,θk
的联立方程组。一般来说,可以得到:
⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪θ1=θ1(μ1,μ2,⋯,μk)θ2=θ2(μ1,μ2,⋯,μk)⋯θk=θk(μ1,μ2,⋯,μk)
以
Ai
代替上述中的
μi,i=1,2,⋯,k
,可得:
θi^=θi(A1,A2,⋯,Ak),i=1,2,⋯,k
分别作为
θi,i=1,2,⋯,k
的估计量,称为矩估计量,观察值称为矩估计值。
最大似然估计
离散型
设总体
X
属于离散型,分布律
P{X=x}=p(x;θ),θ∈Θ
的形式为已知,
θ
为待估参数,
Θ
为
θ
可能取值的范围。设
X1,X2,⋯,Xn
为来自
X
的样本,
x1,x2,⋯,xn
为对应的样本值,它们都是已知的常数。易知样本
X1,X2,⋯,Xn
取到
x1,x2,⋯,xn
的概率,即事件
{X1=x1,X2=x2,⋯,Xn=xn}
发生的概率为:
L(θ)=L(x1,x2,⋯,xn;θ)=∏i=1np(xi;θ),θ∈Θ
概率值随
θ
的取值而变化,是
θ
的函数,
L(θ)
称为样本的似然函数。
现在我们已经取到了样本值
x1,x2,⋯,xn
,表明取到这一样本值的概率
L(θ)
比较大。当
θ=θ0∈Θ
时
L(θ)
取得最大值,而
Θ
中的其他值使得
L(θ)
取得较小的值,所以认为取
θ0
为未知参数
θ
的估计值最为合理,这就是最大似然估计,即:
L(x1,x2,⋯,xn;θ^)=maxθ∈ΘL(x1,x2,⋯,xn;θ)
这样的得到的
θ^
与样本值
x1,x2,⋯,xn
有关,常被记为
θ^(x1,x2,⋯,xn)
,称为参数
θ
的最大似然估计值,统计量
θ^(X1,X2,⋯,Xn)
称为参数
θ
的最大似然估计量。
连续型
设总体
X
属于连续型,概率密度
f(x;θ),θ∈Θ
的形式为已知,
θ
为待估参数,
Θ
为
θ
可能取值的范围。设
X1,X2,⋯,Xn
为来自
X
的样本,
x1,x2,⋯,xn
为对应的样本值,它们都是已知的常数。易知样本
X1,X2,⋯,Xn
取到
x1,x2,⋯,xn
的概率,即为随机点
(X1,X2,⋯,Xn)
落在点
(x1,x2,⋯,xn)
的邻域(边长分别为
dx1,dx2,⋯,dxn
的
n
维立方体)内的概率近似为:
∏i=1nf(xi;θ)dxi
其值随
θ
的变化而变化,取
θ
的估计值
θ^
使得概率取得最大值,但因子
∏ni=1dxi
与
θ
无关,故只需要考虑函数:
L(θ)=L(x1,x2,⋯,xn;θ)=∏i=1nf(xi;θ)
的最大值,
L(θ)
称为样本的似然函数,若
L(x1,x2,⋯,xn;θ^)=maxθ∈ΘL(x1,x2,⋯,xn;θ)
则
θ^(x1,x2,⋯,xn)
,称为参数
θ
的最大似然估计值,统计量
θ^(X1,X2,⋯,Xn)
称为参数
θ
的最大似然估计量。
对数似然方程
确定最大似然估计量的问题归结为求
L(θ)
的最大值问题。很多情况下,
p(x;θ)
和
f(x;θ)
关于
θ
可微,这时
θ^
可从方程:
dL(θ)dθ=0
解得。又因为
L(θ)
和
lnL(θ)
在同一
θ
处取得极值,因此
θ
的最大似然估计
θ
也可以从方程
dlnL(θ)dθ=0
求的,而使用对数方程求解比较方便,称为对数似然方程。