参数估计

点估计

设总体 X 的分布函数的形式已知,但它的一个或多个参数未知,借助于总体 X 一个样本来估计总体未知参数的值得问题称为参数的点估计问题。

举例:
某炸药厂,一天中发生着火现象的次数 X 是一个随机变量,假设 X 服从 λ > 0 泊松分布,即 X π ( λ ) 。根据现有的样本量估计参数 λ

着火次数k 0 1 2 3 4 5 6 >=7
发生k次着火的天数 75 90 54 22 6 2 1 0

根据 λ = E ( X ) ,以上的数据表示 X = 0 出现了75次, X = 1 出现了90次…,一共有250个样本

E ( X ) = 0 × 75 + 1 × 90 + 2 × 54 + 3 × 22 + 4 × 6 + 5 × 2 + 6 × 1 250 = 1.22

所以估计参数 λ = 1.22

点估计:设总体 X 的分布函数 F ( x ; θ ) 的形式为已知, θ 是待估参数, X 1 , X 2 , . . . , X n X 的一个样本, x 1 , x 2 , . . . , x n 是对应的样本值。点估计问题是构造出一个适当的统计量 θ ^ ( X 1 , X 2 , . . . , X n ) ,用它的观察值 θ ^ ( x 1 , x 2 , . . . , x n ) 作为未知参数 θ 的近似值,称 θ ^ ( X 1 , X 2 , . . . , X n ) θ 的估计量, θ ^ ( x 1 , x 2 , . . . , x n ) θ 的估计值。
下面介绍两种常用的构造估计量的方法:矩估计和最大似然估计

矩估计法

X 为连续型随机变量,其概率密度为 f ( x : θ 1 , θ 2 , . . . , θ k ) ;或 X 为离散型随机变量,其概率密度为 P { X = x } = p ( x ; θ 1 , θ 2 , . . . , θ k ) ,其其中 θ 1 , θ 2 , . . . , θ k 为待估参数。假设总体 X k 阶矩为:

μ l = E ( X l ) = x l f ( x : θ 1 , θ 2 , . . . , θ k ) d x , ( X )

μ l = E ( X l ) = x R x x l p ( x ; θ 1 , θ 2 , . . . , θ k ) , ( X )

l = 1 , 2 , , k

其中, R x x 可能取值的范围。
X 1 , X 2 , . . . , X n 是来自 X 的样本,样本矩为
A l = 1 n i = 1 n X i l

样本矩依概率收敛于相应的总体矩 u l ,样本矩的连续函数依概率收敛于相应的总体矩的连续函数。因此,可以使用样本矩作为相应的总体矩的估计量,样本矩的连续函数作为相应的总体矩的连续函数的估计量,此估计法被称为矩估计法。具体做法如下:
{ μ 1 = μ 1 ( θ 1 , θ 2 , , θ k ) μ 2 = μ 2 ( θ 1 , θ 2 , , θ k ) μ k = μ k ( θ 1 , θ 2 , , θ k )

这是包含 k 个未知数 θ 1 , θ 2 , , θ k 的联立方程组。一般来说,可以得到:
{ θ 1 = θ 1 ( μ 1 , μ 2 , , μ k ) θ 2 = θ 2 ( μ 1 , μ 2 , , μ k ) θ k = θ k ( μ 1 , μ 2 , , μ k )

A i 代替上述中的 μ i i = 1 , 2 , , k ,可得:
θ i ^ = θ i ( A 1 , A 2 , , A k ) , i = 1 , 2 , , k

分别作为 θ i i = 1 , 2 , , k 的估计量,称为矩估计量,观察值称为矩估计值。

最大似然估计

离散型

设总体 X 属于离散型,分布律 P { X = x } = p ( x ; θ ) , θ Θ 的形式为已知, θ 为待估参数, Θ θ 可能取值的范围。设 X 1 , X 2 , , X n 为来自 X 的样本, x 1 , x 2 , , x n 为对应的样本值,它们都是已知的常数。易知样本 X 1 , X 2 , , X n 取到 x 1 , x 2 , , x n 的概率,即事件 { X 1 = x 1 , X 2 = x 2 , , X n = x n } 发生的概率为:

L ( θ ) = L ( x 1 , x 2 , , x n ; θ ) = i = 1 n p ( x i ; θ ) , θ Θ

概率值随 θ 的取值而变化,是 θ 的函数, L ( θ ) 称为样本的似然函数。
现在我们已经取到了样本值 x 1 , x 2 , , x n ,表明取到这一样本值的概率 L ( θ ) 比较大。当 θ = θ 0 Θ L ( θ ) 取得最大值,而 Θ 中的其他值使得 L ( θ ) 取得较小的值,所以认为取 θ 0 为未知参数 θ 的估计值最为合理,这就是最大似然估计,即:
L ( x 1 , x 2 , , x n ; θ ^ ) = max θ Θ L ( x 1 , x 2 , , x n ; θ )

这样的得到的 θ ^ 与样本值 x 1 , x 2 , , x n 有关,常被记为 θ ^ ( x 1 , x 2 , , x n ) ,称为参数 θ 的最大似然估计值,统计量 θ ^ ( X 1 , X 2 , , X n ) 称为参数 θ 的最大似然估计量。

连续型

设总体 X 属于连续型,概率密度 f ( x ; θ ) , θ Θ 的形式为已知, θ 为待估参数, Θ θ 可能取值的范围。设 X 1 , X 2 , , X n 为来自 X 的样本, x 1 , x 2 , , x n 为对应的样本值,它们都是已知的常数。易知样本 X 1 , X 2 , , X n 取到 x 1 , x 2 , , x n 的概率,即为随机点 ( X 1 , X 2 , , X n ) 落在点 ( x 1 , x 2 , , x n ) 的邻域(边长分别为 d x 1 , d x 2 , , d x n n 维立方体)内的概率近似为:

i = 1 n f ( x i ; θ ) d x i

其值随 θ 的变化而变化,取 θ 的估计值 θ ^ 使得概率取得最大值,但因子 i = 1 n d x i θ 无关,故只需要考虑函数:
L ( θ ) = L ( x 1 , x 2 , , x n ; θ ) = i = 1 n f ( x i ; θ )

的最大值, L ( θ ) 称为样本的似然函数,若
L ( x 1 , x 2 , , x n ; θ ^ ) = max θ Θ L ( x 1 , x 2 , , x n ; θ )

θ ^ ( x 1 , x 2 , , x n ) ,称为参数 θ 的最大似然估计值,统计量 θ ^ ( X 1 , X 2 , , X n ) 称为参数 θ 的最大似然估计量。

对数似然方程

确定最大似然估计量的问题归结为求 L ( θ ) 的最大值问题。很多情况下, p ( x ; θ ) f ( x ; θ ) 关于 θ 可微,这时 θ ^ 可从方程:

d L ( θ ) d θ = 0
解得。又因为 L ( θ ) ln L ( θ ) 在同一 θ 处取得极值,因此 θ 的最大似然估计 θ 也可以从方程
d ln L ( θ ) d θ = 0
求的,而使用对数方程求解比较方便,称为对数似然方程。

猜你喜欢

转载自blog.csdn.net/winycg/article/details/80294225