统计估计(statistical estimation)

统计估计(statistical estimation)

即到手的数据概率分布是未知的, 我们只能从样本集合里估计数据潜在的概率分布(underlying propability distribution).

基础

    1. 估计(estimator) μ ^ :从样本得到的定量估计,比如期望的estimator定义是:
      (1) μ ^ = 1 n i = 1 N x i

      准确来说,estimator是一个在所有样本 { x i } i = 1 N 上的函数,因此是一个随机变量
    1. 估计值(estimate):estimator确定的值。
    1. 统计估计的两种方法
      • 参数模型(parameter model) g ( x ; θ ) ,概率密度(或者质量)函数加上有限维度的参数 θ
      • 非参数模型(nonparametric method):不带参数或者是无限多参数的参数模型。

假设以下的样本 D = { x i } i = 1 N 都在 f ( x ) 上i.i.d。

点估计

参数估计:

最大似然估计(MLE)确定参数值,使得生成我们已有样本的可能性最大:

(2) L ( θ ) = i = 1 n g ( x i ; θ )

(3) θ ^ M L = a r g m a x θ L ( θ )

MLE里的参数 θ 被认为是确定的随机变量(deterministic variable),但是在贝叶斯推理(Bayes inference)中, θ 被认为是一个随机变量(random variable),则有:

(4) P r i o r P r o b a b i l i t y : p ( θ )

(5) L i k e l i h o o d : p ( D | θ )

(6) P o s t e r i o r P r o b a b i l i t y : p ( θ | D )

那么贝叶斯点估计最大化(4)可以利用条件概率得到:
(7) a r g a x θ p ( D | θ ) = p ( θ , D ) p ( θ ) = p ( θ | D ) p ( D ) p ( θ )

由此,MLE等价于:
(8) P o s t e r i o r E x p e c t a t i o n : θ p ( θ | D ) d θ

(9) P o s t e r i o r M o d e : a r g m a x θ p ( θ | D )

公式(9)又称为最大后验概率(maximum a posterior probability estimation,MAP).

由此导出计算后验概率的公式:

(10) p ( θ | D ) = p ( D | θ ) p ( θ ) p ( θ ) = p ( D | θ ) p ( θ ) p ( D | θ ) p ( θ ) d θ

非参数估计:

  1. 核密度估计(Kernel Density Estimation,KDE):在样本 D = { x i } i = 1 n 上用核函数近似密度函数 f ( x )

    (11) f ^ K D E ( x ) = 1 n i = 1 n K ( x , x i ) ,

    这里 K ( x , x ) 是核函数。

  2. 最邻近密度估计(Nearest neighbor density estimation,NNDE)

猜你喜欢

转载自blog.csdn.net/nockinonheavensdoor/article/details/80359057