先验分布:(一)认识先验概率

一、先验概率的定义

假设有随机变量θ,其取值仅为0或1;另有事件X,其取值仅为a或b。

我们又令当θ = 0时,X = a;当θ = 1时,X = b。也就是说,θ的取值决定了X的取值。

现在,我们做一个游戏,游戏要求我们在不知道θ是多少(0或1)的情况下,估计X的值。

怎么办?由于θ的取值决定了X的取值,只要我们知道θ的取值,问题迎刃而解。

θ可以取0,也可以取1。直观感觉告诉我们,θ有50%的机会等于0,另外50%的机会等于1。

换句话说,在估计X的值之前(不知道X会是多少),我们假设了θ有50%的机会等于0,另外50%的机会等于1。

而这两个50%的概率,就是先验概率。

二、先验概率分布

我们已经知道,先验概率就是在知道结果之前,对原因的概率的估计。要注意的是,这里并不是对原因的估计,而是对原因的概率的估计。

就像上面的例子,在不知道X会是多少的情况下,我们估计θ等于0的概率是50%,θ等于1的概率是50%。

在这个例子中,θ(的取值)服从(0 - 1)分布,也就是:θ要么是0,要么是1,只有两个值,统计学上记为Θ ~ (0 - 1)。

当然,无论出于何种原因,有人会觉得θ有60%的机会等于0,另外40%的机会等于1。

这样可以吗?可以,而且完全合理,因为我们没有任何经验证明θ有多少机会取0,有多少机会取1。

接下来,我们改一下文章一开头的假设:

假设有随机变量θ,其取值为0、1或2;另有事件X,其取值为a、b、c。

我们又令当θ = 0时,X = a;当θ = 1时,X = b;当θ = 2时,X = c。X的取值还是又θ决定。

现在要做的游戏也类似,即在不知道θ是多少(0或1或2)的情况下,估计X的值。

这次我们假设,θ有60%的机会等于0,30%的机会等于1,10%的机会等于3。换言之,这就是在这种假设下的我们主观确定的先验概率分布。要注意的是,我们这里假设X等于某个值的原因只有一个,也就是θ的其中一种取值。

事实上,我们在现实世界中观察到的任何结果都有其背后的原因,就像上面假设中的θ。通常,当我们猜测结果是什么的时候,我们或多或少都假定了一系列原因,而其中的一个或多个原因最终导致了结果。为了方便理解,我们这里先假定,一个事件只由一个原因引起,即原因之间是互斥的。

当原因有很多个,甚至无穷多个的时候,我们应该怎样表示原因的概率(即先验概率)的分布?

当原因有很多个,甚至无穷多个的时候,如果我们人工一个一个主观指定原因的出现概率,将会耗费大量时间,如果原因有无穷多个,则工作根本不可能完成。

先验概率说到底还是概率,我们总能找到一种分布来表示,况且,先验概率是可以由我们主观认定的,也就是说,先验概率有很大的灵活性。因此,我们可以用一种比较灵活的概率分布来表示先验概率的分布。

而用哪种分布往往取决于我们需要解决什么问题。具体讨论见下文:

猜你喜欢

转载自www.cnblogs.com/tspeaking/p/10856181.html