条件概率分布与边缘概率分布

1.条件概率分布
这是理解马尔科夫链的重要概念，单独成文

参考百科：http://baike.baidu.com/view/1969485.htm?fr=aladdin

大家都能理解概率分布，但加了条件二字，就难理解了。我比较讨厌官方的定义，术语太绕，我的理解如下：

设X和Y分别是概率分布（如正态分布那种直观的），那么(X,Y)就是联合概率分布，又称为二维随机变量。这种联合概率分布就不那么直观了。但用条件概率分布这个概念定义，可以把抽象变为形象。

具体这样做，假设X是均匀分布，1-10这个数字出现的可能性都是0.1，而Y也是均匀分布，21-30数组出现的可能性都是0.1。

把Y取一个固定值，如：1，这样Y就是100%出现了，只需要考虑X的概率分布。21出现的可能性是X21，即0.1的概率。但是如果想得到联合概率(X21,Y1),要怎么做？这时把X1的概率也算进去就可以了，用P(X=1)*P(Y=21)，就可以算出P(X=1,Y=21)。

可见，条件概率分布，作用是简化“联合概率分布”，这样，联合概率分布成为可以被“数学运算”的概念。这是处理复杂随机过程的一个基本理念，虽然简单（就是把复杂的概率概念，转化为简单的概率概念，是一个化繁为简的思想），但要铭记于心。

可见，要处理复杂问题，关键是掌握化繁为简的能力，从简单概念入手是掌握随机过程的诀窍。想到马尔科夫链，首先要想到条件概率，然后要想到普通的概率分布。

2.边缘概率分布
下文写的不错，就不画蛇添足了。
下文转自：http://www.baike.com/wiki/边缘分布
某一组概率的加和，叫边缘概率。边缘概率的分布情况，就叫边缘分布。和“边缘”两个字本身没太大关系，因为是求和，在表格中往往将这种值放在margin（表头）的位置，所以叫margin distribution。

marginal distribution，边缘分布（有时也翻译成边界分布）。

如果我们把每一个变量的概率分布称为一个概率分布，那么边缘分布就是若干个变量的概率加和所表现出的分布。举个例子，假设P(B),P(C),P(A|B),P(A|C)已知，求P(A)。那么P(A)=sum(P(B)*P(A|B),P(C)*P(A|C))。

扫描二维码关注公众号，回复： 4065202 查看本文章

再举个简单的例子：对于一个任意大小(n*n)的概率矩阵X，每一个元素表示一个概率，对于其中任一行或任一列求和，得到的概率就是边缘概率。如果写成式子，就是第i行有以下边缘分布：P(i)=sum(P(i,j),for each j in n)。

对，定义就是这么简单。就是指的某一些概率的加和值的分布，其实就对应一个等式，让它等于某种概率加和运算。

为什么叫"marginal"呢？是因为这个值曾经用于表示某一个概率矩阵中某一行或某一列的概率加和，而这个加和在table中往往放在margin（表头）的位置，所以叫marginal distribution，翻译过来变成了边缘概率，汗…偶还以为很边缘……

条件概率分布与边缘概率分布

猜你喜欢