离散型随机变量的常见概率分布

伯努利0-1分布

事件A在某次试验中发生的概率稳定计为 $p$ ，但A要么发生要么不发生，随机变量 $X$ ，单次试验中A发生记为1，没有发生记为0，则 $P(X=1)=p,P(X=0)=1-p$ ，也可以统一成这个公式：
$f(x|p)=p^x(1-p)^{1-x},x=0,1$

期望方差

期望： $E(X)=∑x∗p(x) =p$
二次炬: $E^2(X)=p$
方差： $Var(X)=1^2p-p^2=p(1-p)$

二项分布

n重伯努利试验，事件A在某次试验中发生的概率稳定计为 $p$ ，但A要么发生要么不发生，随机变量 $X$ 表示在n次试验后，事件A发生的次数，显然，X的取值为{0,1,2,…,n}。

$p_i$ 为 ${X=i}$ 的概率，该概率是n和p的函数，可证明为

p i = (n i) p i (1 - p) n - i

$p_i=\binom{n}{i}p^i(1-p)^{n-i}$

简单证明：n次试验需要i次A发生，则由(n-i)次A没有发生，根据概率乘法定理为 $p^i(1-p)^{n-i}$ 又因这i次可为n中的任意i次，最后乘以 $\binom{n}{i}$

二项分布的期望与方差

期望： $np$
方差： $np(1-p)$

意义

二项分布其实就是一个简单的“发生”与“不发生”的概率分布，而现实世界中很多事情要么发生，要么不发生，因此二项分布可以描述非常多的现实世界中的现象，例如抛硬币，投篮等。

泊松分布

但在日常生活中，我们也会遇到大量这样的事情：在某个时间段内发生频率相对稳定，但在时间段内随时都有可能发生的事情。例如，车辆通过十字路口，医院有婴儿出生，超市的鲜奶被购买，机器运行时发生故障。这些事情一般用“单位时间内事件发生的次数”来描述，机器运行一个月发生2次故障，超市一天出售50袋鲜奶，医院每小时出生3名婴儿，15分钟内有40辆车通过某路口。每当有洪涝灾害时，新闻报道中经常会出现“五十年一遇”，“百年一遇”等字眼，也是对这种现象的描述。它们的特点就是：我们可以预估这些事件在某段连续时间内的总数，但是没法知道具体的发生时间。

泊松分布就是用来描述这种某段连续的时间内某独立事情发生次数的概率分布

$P(X_{t}=k)=\frac{e^{-\lambda t} \left ( \lambda t \right )^k}{k!}$

其中t为连续的时间长度(表示为单位时间的倍数)，λ为单位时间事件发生的数学期望（平均次数），e为自然底数，e = 2.718281828459。上式用来计算在时间段t内恰好发生k次事件的概率。

泊松分布是法国数学家泊松于1837年引入的，是概率论中几个重要分布之一，在经济社会生活中频繁地出现，并被广泛的应用。泊松分布必须满足如下几个条件：

（1）独立事件；

（2）事件发生的频率是稳定的；

（3）事件发生的概率是很小的。

实例1：某社区超市平均每天售出鲜桃罐头3罐，需要备货多少，使得缺货的概率低于5%？

分析：出售每一罐罐头可认为是独立事件，该事件发生的频率比较稳定，平均每天3罐左右，对于一天来说，每时刻出售一罐罐头可以认为概率很小。而该问题又是在连续时间段内的独立事件发生次数的问题，可以使用泊松分布来解决。缺货实际上就是求一天内出售罐头次数大于备货n的概率。设n=4，则：

$P(X>4)=1-P(X=0)-P(X=1)-P(X=3)-P(X=4)$
$=1-e^{-3} -\frac{e^{-3} \left ( 3 \right )^1}{1!}-\frac{e^{-3} \left ( 3 \right )^2}{2!} -\frac{e^{-3} \left ( 3 \right )^3}{3!} -\frac{e^{-3} \left ( 3 \right )^4}{4!}$
$=1-\frac{131}{8}e^{-3}$
$\approx 0.185$

备货4罐罐头缺货的概率约为18.5%。我们可以逐个算出备货5罐，6罐的缺货概率分别为：8.4%，3.35%。因此，需要备货6罐，才能使缺货的概率低于5%。

泊松分布在日常生活中有大量的实际应用。那为什么现实生活中有这么多事情服从泊松分布呢？这还得从泊松分布的来历说起，泊松分布是由二项分布演化而来的，是二项分布n很大而p很小时的一种极限形式。泊松分布的分布律是可以从二项分布推导出来的.

一般来说，X服从B(n,p)其中n很大p很小，而 $\lambda =np$ 不太大时，则X的分布接近于泊松分布 $P(\lambda)$ .这个事实可在所述条件下将较难计算的二项分布转换为泊松分布去计算。

几何分布

同二项分布的背景，如果直到第i次事件A才发生的概率（A发生在第i次的概率），则这样计算：
$P(X=i)=p*(1-p)^{i-1}$
因为呈(1-p)的等比几何级数，此分布被称为几何分布。

超几何分布

考虑从N个产品(其中废品总数为M)中随机抽出n个（不放回），随机变量X表示这n个中废品的个数，则X的分布为：

$P(X=m)=\frac{\binom{M}{m}\binom{N-M}{n-m}}{\binom{N}{n}}$

这个分布在涉及抽样的问题中常用，特别是N不大时，因为通常在抽样时，多是像这样”无放回的“，这就与把n个同时抽出的效果是一样的。如果一个一个地抽而抽出过的仍放回，这是二项分布。

如果n/N很小，则放回与不放回差别不大，由此可见，在这种情况下超几何分布和二项分布很接近，确切地说，若X服从超几何分布，则当n固定时，M/N=p固定，N→ $\infty$ 时，X近似地服从二项分布 $B(n,p)$

可以这么想M/N近似一次抽取为废品的概率，抽取n次发生废品m次的概率分布就是二项分布的描述。

负二项分布

负二项分布提出的问题与二项分布相反： $X$ 表示直到r次成功，问实验次数=k的概率，表示为

P (X = k | r, p) = (k - 1 r - 1) p r (1 - p) k - r

$P(X=k|r,p) = \begin{pmatrix} k-1\\ r-1\end{pmatrix}p^r(1-p)^{k-r}$

理解为在前k-1次实验中选出r-1次成功的实验，第k次设定为成功，先有个组合问题，然后乘以r次发生的概率，再乘以(k-r)次不发生的概率。