随机变量及其分布?

  • 离散型随机变量及其分布

(0-1)分布   P\left \{ X = k \right \} = p^{k}(1-p)^{1-k},k=0,1 (0<p<1)

设随机变量X只可能取0和1的两个值,他的分布律是P\left \{ X = k \right \} = p^{k}(1-p)^{1-k},k=0,1 (0<p<1),

则称 X 服从以p为参数的(0-1)分布或者两点分布。

分布律:

X 0 1
Pk 1-p p

伯努利(Bernoulli)实验、二项分布

设实验 E 只有两个可能结果:A和\bar{}\bar{A},则称 E 为伯努利实验。

设P(A) = p (0<p<1),此时P(\bar{A}) = 1 - p,将 E 独立重复地进行 n 次,则称这一串重复的独立实验为 n 重伯努利实验。

这里“重复”是指在每次实验中 P(A)  = p 保持不变:“独立”是指各次实验的结果互不影响,即若以 C_{i} 记第 i 次实验的结果,C_{i} 为 A 或 \bar{A} ,i = 1,2,·····,n。“独立”是指

P(C_{1}C_{2}\cdots C_{n}) = P(C_{1})P(C_{2})\cdots P(C_{n})

分布律:假设在前 k 次实验中 A 发生,而后 n-k 次实验中 A 不发生的概率为 P^{k}P^{n-k},这种指定的方式共用\binom{n}{k} 种。故在 n 次实验中 A 发生 k 次的概率为\binom{n}{k}P^{k}(1-P)^{n-k},记 q = 1-p,即有

P(x=k) =\binom{n}{k}p^{k}q^{n-k} ,看= 0, 1, 2,····,n;

显然

p(x=k)\geq 0, k = 0, 1, 2,...., n

\sum_{k=0}^{n}P(x=k)=\sum_{k=0}^{n}\binom{n}{k}p^{k}q^{n-k} = (p + q)^n = 1

由于\binom{n}{k}p^{k}q^{n-k} 刚好是二项式 (p+q)^n 的展开式中出现 p^k 的那一项。我们也称随机变量 X 服从参数为 n, p 的二项分布。

特别的:当 n=1 时,二项分布式化为 p^{k}(1-p)^{1-k}, k = 0, 1。

泊松分布(描述某段时间内,事件具体的发生概率)

在实际应用过程中,很多时间具有固定的频率。

  • 某医院平均每小时出生3个婴儿

  • 某一地区一个时间间隔内发生交通事故的次数

  • 某公司平均每10分钟接到1个电话

  • 某超市平均每天销售4包xx牌奶粉

  • 某网站平均每分钟有2次访问

    上面这些事件的特点是,我们可以预估事件发生的总数,但是没法知道具体的发生时间。已知每年发生的交通事故,那么下一年会发生多少起呢?这个没法知道。

  • 连续性变量分布

均匀分布

指数分布 

指数分布是事件的时间间隔的概率。下面这些都属于指数分布。

  • 婴儿出生的时间间隔

  • 来电的时间间隔

  • 奶粉销售的时间间隔

  • 网站访问的时间间隔

指数分布的公式可以从泊松分布推断出来。如果下一个婴儿间隔时间 t ,就等同于 t 之内没有任何婴儿出生。

反过来,事件在时间 t 之内发生的概率(至少出生一个的概率),就是1减去上面的值。

接下来15分钟,会有婴儿出生的概率是52.76%。

接下来的15分钟到30分钟,会有婴儿出生的概率是24.92%。

指数分布的图形大概是下面的样子。

可以看到,随着间隔时间变长,事件的发生概率急剧下降,呈指数式衰减。想一想,如果每小时平均出生3个婴儿,上面已经算过了,下一个婴儿间隔2小时才出生的概率是0.25%,那么间隔3小时、间隔4小时的概率,是不是更接近于0?

指数分布的概率密度为:

式中:x是给定的时间;λ为单位时间事件发生的次数;e=2.71828。

指数分布概率密度曲线如下图:

指数分布具有以下特征:

(1)随机变量X的取值范围是从0到无穷;

(2)极大值在x=0处,即f(x)=λ;

(3)函数为右偏,且随着x的增大,曲线稳步递减;

(4)随机变量的期望值和方差为µ=1/λ,σ2=1/λ2。

通过对概率密度函数的积分,就可以得到相应的概率,其表达式有两种

P(X≥x)=e-λx

P(X≤x)=1-e-λx

例:某电视机生产厂生产的电视机平均10年出现大的故障,且故障发生的次数服从泊松分布。

问(1)该电视机使用15年后还没有出现大故障的比例;(2)如果厂家想提供大故障免费维修的质量担保,但不能超过全部产量的20%,试确定提供担保的年数。

解:

(1)设X为电视机出现大故障的时间。已知µ=10年,则λ=1/µ=0.1,于是,P(X≥x)=e-λx=e-0.1*15≈0.223。则15年后,没有出现大故障的电视机约占22.3%。

(2)问题要求比例不超过20%,这是求X的右侧概率面积,现在根据公式确定适当的X值。

电视机各年累计出现的故障比例

担保年数X

累计概率P(X≤x)=1-e-λx

1

0.095

2

0.181

3

0.259

从表中可以看到:担保2年时,出现大故障的比例是18.1%,不超过20%。担保3年时,出现大故障的比例为25.9%,已经超过20%。所以,厂家应以2年为担保期。

高斯分布,正态分布

透彻理解高斯分布

  • 参考文献 

  1. 泊松分布 & 指数分布

猜你喜欢

转载自blog.csdn.net/wchzh2015/article/details/89312636