统计-随机变量

随机变量

定义

设随机试验E的样本空间为S={e}，若X=X(e)是定义在样本空间S的上的一个单值实函数，则称X=X(e)为随机变量
简单说，让每一个样本点e对应着唯一的实数X(e)，便得到随机变量X=X(e)

离散型随机变量

若随机变量只可能取有限个或可数无限个值时

连续型随机变量

若随机变量只可能取一个区间中的所有实数时

随机变量的概率

随机变量X取某个值x的事件用记号{X=x}表示，其概率记为{X=x}
若L是一个实数集，将随机变量X在L中取值的事件记作{X∈L}，其概率记为P{X $\in$ L}
P{X∈L}=P{e|X(e)∈L}

离散型随机变量及其分布律

设离散型随机变量X所有可能的取值为x_k,X取x_k的概率为P{X=x_k}=p_k (k=1,2,…)

性质

1.非负性 P_k≥0，k=1,2,…
2.规范性 p1+p2+…+pn =1

分布律

x	x1 x2 … xk
p_k	p1 p2 … pk

$\sum\limits_{k=1}^\infty P^k=1$

X的每一个取值各占一些概率，这些概率加起来为1，即概率1以一定的规律分布着各个可能的值上。

0-1分布

定义

只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
$P{X=k}=p^k(1-p)^{1-k} (k=0,1)$

x	0 1
p_k	1-p p

二项分布

设X表示n重伯努利试验中事件A发生的次数，则X是一个随机变量，X可能的取值为0,1,…,n。
用A_i表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验，
这k次试验A发生概率为P( $\overline{A1}$ … $\overline{A_{n-1}}$ A_n $\overline{A_{n+1}}$ … $\overline{A_{k-1}}$ A_k $\overline{A_{k+1}}$ )=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=p^k(1-p)^n-k
由于A发生在哪k次试验有 $C_n^k$ 种

公式

P{X=k}= $C_n^k$ p^k(1-p)^n-k
随机变量X服从参数n,p的二项分布，记为X~b(n,p)

规范性
$\sum\limits_{k=0}^nC_n^k$ p^k(1-p)^n-k=[p+(1-p)]ⁿ=1

二项分布为0-1分布b(1,p)
P{X=k}=p^k(1-p)^n-k (k=0,1) (C_0^1 $=$ C_1^1$=1)

例子

某人进行射击，每次射中命中率0。02，独立射击400次，至少中两次概率
P~b（400,0.02）
P{X=k}= $C_400^k$ 0.02^k(1-0.02)^400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1- $C_400^0$ 0.02⁰(1-0.02)^400-0- $C_400^0$ 0.02¹(1-0.02)^400-1=0.9972

泊松分布

知道发生的的平均次数 $\lambda$
$P={\lambda \over n}$
X~b(n, $\lambda \over n$ )推出

lim_{n \to + \infty} C_{n}^{k} (\frac{λ}{n})^{k} (1 - \frac{λ}{n})^{n - k} = \frac{λ^{k}}{k!} e^{- λ}

$\lim_{n \to + \infty} C_n^k ({\lambda \over n})^k (1-{\lambda \over n})^{n-k} = {\lambda ^k\over k!}e^{-\lambda}$

定义

设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为

$P_k$ = P{X=k} = ${\lambda ^k\over k!}e^{-\lambda}$
其中 $\lambda$ >0的常数，则称X服从参数为 $\lambda$ 的泊松分布。X~π(\lambda)

可以通过泊松分布表计算

规范性

例子

保险公司承保5000张同年龄为期一年的保单。如果合同期死亡，则赔付3万元。设1年内死亡概率为0.0015，且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}= $\sum\limits_{k=0}^{10}C_{5000}^k$ 0.0015^k(1-0.0015)^5000-k

计算困难，用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}= $\sum\limits_{k=0}^{10}{7.5^k\over k!}e^{-7.5}$
直接查表

几何分布试验直到成功的概率

用A_i表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生，则
P{X=k}=P( $\overline{A1}$ … $\overline{A_{k-1}}$ A_k)=（1-p）…(1-p)p=(1-p)^k-1p

定义

设多重伯努利试验中，事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数，则X取值k的概率
P{X=k}=(1-p)^k-1p (k=1,2…)
称X服从参数为p的几何分布，记作X~G(p)

x	1 2 … k …
p_k	p (1-p)p … (1-p)^k-1p …

规范性

$\sum\limits_{k=1}^\infty(1-p)^{k-1}p=p\sum\limits_{k=1}^\infty(1-p)^{k-1}=p{1 \over{1-(1-p)}} =p {1 \over p} =1$
几何级数(等比级数)
等比级数的和= $首项 \over {1 - 公比}$

超几何分布

设有N件产品，其中有D件次品。今从中任取n件，问其中恰有k件次品(k≤D)的概率是多少？
在N件产品中取n件(不放回)的取法有 $C_N^n$ 种
在D件次品中取k件的取法有 $C_D^k$ 种
在N-D件正品中取n-k件的取法有 $C_N-D^n-k$ 种
在N件产品中取n件，其中恰有k件次品的取法有 $C_D^k$ $C_N-D^n-k$ 种
$P(A)={C_D^kC_N-D^n-k} \over {C_N^n}$

定义

设有N件产品，其中有M件次品。从中任取n件，则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数，
则P{X=k}={ $C_M^k$ $C_N-M^n-k$ }\over { $C_N^n$ } k=0,1,…,n
称X服从参数为n,M，N的超几何分布

与二项分布关系

当N很大时候，超几何分布和二项分布近似

随机变量的分布函数累积分布函数

分布函数概率

定义

设X是一个随机变量（离散型或连续型），x是任意实数，称事件{X≤x}的概率P{X≤x}为X的分布函数，记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)

性质1

分布函数F(x)是实数域上( $-\infty,+\infty$ )的单调不减函数

性质2

0≤F(x)≤1
F( $-\infty$ )=0 F( $+\infty$ )=1

性质3

分布函数F(x)至多有可数个跳跃间断点，且处处都是右连续的，即对任何实数x₀,都有
$F(X_0+0)=\lim_{x \to x_0} F(x)=F(x_0)$

公式

P{X≤a}=F(a)
P{X＜a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X＞a}=1-F（a）
P{X≥a}=1-F(a-0)
P{a≤X＜b}=F(b-0)-F(a-0)
P{a＜X＜b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)

离散型随机变量的分布函数

函数概率的累积

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

如果随机变量X的分布函数F(x)可以写成以下形式：

F (x) = \int_{- \infty}^{x} f (t) d t (- \infty < x < + \infty)

$F(x)=\int_{-\infty}^{x}f(t)dt (-\infty<x<+\infty)$
其中f(x)是定义在

(- \infty, + \infty)

$(-\infty,+\infty)$ 上的非负可积函数，则称X为连续型随机变量，
f(x)称为X的概率密度函数。

性质1

f(x)≥0 非负性

性质2

$F(x)=\int_{-\infty}^{+\infty}f(x)dx=1$ 规范性

性质3

若f(x)在x处联系，则F(x)在x处可导，且
F’(x)=f(x)

性质4

对任意实数x1,x2(x1

均匀分布

定义

若连续随机变量X具有概率密度

f (x) = {\begin{aligned} \frac{1}{b - a} ， a < x < b \\ 0, 其 他 \end{aligned}

$f(x)=\left\{ \begin{aligned} &{1 \over {b-a}}，{a<x<b} \\ &0, 其他 \end{aligned} \right.$
则称X在区间[a,b]上服从均匀分布，记为X~U(a,b
)

意义

若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
$1 \over {b-a}$ = ${(b-a) \over n} \over {b-a}$ = $1 \over n$
即落入每一个小区间都是等可能的，所以概率被均匀的分布在区间[a,b]上。

分布函数

f (x) = {\begin{aligned} 0 ， x < a \\ \frac{x - a}{b - a} ， a \leq x < b \\ 1, x \geq b \end{aligned}

$f(x)=\left\{ \begin{aligned} &0， x< a \\ &{{x-a} \over {b-a}}，{a≤x<b} \\ &1, x≥b \end{aligned} \right.$

指数分布

定义

若连续型随机变量X具有概率密度

f (x) = {\begin{aligned} λ e^{- λ x} ， x > 0 \\ 0, x \leq 0 \end{aligned} (常 数 λ > 0)

$f(x)=\left\{ \begin{aligned} &\lambda e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right. (常数\lambda > 0)$
则称X服从参数为

λ

$\lambda$ 的指数分布，记为X~E(

λ

$\lambda$ )

分布函数

f (x) = {\begin{aligned} 1 - e^{- λ x} ， x > 0 \\ 0, x \leq 0 \end{aligned}

$f(x)=\left\{ \begin{aligned} &1-e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right.$

性质无记忆性

$\forall s,t$ >0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下，则X>s+t发生的概率就等于{X>t}发生的概率
如，X是一个电子元件的寿命，若已知元件已经使用了s小时(X>s发生)，它能再使用t小时(一共使用s+t小时，X>s+t发生)的概率，与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布

正态分布高斯分布

若连续型随机变量X具有概率密度
f(x)= $1 \over {\sqrt{2\pi}\sigma}$ $e^{-{{(x-\mu)^2}} \over 2\sigma^2}$ $(-\infty <x <+\infty)$
其中 $\mu,\sigma(\sigma>0)$ 是常数，则称X服从参数为 $\mu,\sigma$ 的正态分布，记作X~N( $\mu,\sigma^2$ )
$\mu$ 为X的均值
$\sigma$ 为方差

图像性质

1.y=f(x)的图形关于直线x= $\mu$ 对称。
即f( $mu$ -h)=f( $mu$ +h)
2.y=f(x)在x= $\mu$ 处的最大值f( $\mu$ )= $1 \over {\sqrt{2\pi}\sigma}$
3.x离 $\mu$ 越远，f(x)的值越小
4.y=f(x)在x= $\mu+_\sigma$ 有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当 $\sigma$ 固定时， $\mu$ 决定y=f(x)的左右位置， $\mu$ 称为正态分布的位置参数。
7.当 $\mu$ 固定是， $\sigma$ 决定y=f(x)的集中程度。 $\sigma$ 越小，y=f(x)的图形越尖，越高，X落在 $\mu$ 附件概率越大

分布函数

F(x)= $1 \over {\sqrt{2\pi}\sigma}$ $\int_{x}^{\infty}e^-{{(x-\mu)^2} \over 2\sigma^2}$
原函数不是初等函数，只能写成积分上限函数

标准正态分布

当 $mu$ =0， $\sigma$ =1时的正态分布称为标准正态分布，记作X~N(0,1)
$\varphi(x)$ = $1 \over {\sqrt{2\pi}}$ $e^{x^2 \over 2}$

标准化

若X~N（ $\mu,\sigma^2$ ）则Z={X- $mu$ \over $\sigma$ }~N{0,1}
F(x)= $\phi$ ( ${x-\mu} \over \sigma$ )

公式

P{X ≤ x}= $\phi$ ( ${x-\mu} \over \sigma$ )
P{|X| ≤ x}= $2\phi$ ( ${x-\mu} \over \sigma$ )-1
P{x1 < X ≤ x2}= $\phi$ ( ${x2-\mu} \over \sigma$ )- $\phi$ ( ${x1-\mu} \over \sigma$ )

随机变量的函数的分布

定义

设g(x)是定义在随机变量X的一切可能取值x的集合上的函数。
如果对于X的每一个可能的取值x，另一个变量Y取值相应的值y=g(x),则称Y为X的函数。记作Y=g(x)

随机变量

定义

离散型随机变量

连续型随机变量

随机变量的概率

离散型随机变量及其分布律

性质

分布律

0-1分布

定义

二项分布

公式

例子

泊松分布

定义

例子

几何分布 试验直到成功的概率

定义

超几何分布

定义

与二项分布关系

随机变量的分布函数 累积分布函数

分布函数概率

定义

性质1

性质2

性质3

公式

离散型随机变量的分布函数

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

性质1

性质2

性质3

性质4

均匀分布

定义

意义

分布函数

指数分布

定义

分布函数

性质 无记忆性

正态分布 高斯分布

图像性质

分布函数

标准正态分布

标准化

公式

随机变量的函数的分布

定义

离散型随机变量的函数的分布

连续型随机变量的函数的分布

猜你喜欢

几何分布试验直到成功的概率

随机变量的分布函数累积分布函数

性质无记忆性

正态分布高斯分布