L3-连续变量分布:均匀分布、指数分布、正态分布

1. 定义

如果对于随机变量 X X 的分布函数 F ( x ) F(x) ,存在非负函数 f ( x ) f(x) ,使得对于任意实数 x x ,有 F ( x ) = x f ( t ) d t F(x)= \int_{-\infty}^{x} f(t) \, dt

则称 X X 连续型随机变量,其中函数 f ( x ) f(x) 称为 X X 的概率密度函数。

概率密度 f ( x ) f(x) 具有以下性质:

  • f ( x ) 0 f(x)≥0
  • + f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x) \, dx =1
  • P { x 1 < X x 2 } = F ( x 2 ) F ( x 1 ) = x 1 x 2 f ( x ) d x        ( x 1 x 2 ) P\{x_1<X \leq x_2\} = F(x_2)-F(x_1)= \int_{x_1}^{x_2} f(x) \, dx \;\;\; (x_1≤x_2)

2. 常见连续变量分布

####(1)均匀分布
若随机变量 X X 的密度函数为
f ( x ) = { 1 b a a x b 0 f(x)= \begin{cases}\frac{1}{b-a}, \quad a \leq x \leq b \\ 0, \quad 其他 \\ \end{cases}
则称随机变量 X X 服从区间 [ a , b ] [a,b] 上的均匀分布,记作 X U ( a , b ) X \sim U(a,b)

X X 的分布函数为
F ( x ) = { 0 x a x a b a a x b 1 b x F(x)= \begin{cases} 0 \quad \quad x \leq a \\ \frac{x-a}{b-a} \quad a \leq x \leq b \\ 1 \quad \quad b \leq x \end{cases}

(2)指数分布

若随机变量X的密度函数为
f ( x ) = { λ e λ x x > 0 0    x 0 f(x)= \begin{cases} \lambda e^{-\lambda x} \quad x>0 \\ 0 \quad \quad \; x \leq 0 \\ \end{cases}

则称随机变量 X X 服从参数为 λ \lambda λ > 0 \lambda>0 为常数)的指数分布。

X X 的分布函数为

F ( x ) = { 1 e λ x x > 0 0    x 0 λ > 0 F(x)= \begin{cases} 1-e^{-\lambda x} \quad x>0 \\ 0 \quad \quad \quad \; x \leq 0 \\ \end{cases} \lambda>0 为常数

(3)正态分布

若随机变量X的密度函数为
f ( x ) = 1 2 π σ e ( x μ ) 2 2 σ 2 ( x + ) f(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \quad \quad (-\infty \leq x \leq +\infty)
其中, μ + , θ > 0 -\infty \leq \mu \leq +\infty,\theta>0 为参数。

则称随机变量 X X 服从参数为 ( μ , σ 2 ) (\mu,\sigma^2) 的正态分布,记作 X N ( μ , σ 2 ) X \sim N(\mu,\sigma^2)

μ = 0 , σ = 1 \mu=0,\sigma=1 ,称 N ( 0 , 1 ) N(0,1) 标准正态分布,密度函数如下:
φ ( x ) = 1 2 π e x 2 2 ( < x < + ) \varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \quad (-\infty < x < +\infty)

正态分布密度函数的图形性质:

  • 曲线关于直线 x = μ x=\mu 对称。对于任意 h > 0 h>0 ,有 P { μ h < X μ } = P { μ < X μ + h } P\{\mu-h<X \leq \mu\}=P\{\mu <X \leq \mu+h\}

  • x = μ x=\mu 时, f ( x ) f(x) 取到最大值 1 2 π σ \frac {1}{\sqrt{2 \pi} \sigma} x x μ \mu 越远, f ( x ) f(x) 的值就越小。对于同样长度的区间,当区间离 μ \mu 越远时,随机变量 X X 落在该区间中的概率就越小。

  • f ( x ) f(x) x = μ ± σ x=\mu±\sigma 处有拐点,并以 O x Ox 轴为渐近线。

  • σ \sigma 固定,改变 μ \mu 的值,则 f ( x ) f(x) 的图形沿 x x 轴平行移动,但不改变其形状。因此 f ( x ) f(x) 图形的位置完全由参数μ确定。

  • μ \mu 固定,改变 σ \sigma 的值,由于 f ( x ) f(x) 的最大值为 1 2 π σ \frac {1}{\sqrt{2 \pi} \sigma} ,当 σ \sigma 越小时, f ( x ) f(x) 图形越陡, X X 落在 μ \mu 附近的概率越大;反之,当 σ \sigma 越大时, f ( x ) f(x) 图形越平坦, X X 的取值越分散。

3 σ 3\sigma 原则:正态分布距离平均值 3 σ 3\sigma 之外的值出现的概率 P { X μ > 3 σ } 0.003 P\{|X-\mu|>3\sigma\}≤0.003 ,属于极个别的小概率事件。

猜你喜欢

转载自blog.csdn.net/apr15/article/details/105741145