第四章随机变量的数字特征

数学期望

例子

成绩	0分	1分	2分	3分	4分	5分
人数	2	5	8	15	12	8
频率	2/50	5/50	8/50	15/50	12/50	8/50

平均成绩为

（0×2+1×5+2×8+3×15+4×12+5×8）/50=3.08

加权平均

0× $2 \over 50$ +1× $5 \over 50$ +2× $8 \over 50$ +3× $15 \over 50$ +4× $12 \over 50$ +5× $8 \over 50$ =3.08

离散型随机变量的数学期望

定义

设离散型随机变量X的分布律为

P{X= $x_k$ }= $p_k$ (k=1,2,…)

若无穷极数 $\sum_{k=1}^{\infty}x_kp_k$ 绝对收敛，即 $\sum_{k=1}^{\infty}|x_k|p_k$ 收敛则称这个级数为随机变量X的数学期望，简称期望或均值。记作E(X)

即

E (X) = \sum_{k = 1}^{\infty} x_{k} p_{k}

$E(X)=\sum_{k=1}^{\infty}x_kp_k$

一个随机变量的数学期望是一个常数，它表示随机变量取值的一个平均，并不是算术平均，而是以概率为权重的加权平均。

扫描二维码关注公众号，回复： 1080127 查看本文章

为什么要绝对收敛？

因为绝对收敛级数具有交换律，即级数的各项任意重新排列后，级数的和不会变，从而保证任意交换xi的位置，不会改变X的数学期望。

如果此级数发散或者条件收敛，则X的数学希望就不存在。

如果X只取有限个值，则此级数只有有限项相加，它一定绝对收敛。

计算

X	x1 x2 x3 … xn …
pk	P1 p2 p3 … pn …

将分布律中X的歌取值 $x_i$ 与对应概率 $p_i$ 相乘，再将乘积相加，得到X的期望

E(X)= $x_1p_1+x_2p_2+…+x_np_n+...$

0-1分布数学期望

E(X)=0×(1-p)+1×p=p

二项分布的数学期望

P{X=k}= $\C_n^kp^k(1-p)^{n-k}$ (k=0,1,…,n)

E(X)= $\sum_{k=0}^nk·p_k$ = $\sum_{k=1}^nk·\C_n^kp^k(1-p)^{k-1}$

= $p\sum_{k=1}^nk·{n \over k}\C_{n-1}^{k-1}p^{k-1}(1-p)^{n-k}$

= $np\sum_{k=1}^n\C_{n-1}^{k-1}p^{k-1}(1-p)^{n-k}$

= $np[p+(1-p)]^n$

=np

$\C_n^m={n \over m}\C_{n-1}^{m-1}$

牛顿二项式： $(a+b)^n$ = $\sum_{r=0}^n\C_n^ra^{n-r}b^r$

泊松分布的数学期望

$p_k$ =P{X=k}= ${\lambda \over k! }e^{-\lambda^k} (\lambda>0)$ (k=1,2,…)

E(X)= $\sum_{k=1}^{\infty}k·{\lambda^k \over k! }e^{-\lambda}$

= $e^{-\lambda}\sum_{k=1}^{\infty}{{\lambda^k} \over {(k-1)!}}$

= $e^{-\lambda}\lambda\sum_{k=1}^{\infty}{{\lambda^{k-1}} \over {(k-1)!}}$

= $e^{-\lambda}\lambda e^{\lambda}$

$\sum_{k=0}^{\infty} {{\lambda^k} \over {k!}} = e^{\lambda}$

连续性随机变量的数学期望

定义

设连续性随机变量X的概率密度为f(x)，若反常积分 $\int_{-\infty}^{+\infty}xf(x)dx$ 绝对收敛，即 $\int_{-\infty}^{+\infty}|x|f(x)dx$ 收敛或者<+ $\infty$ ,则称这个积分为随机变量X的数学期望简称期望，记作E(X)

即 E(X)= $\int_{-\infty}^{+\infty}xf(x)dx$

连续性随机变量的数学期望是它的概率密度f(x)与x的乘积在整个实数域上的积分

均为分布的数学期望

$$ f(x)=\left{

\begin{aligned}

&{1 \over {b-a}}，{a < x < b} \

&0, 其他

\end{aligned}

\right.
$$

E(X)= $\int_{-\infty}^{+\infty}xf(x)dx$ = $\int_a^b {1 \over {b-a}}dx$ = ${1 \over {b-a}}\int_a^bxdx$

= ${1 \over {b-a}}[{x^2 \over 2}]_a^b$

= ${1 \over {b-a}}·{{b^2-a^2 \over 2}}$

= ${b+a} \over 2$

正态分布的数学期望

$f(x)= {1 \over {\sqrt{2\pi}}}e^{-{{(x-\mu)^2} \over 2\sigma^2}}$

E(X)= $\int_{-\infty}^{+\infty}x{1 \over {\sqrt{2\pi}}}e^{-{{(x-\mu)^2} \over 2\sigma^2}}$

= ${1 \over \sqrt{\pi}}\int_{-\infty}^{+\infty}xe^{-({{x-\mu \over {\sqrt{2}\sigma}}})^2}d({{x-\mu} \over {\sqrt{2}\sigma}})$ 令z= ${x-\mu} \over {\sqrt{2}\sigma}$

= ${1 \over {\sqrt{\pi}}} \int_{-\infty}^{+\infty}(\sqrt{2}\sigma z + \mu )e^{-z^2}dz$ 对称性 $\int_{-\infty}^{+\infty}ze^{-z^2}dz$ =0

= ${\mu \over {\sqrt{\pi}}}\int_{-\infty}^{+\infty}e^{-z^2}dz$

= ${\mu \over \sqrt{\pi}} \sqrt{\pi}$

= $\mu$

均值为图像对称轴的很坐标

推出：

一般的，若X的概率密度f(x)的图形关于直线x=a对称，即

f(a-x)=f(a+x) ( $-\infty < x < +\infty$ )

则X的数学期望必为a

指数分布的数学期望

f (x) = {\begin{aligned} λ e^{- λ x} ， x > 0 \\ 0, x \leq 0 \end{aligned} (常 数 λ > 0)

$f(x)=\left\{ \begin{aligned} &\lambda e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right. (常数\lambda > 0)$

E(x)= $\int_{-\infty}^{+\infty}xf(x)dx$

= $\int_0^{+\infty}x\lambda e^{-\lambda x} dx$ $

= $\lambda x {-1 \over {\lambda}}e^{-\lambda x} - \int_0^{+\infty}e^{-\lambda x}dx$ 部分积分法

= $-[xe^{-\lambda x} |_0^{+\infty} - ({-1 \over \lambda}e^{-\lambda x})|_0^{+\infty}]$

= $-[(0-0) + {1 \over \lambda}e^{-\lambda x}|_0^{+\infty}]$ $\lim_{x \to +{\infty}}xe^{-\lambda x}=\lim_{x \to +{\infty}} {x \over {e^{\lambda x}}}=\lim_{x \to +{\infty}}{1 \over {\lambda x}}=0$

= ${-1 \over \lambda} (0-1)$

= $1 \over \lambda$

柯西分布的数学期望

为正无穷，所以不存在

随机变量的函数的期望

离散型

设X是离散型随机变量，其分布律为p{X= $x_k$ }= $p_k$ (k=1,2,…)

设Y是随机变量X的函数：Y=g(X)

则E(Y)=E[g(X)]= $\sum_{k=1}^{\infty}g(x_k)p_k$ 要求绝对收敛

连续性

设X是连续性随机变量，其概率密度为f(x)，设Y是随机变量X的函数：Y=g(X),其中g是连续函数

则E(Y)=E[g(x)]= $\int_{-\infty}^{+\infty}g(x)f(x)dx$ 要求绝对收敛

这个定理的意义在于：当我们求E(Y)时，不必求出Y=g(X)的概率密度，只需利用X的概率密度f(x)即可。

二维随机变量的期望

离散型

设二维离散型随机变量(X,Y)的分布律为P{X= $X_i$ ,Y= $y_j$ }= $p_{ij}$ (i,j=1,2,…)

则函数Z=g(X,Y)的数学期望

E(Z)=E(g(X,Y))= $\sum_{j=1}^{\infty}\sum_{i=1}^{\infty}g(x_i,y_j)p_{ij}$ 要求绝对收敛

连续性

设二维连续性随机变量(X,Y)的概率密度为f(x,y)，则函数Z=g(X,Y)的数学期望

E(Z)=E(g(X,Y))= $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy$ 要求绝对收敛

例子

设随机变量(X,Y)的概率密度为

f (x, y) = {\begin{aligned} \frac{3}{2 x^{3} y^{2}}, \frac{1}{x} < y < x, x > 1 \\ 0, 其 他 \end{aligned}

$f(x,y)=\left\{ \begin{aligned} &{3 \over {2x^3y^2}},{1\over x} <y<x,x>1 \\ &0,其他 \end{aligned} \right.$
求数学期望E(Y),E(1/XY)

1.E(Y)

区域在y=1/x,y=x之间

E(Y)= $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)dxdy$ 先对y积分

= $\int_1^{+\infty}dx\int_{1/x}^{x}y{3\over {2x^3y^2}}dy$ 整理得

= ${3 \over 2}\int_1^{+\infty}{1\over {x^3}}dx\int_{1/x}^{x}y{1\over {y^2}}dy$

= ${3 \over 2}\int_1^{+\infty}{1\over {x^3}}[lny]|_{1/x}^xdx$

= ${3 \over 2}\int_1^{+\infty}{1\over {x^3}}(2lnx)dx$

= ${3 \over 2}\int_1^{+\infty}x^{-3}lnxdx$ 分部积分法

= ${3\over {-2}}{[{{lnx} \over {x^2}}]_1^{+\infty}-\int_1^{+\infty}x^{-2}dlnx }$

=3/4

数学期望的性质

性质1

常数C的数学期望就是该常数本身，即

E(C)=C

性质2

设X是随机变量，C是常数，则

E(CX)=CE(X)

性质3

设X，Y是随机变量，则

E(X+Y)=E(X)+E(Y)

推论线性性质

设X1,X2,..,Xn是n个随机变量，C1,C2,..,Cn是n个常数，

则

E(C1X1+C2X2+…+CnXn)=C1E(X1)+C2E(X2)+…+CnE(Xn)

性质4

设X,Y是相互独立的随机变量则

E(XY)=E(X)E(Y)

方差

例如，三个随机变量X,Y,Z，其分布律为

X	0
p	1

Y	-1 1
p	0.5 0.5

Z	-100 100
p	0.5 0.5

虽然它们的数学期望都是0，但Y的取值分散度大于X，而Z取值的分散程度大于Y

由此可见，我们有必要考虑随机变量与其均值的偏离程度

定义

设X是一个随机变量，若 $E{[X-E(X)]^2}$ 存在，则称之为X的方差

记作D(X)或者Var(X)

称 $\sqrt{D(X)}$ 为标准差或者均方差或者根方差，

记作 $\sigma$ (X)

表示X的取值与其数学期望E(X)的偏离程度。

D(X)较小意味着X的取值比较其中在E(X)附近。

反之，D(X)较大则表示X的取值比较分散。

因此，D(X)是刻画X取值分散程度的一个量，是衡量X的取值分散程度的一个标尺。

计算

离散型

设X是离散型随机变量。X的方差

D(X)= $E\{[X-E(X)]^2\}$ = $\sum_{k=1}^{\infty}[x_k-E(X)]^2p_k$ E[g(x)]= $\sum_{k=1}^{\infty}g(x_k)p_k$

连续性

设X是连续性随机变量，其概率密度为f(x)

则X的方差

D(X)= $E\{[X-E(X)]^2\}$ = $\int_{-\infty}^{+\infty}[x-E(X)]^2f(x)dx$

重要公式

D(X)=E( $X^2$ )- $[E(X)]^2$

0-1分布的方差

E(X)=p

E( $X^2$ )= $0^2(1-p)+1^2p$ =p

D(X)=E( $X^2$ )- $[E(X)]^2$ =p- $p^2$ =p(1-p)

二项分布的方差

D(X)=D(X1+X2+..+Xn)=D(X1)+D(X2)+…+D(Xn)=np(1-p)

泊松分布

E(X)= $\sum_{k=1}^{\infty}k·{\lambda^k \over k! }e^{-\lambda}$ = $\lambda$

E( $X^2$ )= $\sum_{k=1}^{\infty}k^2·{\lambda^k \over k! }e^{-\lambda}$

= $e^{-\lambda}\lambda\sum_{k=1}^{\infty}{{k\lambda^{k-1} }\over {(k-1)!} }$

= $e^{-\lambda}\lambda\sum_{k=1}^{\infty}{{[(k-1)+1]\lambda^{k-1} }\over {(k-1)!} }$ $\sum_{k=1}^{\infty}{{\lambda^{k} }\over {k!} }=e^\lambda$

= $e^{-\lambda}\lambda[\sum_{k=1}^{\infty}{{(k-1)\lambda^{k-1} }\over {(k-1)!} }+\sum_{k=1}^{\infty}{{\lambda^{k-1} }\over {(k-1)!} }]$

= $e^{-\lambda}\lambda[\lambda\sum_{k=2}^{\infty}{{\lambda^{k-2} }\over {(k-2)!} }+\sum_{k=1}^{\infty}{{\lambda^{k-1} }\over {(k-1)!} }]$

= $e^{-\lambda}\lambda(\lambda e^{\lambda}+e^{\lambda})$

= $\lambda(\lambda+1)$

D(X)= $\lambda(\lambda+1)-\lambda^2$ = $\lambda$

均匀分布的方差

$$
f(x)=\left{

\begin{aligned}

&{1 \over {b-a}}， {a < x < b} \

&0, 其他

\end{aligned}

\right.
$$

E(X)= $(a+b) \over 2$

E( $X^2$ )= $\int_{-\infty}^{+\infty}x^2f(x)dx$ = $\int_a^b {1 \over {b-a}}dx$ = ${1 \over {b-a}}\int_a^bx^2dx$

= ${1 \over {b-a}}[{x^3 \over 3}]_a^b$

= ${1 \over {b-a}}·{{b^3-a^3 \over 3}}$

= ${b^2+ab+a^2} \over 3$

D(X)= ${{b^2+ab+a^2} \over 3}-{(a+b)^2 \over4}$ = ${1\over12}(b-a)^2$

正态分布的方差

$f(x)= {1 \over {\sqrt{2\pi}}}e^{-{{(x-\mu)^2} \over 2\sigma^2}}$

E(X)= $\mu$

D(X)= $\int[x-E(X)]^2f(x)dx$

D(X)= $E\{[X-E(X)]^2\}$ =E $[(X-\mu)^2]$

= $\int_{-\infty}^{+\infty}(x-\mu)^2{1 \over {\sqrt{2\pi}\sigma}}e^{-{(x-\mu)^2} \over {2\sigma^2}}dx$

= ${1 \over \sqrt{\pi}}\int_{-\infty}^{+\infty}(x-\mu)^2e^{-({{x-\mu \over {\sqrt{2}\sigma}}})^2}d({{x-\mu} \over {\sqrt{2}\sigma}})$ 令z= ${x-\mu} \over {\sqrt{2}\sigma}$

= ${1 \over {\sqrt{\pi}}} \int_{-\infty}^{+\infty}(\sqrt{2}\sigma^{-z^2} )e^{-z^2}dz$ 分部积分法

= $({\sigma^2 \over {\sqrt{\pi}}})-[ze^{-z^2}|_{-\infty}^{+\infty}-\int_{-\infty}^{+\infty}e^{-z^2}dz]$

= $({\sigma^2 \over {\sqrt{\pi}}})$ -[(0-0)- $\sqrt{\pi}$ ]

= $\sigma^2$

X~N{ $\mu,\sigma^2$ } 两个参数分别是数学期望和方差

指数分布的方差

f (x) = {\begin{aligned} λ e^{- λ x} ， x > 0 \\ 0, x \leq 0 \end{aligned} (常 数 λ > 0)

$f(x)=\left\{ \begin{aligned} &\lambda e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right. (常数\lambda > 0)$

E(x)= $1 \over \lambda$

E( $^2x$ )= $\int_{-\infty}^{+\infty}x^2f(x)dx$

= $\int_0^{+\infty}x^2\lambda e^{-\lambda x} dx$ $

= ${1 \over \lambda^2}\int_0^{+\infty}(\lambda x)^2 e^{-\lambda x} dx$ u= $\lambda$ x

= ${1 \over \lambda^2}\int_0^{+\infty}(u)^2 e^{-u} du$ $\Gamma(\alpha)=\int_0^(+\infty) x^{\alpha-1}e^{-x}dx$ $\Gamma(n+1)=n!$

= ${1 \over {\lambda^2}}\int_0^{+\infty}\Gamma(3)$

= $2 \over \lambda^2$

D(X)= $1\over \lambda^2$

方差的性质

性质1

常数C的方差为零，即D(C)=0

性质2

设X是随机变量，C是常数，则

D(CX)= $C^2$ D(X),D(X+C)=D(X)

D(CX)≠CD(X)

推论 $\sigma(CX)=|C|\sigma$ (X)

性质3

设X,Y是随机变量，则

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

若X,Y相互独立则

D(X+Y)=D(X)+D(Y)

性质4

D(X)=0 $\Leftrightarrow$ P{X=E()X}=1

协方差及相关系数

协方差定义

设(X,Y)是二维随机变量，称

E{[X-E(X)][Y-E(Y)]}

为X与Y的协方差，记为Cov(X,Y)或 $\sigma(X,Y)$

协方差计算公式

离散型

设(X,Y)是二维离散型随机变量，其分布律为

$p_{ij}$ =P{X= $x_i$ ,Y= $y_i$ },i,j=1,2,…

则X与Y的协方差

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}= $\sum_{j=1}^{+\infty}\sum_{i=1}^{+\infty}[x_i-E(X)][y_i-E(Y)]p_{ij}$

连续性

设(X,Y)是二维连续型随机变量，其概率密度为f(x,y),则X与Y的协方差

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}= $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}[x-E(X)][y-E(Y)]f(x,y)dxdy$

协方差的一个计算公式

Cov(X,Y)=E(XY)-E(X)E(Y)

当X与Y相互独立时，E(XY)=E(X)E(Y)

Cov(X,Y)=0

Cov(X,X)=D(X)

协方差性质

1.Cov(X,Y)=Cov(Y,X) 对称性

2.Cov(X,a)=0

3.Cov(aX,bY)=abCov(X,Y)

4.Cov(X±Y,Z)=Cov(X,Z)±Cov(Y,Z) 线性性质

矩、协方差矩阵

矩定义

E(X)是X的一阶原点矩

D(X)=E{ $[X-E(X)]^2$ }是X的二阶中心距

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}是X和Y的二阶混合中心距

E( $X^k$ )(k=1,2,..)是X的k阶原点矩

D(X)=E{ $[X-E(X)]^k$ }(k=1,2,..)是X的k阶中心距

Cov(X,Y)=E{ $[X-E(X)]^k[Y-E(Y)]^l$ }(k,l=1,2,..)是X和Y的k+l阶混合中心距

矩的计算公式

离散型

$E(X^k)=\sum_{i=1}^{\infty}x_i^kp_i$

$E([X-E(X)]^k)=\sum_{i=1}^{\infty}[x_i-E(X)]^kp_i$

$E\{[X-E(X)]^k[Y-E(Y)]^l\}$ = $\sum_{j=1}^{\infty}\sum_{i=1}^{\infty}[x_i-E(X)]^k[y_i-E(Y)]^lp_{ij}$

连续性

$E(X^k)=\int_{-\infty}^{+\infty}x^kf(x)dx$

$E([X-E(X)]^k)=\int_{-\infty}^{+\infty}[x-E(X)]^kf(x)dx$

$E\{[X-E(X)]^k[Y-E(Y)]^l\}$ = $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}[x-E(X)]^k[y-e(Y)]^lf(x,y)dxdy$

$E(X^kY^l)=\sum_{j=1}^{\infty}\sum_{i=1}^{\infty}x_i^ky_j^lp_{ij}=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}x^ky^lf(x,y)dxdy$

协方差矩阵

二维随机变量( $X_1,X_2$ )有四个二阶中心矩

$c_{11}=E\{[X_1-E(X_1)][X_1-E(X_1)]\}=D(X_1)$

$c_{12}=E\{[X_1-E(X_1)][X_2-E(X_2)]\}=Cov(X_1,X_2)$

$c_{21}=E\{[X_2-E(X_2)][X_1-E(X_1)]\}=Cov(X_2,X_1)$

$c_{22}=E\{[X_2-E(X_2)][X_2-E(X_2)]\}=D(X_2)$

它们构成的矩阵

C = {\begin{matrix} c_{11} & c_{12} \\ c_{21} & c_{22} \end{matrix}}

$C=\left\{ \begin{matrix} c_{11} & c_{12} \\ c_{21} & c_{22} \end{matrix} \right\}$

称为( $X_1,X_2$ )的协方差矩阵

n维随机变量( $X_1,X_2,…,X_n$ )的协方差矩阵为

C = {\begin{matrix} c_{11} & c_{12} & \dots & c_{1 n} \\ c_{21} & c_{22} & \dots & c_{2 n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ c_{n 1} & c_{n 2} & \dots & c_{n n} \end{matrix}}

$C=\left\{ \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \end{matrix} \right\}$

$c_{ii}=D(X_i)$

$c_{ij}=Cov(X_i,Y_j)$

统计-随机变量的数字特征

第四章 随机变量的数字特征