第四章 随机变量的数字特征
数学期望
例子
成绩 |
0分 |
1分 |
2分 |
3分 |
4分 |
5分 |
人数 |
2 |
5 |
8 |
15 |
12 |
8 |
频率 |
2/50 |
5/50 |
8/50 |
15/50 |
12/50 |
8/50 |
平均成绩为
(0×2+1×5+2×8+3×15+4×12+5×8)/50=3.08
加权平均
0×
250
+1×
550
+2×
850
+3×
1550
+4×
1250
+5×
850
=3.08
离散型随机变量的数学期望
定义
设离散型随机变量X的分布律为
P{X=
xk
}=
pk
(k=1,2,…)
若无穷极数
∑∞k=1xkpk
绝对收敛,即
∑∞k=1|xk|pk
收敛则称这个级数为随机变量X的数学期望,简称期望或均值。记作E(X)
即
E(X)=∑k=1∞xkpk
一个随机变量的数学期望是一个常数,它表示随机变量取值的一个平均,并不是算术平均,而是以概率为权重的加权平均。
扫描二维码关注公众号,回复:
1080127 查看本文章
为什么要绝对收敛?
因为绝对收敛级数具有交换律,即级数的各项任意重新排列后,级数的和不会变,从而保证任意交换xi的位置,不会改变X的数学期望。
如果此级数发散或者条件收敛,则X的数学希望就不存在。
如果X只取有限个值,则此级数只有有限项相加,它一定绝对收敛。
计算
X |
x1 x2 x3 … xn … |
pk |
P1 p2 p3 … pn … |
将分布律中X的歌取值
xi
与对应概率
pi
相乘,再将乘积相加,得到X的期望
E(X)=
x1p1+x2p2+…+xnpn+...
0-1分布数学期望
E(X)=0×(1-p)+1×p=p
二项分布的数学期望
P{X=k}=
\Cknpk(1−p)n−k
(k=0,1,…,n)
E(X)=
∑nk=0k·pk
=
∑nk=1k·\Cknpk(1−p)k−1
=
p∑nk=1k·nk\Ck−1n−1pk−1(1−p)n−k
=
np∑nk=1\Ck−1n−1pk−1(1−p)n−k
=
np[p+(1−p)]n
=np
\Cmn=nm\Cm−1n−1
牛顿二项式:
(a+b)n
=
∑nr=0\Crnan−rbr
泊松分布的数学期望
pk
=P{X=k}=
λk!e−λk(λ>0)
(k=1,2,…)
E(X)=
∑∞k=1k·λkk!e−λ
=
e−λ∑∞k=1λk(k−1)!
=
e−λλ∑∞k=1λk−1(k−1)!
=
e−λλeλ
=e
∑∞k=0λkk!=eλ
连续性随机变量的数学期望
定义
设连续性随机变量X的概率密度为f(x),若反常积分
∫+∞−∞xf(x)dx
绝对收敛,即
∫+∞−∞|x|f(x)dx
收敛或者<+
∞
,则称这个积分为随机变量X的数学期望简称期望,记作E(X)
即 E(X)=
∫+∞−∞xf(x)dx
连续性随机变量的数学期望是它的概率密度f(x)与x的乘积在整个实数域上的积分
均为分布的数学期望
$$ f(x)=\left{
\begin{aligned}
&{1 \over {b-a}},{a < x < b} \
&0, 其他
\end{aligned}
\right.
$$
E(X)=
∫+∞−∞xf(x)dx
=
∫ba1b−adx
=
1b−a∫baxdx
=
1b−a[x22]ba
=
1b−a·b2−a22
=
b+a2
正态分布的数学期望
f(x)=12π√e−(x−μ)22σ2
E(X)=
∫+∞−∞x12π√e−(x−μ)22σ2
=
1π√∫+∞−∞xe−(x−μ2√σ)2d(x−μ2√σ)
令z=
x−μ2√σ
=
1π√∫+∞−∞(2‾√σz+μ)e−z2dz
对称性
∫+∞−∞ze−z2dz
=0
=
μπ√∫+∞−∞e−z2dz
=
μπ√π‾‾√
=
μ
均值为图像对称轴的很坐标
推出:
一般的,若X的概率密度f(x)的图形关于直线x=a对称,即
f(a-x)=f(a+x) (
−∞<x<+∞
)
则X的数学期望必为a
指数分布的数学期望
f(x)={λe−λx,x>00,x≤0(常数λ>0)
E(x)=
∫+∞−∞xf(x)dx
=
∫+∞0xλe−λxdx
$
=
λx−1λe−λx−∫+∞0e−λxdx
部分积分法
=
−[xe−λx|+∞0−(−1λe−λx)|+∞0]
=
−[(0−0)+1λe−λx|+∞0]
limx→+∞xe−λx=limx→+∞xeλx=limx→+∞1λx=0
=
−1λ(0−1)
=
1λ
柯西分布的数学期望
为正无穷,所以不存在
随机变量的函数的期望
离散型
设X是离散型随机变量,其分布律为p{X=
xk
}=
pk
(k=1,2,…)
设Y是随机变量X的函数:Y=g(X)
则E(Y)=E[g(X)]=
∑∞k=1g(xk)pk
要求绝对收敛
连续性
设X是连续性随机变量,其概率密度为f(x),设Y是随机变量X的函数:Y=g(X),其中g是连续函数
则E(Y)=E[g(x)]=
∫+∞−∞g(x)f(x)dx
要求绝对收敛
这个定理的意义在于:当我们求E(Y)时,不必求出Y=g(X)的概率密度,只需利用X的概率密度f(x)即可。
二维随机变量的期望
离散型
设二维离散型随机变量(X,Y)的分布律为P{X=
Xi
,Y=
yj
}=
pij
(i,j=1,2,…)
则函数Z=g(X,Y)的数学期望
E(Z)=E(g(X,Y))=
∑∞j=1∑∞i=1g(xi,yj)pij
要求绝对收敛
连续性
设二维连续性随机变量(X,Y)的概率密度为f(x,y),则函数Z=g(X,Y)的数学期望
E(Z)=E(g(X,Y))=
∫+∞−∞∫+∞−∞g(x,y)f(x,y)dxdy
要求绝对收敛
例子
设随机变量(X,Y)的概率密度为
f(x,y)=⎧⎩⎨⎪⎪32x3y2,1x<y<x,x>10,其他
求数学期望E(Y),E(1/XY)
1.E(Y)
区域在y=1/x,y=x之间
E(Y)=
∫+∞−∞∫+∞−∞yf(x,y)dxdy
先对y积分
=
∫+∞1dx∫x1/xy32x3y2dy
整理得
=
32∫+∞11x3dx∫x1/xy1y2dy
=
32∫+∞11x3[lny]|x1/xdx
=
32∫+∞11x3(2lnx)dx
=
32∫+∞1x−3lnxdx
分部积分法
=
3−2[lnxx2]+∞1−∫+∞1x−2dlnx
=3/4
数学期望的性质
性质1
常数C的数学期望就是该常数本身,即
E(C)=C
性质2
设X是随机变量,C是常数,则
E(CX)=CE(X)
性质3
设X,Y是随机变量,则
E(X+Y)=E(X)+E(Y)
推论 线性性质
设X1,X2,..,Xn是n个随机变量,C1,C2,..,Cn是n个常数,
则
E(C1X1+C2X2+…+CnXn)=C1E(X1)+C2E(X2)+…+CnE(Xn)
性质4
设X,Y是相互独立的随机变量则
E(XY)=E(X)E(Y)
方差
例如,三个随机变量X,Y,Z,其分布律为
虽然它们的数学期望都是0,但Y的取值分散度大于X,而Z取值的分散程度大于Y
由此可见,我们有必要考虑随机变量与其均值的偏离程度
定义
设X是一个随机变量,若
E[X−E(X)]2
存在,则称之为X的方差
记作D(X)或者Var(X)
称
D(X)‾‾‾‾‾√
为标准差或者均方差或者根方差,
记作
σ
(X)
表示X的取值与其数学期望E(X)的偏离程度。
D(X)较小意味着X的取值比较其中在E(X)附近。
反之,D(X)较大则表示X的取值比较分散。
因此,D(X)是刻画X取值分散程度的一个量,是衡量X的取值分散程度的一个标尺。
计算
离散型
设X是离散型随机变量。X的方差
D(X)=
E{[X−E(X)]2}
=
∑∞k=1[xk−E(X)]2pk
E[g(x)]=
∑∞k=1g(xk)pk
连续性
设X是连续性随机变量,其概率密度为f(x)
则X的方差
D(X)=
E{[X−E(X)]2}
=
∫+∞−∞[x−E(X)]2f(x)dx
重要公式
D(X)=E(
X2
)-
[E(X)]2
0-1分布的方差
E(X)=p
E(
X2
)=
02(1−p)+12p
=p
D(X)=E(
X2
)-
[E(X)]2
=p-
p2
=p(1-p)
二项分布的方差
D(X)=D(X1+X2+..+Xn)=D(X1)+D(X2)+…+D(Xn)=np(1-p)
泊松分布
E(X)=
∑∞k=1k·λkk!e−λ
=
λ
E(
X2
)=
∑∞k=1k2·λkk!e−λ
=
e−λλ∑∞k=1kλk−1(k−1)!
=
e−λλ∑∞k=1[(k−1)+1]λk−1(k−1)!
∑∞k=1λkk!=eλ
=
e−λλ[∑∞k=1(k−1)λk−1(k−1)!+∑∞k=1λk−1(k−1)!]
=
e−λλ[λ∑∞k=2λk−2(k−2)!+∑∞k=1λk−1(k−1)!]
=
e−λλ(λeλ+eλ)
=
λ(λ+1)
D(X)=
λ(λ+1)−λ2
=
λ
均匀分布的方差
$$
f(x)=\left{
\begin{aligned}
&{1 \over {b-a}}, {a < x < b} \
&0, 其他
\end{aligned}
\right.
$$
E(X)=
(a+b)2
E(
X2
)=
∫+∞−∞x2f(x)dx
=
∫ba1b−adx
=
1b−a∫bax2dx
=
1b−a[x33]ba
=
1b−a·b3−a33
=
b2+ab+a23
D(X)=
b2+ab+a23−(a+b)24
=
112(b−a)2
正态分布的方差
f(x)=12π√e−(x−μ)22σ2
E(X)=
μ
D(X)=
∫[x−E(X)]2f(x)dx
D(X)=
E{[X−E(X)]2}
=E
[(X−μ)2]
=
∫+∞−∞(x−μ)212π√σe−(x−μ)22σ2dx
=
1π√∫+∞−∞(x−μ)2e−(x−μ2√σ)2d(x−μ2√σ)
令z=
x−μ2√σ
=
1π√∫+∞−∞(2‾√σ−z2)e−z2dz
分部积分法
=
(σ2π√)−[ze−z2|+∞−∞−∫+∞−∞e−z2dz]
=
(σ2π√)
-[(0-0)-
π‾‾√
]
=
σ2
X~N{
μ,σ2
} 两个参数分别是数学期望和方差
指数分布的方差
f(x)={λe−λx,x>00,x≤0(常数λ>0)
E(x)=
1λ
E(
2x
)=
∫+∞−∞x2f(x)dx
=
∫+∞0x2λe−λxdx
$
=
1λ2∫+∞0(λx)2e−λxdx
u=
λ
x
=
1λ2∫+∞0(u)2e−udu
Γ(α)=∫(0+∞)xα−1e−xdx
Γ(n+1)=n!
=
1λ2∫+∞0Γ(3)
=
2λ2
D(X)=
1λ2
方差的性质
性质1
常数C的方差为零,即D(C)=0
性质2
设X是随机变量,C是常数,则
D(CX)=
C2
D(X),D(X+C)=D(X)
D(CX)≠CD(X)
推论
σ(CX)=|C|σ
(X)
性质3
设X,Y是随机变量,则
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
若X,Y相互独立则
D(X+Y)=D(X)+D(Y)
性质4
D(X)=0
⇔
P{X=E()X}=1
协方差及相关系数
协方差定义
设(X,Y)是二维随机变量,称
E{[X-E(X)][Y-E(Y)]}
为X与Y的协方差,记为Cov(X,Y)或
σ(X,Y)
相关系数定义
设(X,Y)是二维随机变量,X与Y的协方差
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=
σ
(X,Y)
当D(X)和D(Y)不等于0时,定义X与Y的相关系数为
ρXY=Cov(X,Y)D(X)D(Y)√√
ρXY=σ(X,Y)σ(X)σ(Y)
协方差计算公式
离散型
设(X,Y)是二维离散型随机变量,其分布律为
pij
=P{X=
xi
,Y=
yi
},i,j=1,2,…
则X与Y的协方差
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=
∑+∞j=1∑+∞i=1[xi−E(X)][yi−E(Y)]pij
连续性
设(X,Y)是二维连续型随机变量,其概率密度为f(x,y),则X与Y的协方差
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=
∫+∞−∞∫+∞−∞[x−E(X)][y−E(Y)]f(x,y)dxdy
协方差的一个计算公式
Cov(X,Y)=E(XY)-E(X)E(Y)
当X与Y相互独立时,E(XY)=E(X)E(Y)
Cov(X,Y)=0
Cov(X,X)=D(X)
协方差性质
1.Cov(X,Y)=Cov(Y,X) 对称性
2.Cov(X,a)=0
3.Cov(aX,bY)=abCov(X,Y)
4.Cov(X±Y,Z)=Cov(X,Z)±Cov(Y,Z) 线性性质
相关系数的性质
1.
ρXY
=
ρYX
对称性
2.|
ρXY
|≤1 有界性
设X是随机变量,令
X∗=X−E(X)σ(X)
则E(
X∗
)=0 D(
X∗
)=1
X∗=X−E(X)σ(X)
为X的标准
例如,X~N(
μ,σ2
) =>
X∗
=
X−μσ
~N(0,1)
引理 设随机变量X和Y的数学期望和方差都存在,
令
X∗=X−E(X)σ(X)
Y∗=Y−E(Y)σ(Y)
则
ρXY=Cov(X∗,Y∗)
3.|
ρXY
|=1的充分必要条件是存在常数a,b,(a≠0)使得P{Y=aX+b}=1 Y以概率1等于X的线性函数
当a>0时,
ρXY
=1 ;当a<0时,
ρXY
=-1
X与Y独立 =>X与Y不相关
矩、协方差矩阵
矩定义
E(X)是X的一阶原点矩
D(X)=E{
[X−E(X)]2
}是X的二阶中心距
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}是X和Y的二阶混合中心距
E(
Xk
)(k=1,2,..)是X的k阶原点矩
D(X)=E{
[X−E(X)]k
}(k=1,2,..)是X的k阶中心距
Cov(X,Y)=E{
[X−E(X)]k[Y−E(Y)]l
}(k,l=1,2,..)是X和Y的k+l阶混合中心距
矩的计算公式
离散型
E(Xk)=∑∞i=1xkipi
E([X−E(X)]k)=∑∞i=1[xi−E(X)]kpi
E{[X−E(X)]k[Y−E(Y)]l}
=
∑∞j=1∑∞i=1[xi−E(X)]k[yi−E(Y)]lpij
连续性
E(Xk)=∫+∞−∞xkf(x)dx
E([X−E(X)]k)=∫+∞−∞[x−E(X)]kf(x)dx
E{[X−E(X)]k[Y−E(Y)]l}
=
∫+∞−∞∫+∞−∞[x−E(X)]k[y−e(Y)]lf(x,y)dxdy
E(XkYl)=∑∞j=1∑∞i=1xkiyljpij=∫+∞−∞∫+∞−∞xkylf(x,y)dxdy
协方差矩阵
二维随机变量(
X1,X2
)有四个二阶中心矩
c11=E{[X1−E(X1)][X1−E(X1)]}=D(X1)
c12=E{[X1−E(X1)][X2−E(X2)]}=Cov(X1,X2)
c21=E{[X2−E(X2)][X1−E(X1)]}=Cov(X2,X1)
c22=E{[X2−E(X2)][X2−E(X2)]}=D(X2)
它们构成的矩阵
C={c11c21c12c22}
称为(
X1,X2
)的协方差矩阵
n维随机变量(
X1,X2,…,Xn
)的协方差矩阵为
C=⎧⎩⎨⎪⎪⎪⎪c11c21⋮cn1c12c22⋮cn2⋯⋯⋱⋯c1nc2n⋮cnn⎫⎭⎬⎪⎪⎪⎪
cii=D(Xi)
cij=Cov(Xi,Yj)