统计-随机变量的数字特征

第四章 随机变量的数字特征

数学期望

例子

成绩 0分 1分 2分 3分 4分 5分
人数 2 5 8 15 12 8
频率 2/50 5/50 8/50 15/50 12/50 8/50

平均成绩为

(0×2+1×5+2×8+3×15+4×12+5×8)/50=3.08

加权平均

2 50 +1× 5 50 +2× 8 50 +3× 15 50 +4× 12 50 +5× 8 50 =3.08

离散型随机变量的数学期望

定义

设离散型随机变量X的分布律为

P{X= x k }= p k (k=1,2,…)

若无穷极数 k = 1 x k p k 绝对收敛,即 k = 1 | x k | p k 收敛则称这个级数为随机变量X的数学期望,简称期望或均值。记作E(X)

E ( X ) = k = 1 x k p k

一个随机变量的数学期望是一个常数,它表示随机变量取值的一个平均,并不是算术平均,而是以概率为权重的加权平均。

扫描二维码关注公众号,回复: 1080127 查看本文章

为什么要绝对收敛?

因为绝对收敛级数具有交换律,即级数的各项任意重新排列后,级数的和不会变,从而保证任意交换xi的位置,不会改变X的数学期望。

如果此级数发散或者条件收敛,则X的数学希望就不存在。

如果X只取有限个值,则此级数只有有限项相加,它一定绝对收敛。

计算

X x1 x2 x3 … xn …
pk P1 p2 p3 … pn …

将分布律中X的歌取值 x i 与对应概率 p i 相乘,再将乘积相加,得到X的期望

E(X)= x 1 p 1 + x 2 p 2 + + x n p n + . . .

0-1分布数学期望

E(X)=0×(1-p)+1×p=p

二项分布的数学期望

P{X=k}= \C n k p k ( 1 p ) n k (k=0,1,…,n)

E(X)= k = 0 n k · p k = k = 1 n k · \C n k p k ( 1 p ) k 1

​ = p k = 1 n k · n k \C n 1 k 1 p k 1 ( 1 p ) n k

​ = n p k = 1 n \C n 1 k 1 p k 1 ( 1 p ) n k

​ = n p [ p + ( 1 p ) ] n

​ =np

\C n m = n m \C n 1 m 1

牛顿二项式: ( a + b ) n = r = 0 n \C n r a n r b r

泊松分布的数学期望

p k =P{X=k}= λ k ! e λ k ( λ > 0 ) (k=1,2,…)

E(X)= k = 1 k · λ k k ! e λ

​ = e λ k = 1 λ k ( k 1 ) !

​ = e λ λ k = 1 λ k 1 ( k 1 ) !

​ = e λ λ e λ

​ =e

k = 0 λ k k ! = e λ

连续性随机变量的数学期望

定义

设连续性随机变量X的概率密度为f(x),若反常积分 + x f ( x ) d x 绝对收敛,即 + | x | f ( x ) d x 收敛或者<+ ,则称这个积分为随机变量X的数学期望简称期望,记作E(X)

即 E(X)= + x f ( x ) d x

连续性随机变量的数学期望是它的概率密度f(x)与x的乘积在整个实数域上的积分

均为分布的数学期望

$$ f(x)=\left{

\begin{aligned}

&{1 \over {b-a}},{a < x < b} \

&0, 其他

\end{aligned}

\right.
$$

E(X)= + x f ( x ) d x = a b 1 b a d x = 1 b a a b x d x

​ = 1 b a [ x 2 2 ] a b

​ = 1 b a · b 2 a 2 2

​ = b + a 2

正态分布的数学期望

f ( x ) = 1 2 π e ( x μ ) 2 2 σ 2

E(X)= + x 1 2 π e ( x μ ) 2 2 σ 2

​ = 1 π + x e ( x μ 2 σ ) 2 d ( x μ 2 σ ) 令z= x μ 2 σ

​ = 1 π + ( 2 σ z + μ ) e z 2 d z 对称性 + z e z 2 d z =0

​ = μ π + e z 2 d z

​ = μ π π

​ = μ

均值为图像对称轴的很坐标

推出:

一般的,若X的概率密度f(x)的图形关于直线x=a对称,即

f(a-x)=f(a+x) ( < x < + )

则X的数学期望必为a

指数分布的数学期望

f ( x ) = { λ e λ x x > 0 0 , x 0 ( λ > 0 )

E(x)= + x f ( x ) d x

​ = 0 + x λ e λ x d x $

​ = λ x 1 λ e λ x 0 + e λ x d x 部分积分法

​ = [ x e λ x | 0 + ( 1 λ e λ x ) | 0 + ]

​ = [ ( 0 0 ) + 1 λ e λ x | 0 + ] lim x + x e λ x = lim x + x e λ x = lim x + 1 λ x = 0

​ = 1 λ ( 0 1 )

​ = 1 λ

柯西分布的数学期望

为正无穷,所以不存在

随机变量的函数的期望

离散型

设X是离散型随机变量,其分布律为p{X= x k }= p k (k=1,2,…)

设Y是随机变量X的函数:Y=g(X)

则E(Y)=E[g(X)]= k = 1 g ( x k ) p k 要求绝对收敛

连续性

设X是连续性随机变量,其概率密度为f(x),设Y是随机变量X的函数:Y=g(X),其中g是连续函数

则E(Y)=E[g(x)]= + g ( x ) f ( x ) d x 要求绝对收敛

这个定理的意义在于:当我们求E(Y)时,不必求出Y=g(X)的概率密度,只需利用X的概率密度f(x)即可。

二维随机变量的期望

离散型

设二维离散型随机变量(X,Y)的分布律为P{X= X i ,Y= y j }= p i j (i,j=1,2,…)

则函数Z=g(X,Y)的数学期望

E(Z)=E(g(X,Y))= j = 1 i = 1 g ( x i , y j ) p i j 要求绝对收敛

连续性

设二维连续性随机变量(X,Y)的概率密度为f(x,y),则函数Z=g(X,Y)的数学期望

E(Z)=E(g(X,Y))= + + g ( x , y ) f ( x , y ) d x d y 要求绝对收敛

例子

设随机变量(X,Y)的概率密度为

f ( x , y ) = { 3 2 x 3 y 2 , 1 x < y < x , x > 1 0 ,

求数学期望E(Y),E(1/XY)

1.E(Y)

区域在y=1/x,y=x之间

E(Y)= + + y f ( x , y ) d x d y 先对y积分

​ = 1 + d x 1 / x x y 3 2 x 3 y 2 d y 整理得

​ = 3 2 1 + 1 x 3 d x 1 / x x y 1 y 2 d y

​ = 3 2 1 + 1 x 3 [ l n y ] | 1 / x x d x

​ = 3 2 1 + 1 x 3 ( 2 l n x ) d x

​ = 3 2 1 + x 3 l n x d x 分部积分法

​ = 3 2 [ l n x x 2 ] 1 + 1 + x 2 d l n x

​ =3/4

数学期望的性质

性质1

常数C的数学期望就是该常数本身,即

E(C)=C

性质2

设X是随机变量,C是常数,则

E(CX)=CE(X)

性质3

设X,Y是随机变量,则

E(X+Y)=E(X)+E(Y)

推论 线性性质

设X1,X2,..,Xn是n个随机变量,C1,C2,..,Cn是n个常数,

E(C1X1+C2X2+…+CnXn)=C1E(X1)+C2E(X2)+…+CnE(Xn)

性质4

设X,Y是相互独立的随机变量则

E(XY)=E(X)E(Y)

方差

例如,三个随机变量X,Y,Z,其分布律为

X 0
p 1
Y -1 1
p 0.5 0.5
Z -100 100
p 0.5 0.5

虽然它们的数学期望都是0,但Y的取值分散度大于X,而Z取值的分散程度大于Y

由此可见,我们有必要考虑随机变量与其均值的偏离程度

定义

设X是一个随机变量,若 E [ X E ( X ) ] 2 存在,则称之为X的方差

记作D(X)或者Var(X)

D ( X ) 为标准差或者均方差或者根方差,

记作 σ (X)

表示X的取值与其数学期望E(X)的偏离程度。

D(X)较小意味着X的取值比较其中在E(X)附近。

反之,D(X)较大则表示X的取值比较分散。

因此,D(X)是刻画X取值分散程度的一个量,是衡量X的取值分散程度的一个标尺。

计算

离散型

设X是离散型随机变量。X的方差

D(X)= E { [ X E ( X ) ] 2 } = k = 1 [ x k E ( X ) ] 2 p k E[g(x)]= k = 1 g ( x k ) p k

连续性

设X是连续性随机变量,其概率密度为f(x)

则X的方差

D(X)= E { [ X E ( X ) ] 2 } = + [ x E ( X ) ] 2 f ( x ) d x

重要公式

D(X)=E( X 2 )- [ E ( X ) ] 2

0-1分布的方差

E(X)=p

E( X 2 )= 0 2 ( 1 p ) + 1 2 p =p

D(X)=E( X 2 )- [ E ( X ) ] 2 =p- p 2 =p(1-p)

二项分布的方差

D(X)=D(X1+X2+..+Xn)=D(X1)+D(X2)+…+D(Xn)=np(1-p)

泊松分布

E(X)= k = 1 k · λ k k ! e λ = λ

E( X 2 )= k = 1 k 2 · λ k k ! e λ

​ = e λ λ k = 1 k λ k 1 ( k 1 ) !

​ = e λ λ k = 1 [ ( k 1 ) + 1 ] λ k 1 ( k 1 ) ! k = 1 λ k k ! = e λ

​ = e λ λ [ k = 1 ( k 1 ) λ k 1 ( k 1 ) ! + k = 1 λ k 1 ( k 1 ) ! ]

​ = e λ λ [ λ k = 2 λ k 2 ( k 2 ) ! + k = 1 λ k 1 ( k 1 ) ! ]

​ = e λ λ ( λ e λ + e λ )

​ = λ ( λ + 1 )

D(X)= λ ( λ + 1 ) λ 2 = λ

均匀分布的方差

$$
f(x)=\left{

\begin{aligned}

&{1 \over {b-a}}, {a < x < b} \

&0, 其他

\end{aligned}

\right.
$$

E(X)= ( a + b ) 2

E( X 2 )= + x 2 f ( x ) d x = a b 1 b a d x = 1 b a a b x 2 d x

​ = 1 b a [ x 3 3 ] a b

​ = 1 b a · b 3 a 3 3

​ = b 2 + a b + a 2 3

D(X)= b 2 + a b + a 2 3 ( a + b ) 2 4 = 1 12 ( b a ) 2

正态分布的方差

f ( x ) = 1 2 π e ( x μ ) 2 2 σ 2

E(X)= μ

D(X)= [ x E ( X ) ] 2 f ( x ) d x

D(X)= E { [ X E ( X ) ] 2 } =E [ ( X μ ) 2 ]

​ = + ( x μ ) 2 1 2 π σ e ( x μ ) 2 2 σ 2 d x

​ = 1 π + ( x μ ) 2 e ( x μ 2 σ ) 2 d ( x μ 2 σ ) 令z= x μ 2 σ

​ = 1 π + ( 2 σ z 2 ) e z 2 d z 分部积分法

​ = ( σ 2 π ) [ z e z 2 | + + e z 2 d z ]

​ = ( σ 2 π ) -[(0-0)- π ]

​ = σ 2

X~N{ μ , σ 2 } 两个参数分别是数学期望和方差

指数分布的方差

f ( x ) = { λ e λ x x > 0 0 , x 0 ( λ > 0 )

E(x)= 1 λ

E( 2 x )= + x 2 f ( x ) d x

​ = 0 + x 2 λ e λ x d x $

​ = 1 λ 2 0 + ( λ x ) 2 e λ x d x u= λ x

​ = 1 λ 2 0 + ( u ) 2 e u d u Γ ( α ) = 0 ( + ) x α 1 e x d x Γ ( n + 1 ) = n !

​ = 1 λ 2 0 + Γ ( 3 )

​ = 2 λ 2

D(X)= 1 λ 2

方差的性质

性质1

常数C的方差为零,即D(C)=0

性质2

设X是随机变量,C是常数,则

D(CX)= C 2 D(X),D(X+C)=D(X)

D(CX)≠CD(X)

推论 σ ( C X ) = | C | σ (X)

性质3

设X,Y是随机变量,则

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

若X,Y相互独立则

D(X+Y)=D(X)+D(Y)

性质4

D(X)=0 P{X=E()X}=1

协方差及相关系数

协方差定义

设(X,Y)是二维随机变量,称

E{[X-E(X)][Y-E(Y)]}

为X与Y的协方差,记为Cov(X,Y)或 σ ( X , Y )

相关系数定义

设(X,Y)是二维随机变量,X与Y的协方差

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}= σ (X,Y)

当D(X)和D(Y)不等于0时,定义X与Y的相关系数为

ρ X Y = C o v ( X , Y ) D ( X ) D ( Y )

ρ X Y = σ ( X , Y ) σ ( X ) σ ( Y )

协方差计算公式

离散型

设(X,Y)是二维离散型随机变量,其分布律为

p i j =P{X= x i ,Y= y i },i,j=1,2,…

则X与Y的协方差

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}= j = 1 + i = 1 + [ x i E ( X ) ] [ y i E ( Y ) ] p i j

连续性

设(X,Y)是二维连续型随机变量,其概率密度为f(x,y),则X与Y的协方差

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}= + + [ x E ( X ) ] [ y E ( Y ) ] f ( x , y ) d x d y

协方差的一个计算公式

Cov(X,Y)=E(XY)-E(X)E(Y)

当X与Y相互独立时,E(XY)=E(X)E(Y)

Cov(X,Y)=0

Cov(X,X)=D(X)

协方差性质

1.Cov(X,Y)=Cov(Y,X) 对称性

2.Cov(X,a)=0

3.Cov(aX,bY)=abCov(X,Y)

4.Cov(X±Y,Z)=Cov(X,Z)±Cov(Y,Z) 线性性质

相关系数的性质

1. ρ X Y = ρ Y X 对称性

2.| ρ X Y |≤1 有界性

设X是随机变量,令 X = X E ( X ) σ ( X )

则E( X )=0 D( X )=1

X = X E ( X ) σ ( X ) 为X的标准

例如,X~N( μ , σ 2 ) => X = X μ σ ~N(0,1)

引理 设随机变量X和Y的数学期望和方差都存在,

X = X E ( X ) σ ( X ) Y = Y E ( Y ) σ ( Y )

ρ X Y = C o v ( X , Y )

3.| ρ X Y |=1的充分必要条件是存在常数a,b,(a≠0)使得P{Y=aX+b}=1 Y以概率1等于X的线性函数

当a>0时, ρ X Y =1 ;当a<0时, ρ X Y =-1

X与Y独立 =>X与Y不相关

矩、协方差矩阵

矩定义

E(X)是X的一阶原点矩

D(X)=E{ [ X E ( X ) ] 2 }是X的二阶中心距

Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}是X和Y的二阶混合中心距

E( X k )(k=1,2,..)是X的k阶原点矩

D(X)=E{ [ X E ( X ) ] k }(k=1,2,..)是X的k阶中心距

Cov(X,Y)=E{ [ X E ( X ) ] k [ Y E ( Y ) ] l }(k,l=1,2,..)是X和Y的k+l阶混合中心距

矩的计算公式

离散型

E ( X k ) = i = 1 x i k p i

E ( [ X E ( X ) ] k ) = i = 1 [ x i E ( X ) ] k p i

E { [ X E ( X ) ] k [ Y E ( Y ) ] l } = j = 1 i = 1 [ x i E ( X ) ] k [ y i E ( Y ) ] l p i j

连续性

E ( X k ) = + x k f ( x ) d x

E ( [ X E ( X ) ] k ) = + [ x E ( X ) ] k f ( x ) d x

E { [ X E ( X ) ] k [ Y E ( Y ) ] l } = + + [ x E ( X ) ] k [ y e ( Y ) ] l f ( x , y ) d x d y

E ( X k Y l ) = j = 1 i = 1 x i k y j l p i j = + + x k y l f ( x , y ) d x d y

协方差矩阵

二维随机变量( X 1 , X 2 )有四个二阶中心矩

c 11 = E { [ X 1 E ( X 1 ) ] [ X 1 E ( X 1 ) ] } = D ( X 1 )

c 12 = E { [ X 1 E ( X 1 ) ] [ X 2 E ( X 2 ) ] } = C o v ( X 1 , X 2 )

c 21 = E { [ X 2 E ( X 2 ) ] [ X 1 E ( X 1 ) ] } = C o v ( X 2 , X 1 )

c 22 = E { [ X 2 E ( X 2 ) ] [ X 2 E ( X 2 ) ] } = D ( X 2 )

它们构成的矩阵

C = { c 11 c 12 c 21 c 22 }

称为( X 1 , X 2 )的协方差矩阵

n维随机变量( X 1 , X 2 , , X n )的协方差矩阵为

C = { c 11 c 12 c 1 n c 21 c 22 c 2 n c n 1 c n 2 c n n }

c i i = D ( X i )

c i j = C o v ( X i , Y j )

猜你喜欢

转载自blog.csdn.net/jshazhang/article/details/79687889
今日推荐