通常随机实验,建立在样本空间上的随机变量不会只有一个,比如研究一个家庭的生活水平,不但观察月收入,还要观察月支出。
一般,如果X,Y是定义在样本空间S上的随机变量,那么(X,Y)称为二维随机变量(或称二维随机向量),类似可以定义n维随机变量。
定义:设二维随机变量(X,Y)所有可能的取值为(xi,yj),(i,j=1,2,3…);(X,Y)取(xi,yj)的概率为pij,称
P{X=xi,Y=yj}=pij为二维随机变量(X,Y)的分布律,也称为X和Y的联合分布律。
显然pij>=0
同理,对于连续型随机变量,有
(X,Y)落在某一区域G的概率P{(X,Y)∈G}=
同理,可以定义二维连续随机变量的分布函数
F(x,y)=P{(X≦x)∩(Y≦y)}=P{X≦x,Y≦y}称作二维随机变量的分布函数
F(x,y)值描述的是二维随机变量落在下图阴影区的概率:
上面讲的是联合分布,对于二维随机变量,自然也会有X,Y各自单独的分布,称为边缘分布。
对于离散型随机变量,由于可以看作一个矩阵:如图:
Y/X | y1 | y2 | y3 | … | yn |
---|---|---|---|---|---|
x1 | p11 | p12 | p13 | … | p1n |
x2 | p21 | p22 | p23 | … | p2n |
x3 | p31 | p32 | p33 | … | p3n |
… | … | … | … | … | … |
xi | pi1 | pi2 | pi3 | … | pin |
… | … | … | … | … | … |
xm | pm1 | pm2 | pm3 | … | pmn |
很显然,单纯研究X=xi时候,P{X=xi}=pi1+pi2+pi3+…+pim=
同理推出:
P{Y=yj}=p1j+p2j+p3j+…+pnj=
二维连续性随机变量也类似,只不过连加变成积分而已。对于P{X=xi}是对y积分,P{Y=yj}是对x积分。比如,已知(X,Y)是连续型随机二维变量,而且其概率密度函数为f(x),求X在[a,b]区间的概率,计算公式为:
二维随机变量的条件分布
二维随机变量的条件分布从概率的条件分布而来,研究的是当xi或者yj已知的条件下,yj或xi的分布规律,借助概率的条件分布表达式,可以写出形如下面的二维随机变量条件分布表达式:
P{Y=yj|X=xi}=
以上公式描述为:设(X,Y)的概率密度为f(x,y),边缘概率密度分别为fx(x)和fy(y),则条件概率密度fY|X(y|x)=
,也即:f(x,y)=fx(x)*fY|X(y|x)=fy(y)*fX|Y(x|y)
上面的公式推导原理如下:
对于离散型随机变量,我们可以计算X=xi时候yj的概率,但是对于连续性随机变量,无论对于xi还是yj,由于积分都是0(由于是某一个点,积分区间是0,所以积分也是0)不是直接套用离散型的公式,但是借助微分和极限的方法,我们可以如下求近似值:P(a≦Y≦b,x≦X≦x+ε)ε→0=
=$$
公式编辑好麻烦好累啊。手写看图吧:
上图中的F称为已知X=x条件下Y的条件分布函数
我们可以推出FY|X(y|x)=
FY|X(y|x)=fy|x(y|x)对于y积分