概率论第4记:二维随机变量

通常随机实验,建立在样本空间上的随机变量不会只有一个,比如研究一个家庭的生活水平,不但观察月收入,还要观察月支出。
一般,如果X,Y是定义在样本空间S上的随机变量,那么(X,Y)称为二维随机变量(或称二维随机向量),类似可以定义n维随机变量。
定义:设二维随机变量(X,Y)所有可能的取值为(xi,yj),(i,j=1,2,3…);(X,Y)取(xi,yj)的概率为pij,称
P{X=xi,Y=yj}=pij为二维随机变量(X,Y)的分布律,也称为X和Y的联合分布律。
显然pij>=0
1 1 p i j = 1 \sum_{1}^{∞}\sum_{1}^{∞}p_{ij}=1
同理,对于连续型随机变量,有 f ( x , y ) d x d y = 1 \iint_{-∞}^{∞}{f(x,y)dxdy}=1
(X,Y)落在某一区域G的概率P{(X,Y)∈G}= G f ( x , y ) d x d y \iint_{G}^{}{f(x,y)dxdy}
同理,可以定义二维连续随机变量的分布函数
F(x,y)=P{(X≦x)∩(Y≦y)}=P{X≦x,Y≦y}称作二维随机变量的分布函数
F(x,y)值描述的是二维随机变量落在下图阴影区的概率:
在这里插入图片描述
上面讲的是联合分布,对于二维随机变量,自然也会有X,Y各自单独的分布,称为边缘分布。
对于离散型随机变量,由于可以看作一个矩阵:如图:

Y/X y1 y2 y3 yn
x1 p11 p12 p13 p1n
x2 p21 p22 p23 p2n
x3 p31 p32 p33 p3n
xi pi1 pi2 pi3 pin
xm pm1 pm2 pm3 pmn

很显然,单纯研究X=xi时候,P{X=xi}=pi1+pi2+pi3+…+pim= j = 1 m p i j \sum_{j=1}^{m}p_{ij}
同理推出:
P{Y=yj}=p1j+p2j+p3j+…+pnj= i = 1 n p i j \sum_{i=1}^{n}p_{ij}
二维连续性随机变量也类似,只不过连加变成积分而已。对于P{X=xi}是对y积分,P{Y=yj}是对x积分。比如,已知(X,Y)是连续型随机二维变量,而且其概率密度函数为f(x),求X在[a,b]区间的概率,计算公式为:
a b [ f ( x , y ) d y ] d x \int_{a}^{b}[\int_{-∞}^{∞} f(x,y)dy]dx

二维随机变量的条件分布

二维随机变量的条件分布从概率的条件分布而来,研究的是当xi或者yj已知的条件下,yj或xi的分布规律,借助概率的条件分布表达式,可以写出形如下面的二维随机变量条件分布表达式:
P{Y=yj|X=xi}= P { X = x i , Y = y j } P { X = x i } ( j = 1 , 2 , 3... ) \frac{P\left \{ X=x_i,Y=y_j\right \}}{P\left \{ X=x_i \right \}} \quad \quad (j=1,2,3...)
以上公式描述为:设(X,Y)的概率密度为f(x,y),边缘概率密度分别为fx(x)和fy(y),则条件概率密度fY|X(y|x)= f ( x , y ) f x ( x ) \frac{f(x,y)}{f_{x}(x)} ,也即:f(x,y)=fx(x)*fY|X(y|x)=fy(y)*fX|Y(x|y)
上面的公式推导原理如下:
对于离散型随机变量,我们可以计算X=xi时候yj的概率,但是对于连续性随机变量,无论对于xi还是yj,由于积分都是0(由于是某一个点,积分区间是0,所以积分也是0)不是直接套用离散型的公式,但是借助微分和极限的方法,我们可以如下求近似值:P(a≦Y≦b,x≦X≦x+ε)ε→0= P ( x X x + ε , a Y b ) P { x X x + ε } \frac{P\left ( x\leqslant X\leqslant x+\varepsilon ,a\leqslant Y\leqslant b\right )}{P\left \{ x\leqslant X\leqslant x+\varepsilon\right \}} =$$
公式编辑好麻烦好累啊。手写看图吧:
在这里插入图片描述
上图中的F称为已知X=x条件下Y的条件分布函数
我们可以推出FY|X(y|x)= x f Y X ( y x ) d y \int_{-\infty }^{x}{f_{Y|X} \left ( y|x \right )}d_y
FY|X(y|x)=fy|x(y|x)对于y积分

猜你喜欢

转载自blog.csdn.net/qq_31150463/article/details/85603324