文章目录

一、为什么是二维随机变量
二、二维随机变量的分布函数
2.1 二维随机变量分布函数的性质

2.2 二维随机变量的边缘分布函数

三、二维离散型随机变量的联合分布和边缘分布求法
四、二维连续型随机变量的联合密度函数、分布函数和边缘分布

4.1 联合密度函数和联合分布函数
4.2 边缘密度函数
关于计算边缘分布密度的注记

一、为什么是二维随机变量

还记得我们在 $Chapter 2$ 里面讨论的都是一维随机变量嘛，但是假如我们举一个例子：

比如我们要统计人群的身高分布，那容易啊，直接统计一个变量——身高 X 即可
但是，如果我们要统计的是人群的身材，那你不可能只用身高来衡量，我们需要两个变量——身高 X 和体重 Y。因此，这就是二维随机变量的引入。

我们一般使用（X, Y）来表示。可以说是一个向量。

二、二维随机变量的分布函数

我们先来看看定义： $F(x, y) = P\{X≤x, Y≤y\}$

它的意思是由 $X ≤x, Y ≤y$ 所构成的蓝色区域所对应的立体密度函数的体积！！

这句话怎么理解呢？这得回到一维去，因为我们在一维随机变量里面， $F(x) = P\{X≤x\}$ 表示的是 $X≤x$ 所对应的平面密度函数的面积。那么扩展到二维，它的密度函数是 $f(x,y)$ ，是一个立体的函数，那么对应的自然就是体积了。

2.1 二维随机变量分布函数的性质

【1】 $0 ≤ F(x, y) ≤1$ 这个好理解，概率一定小于等于1 .
【2】 $F(x, y)$ 是关于 x 或 y 的不减函数
【3】 $F(-∞, y) = 0; F(x, -∞) = 0; F(-∞, -∞) = 0, F(+∞, +∞) = 1$
如果我们把二维随机变量的概率密度函数想象成立体草帽，那么在任何一个变量是 -∞ 的时候，还没能切到草帽，所以体积一定是0.

【4】 $F(x, y)$ 分别关于 x, y右连续
【5】 $P\{x_1 < X ≤ x_2, y_1 <Y ≤ y_2\} = F(x_2, y_2) - F(x_2, y_1) - F(x_1, y_2) + F(x_1, y_1)$

2.2 二维随机变量的边缘分布函数

上面我们讲过的： $F(x, y) = P\{X≤x, Y≤y\}$ 它叫做联合分布函数。下面我们来看看边缘分布函数，其实也好理解：
$F_X(x) = P\{X ≤ x, Y< +∞\}$ 这叫做 X 的边缘分布函数，它的意思是令 X 小于等于 x， y 爱咋地咋地，不限制。同理 $F_Y(y) = P\{X < +∞, Y < y\}$ , 这叫做 Y 的边缘分布函数。

三、二维离散型随机变量的联合分布和边缘分布求法

这一节只需要一个例子就可以解释明白：我们以下面的表为例：

X\Y	1	2	3
1	0	$\frac{1}{2}$	$\frac{1}{8}$
2	$\frac{1}{8}$	$\frac{1}{8}$	$\frac{1}{8}$

这是一个二维离散型随机变量的联合分布表，里面具体的概率值就用我们之前学过的办法计算。

下面看看如何计算联合分布函数：
假设要计算： $F(1.2, 1)$ ，那么就是： $P\{X ≤1.2, Y≤ 1)$ ，我们可以这样做：
在这里插入图片描述
$F(1.2, 1) = 0$

如果计算 $F(2.4, 2.1)$ ，我们可以这样做：
在这里插入图片描述
$F(2.4, 2.1) = 0+\frac{1}{2} + \frac{1}{8} + \frac{1}{8} = \frac{3}{4}$

其他情况类似。

那么，如何计算边缘分布呢？首先我们看看计算 X 的边缘分布：
在这里插入图片描述
我们把每一个 X 所在的行分别相加，就可以得到 X 的边缘分布。如下表：

X	1	2
P	$\frac{5}{8}$	$\frac{3}{8}$

Y 的边缘分布的计算类似。
在这里插入图片描述

最后提几个要点：

有了联合分布就可以唯一地确定边缘分布。
但是有了边缘分布并不能唯一地确定联合分布（除了 X, Y 独立的时候）

四、二维连续型随机变量的联合密度函数、分布函数和边缘分布

4.1 联合密度函数和联合分布函数

分布函数的定义还是一样的： $F(x, y) = P\{X≤x, Y≤y\}$
它的意义我们在前面讨论过了，既然是体积，那么就会涉及到二重积分。我们先回顾一下二重积分的几何意义：

当 $f(x, y) ≥ 0$ 时， $\iint_Df(x,y)dσ$ 是以区域 D 为底， $f(x,y)$ 为顶的曲顶柱体的体积。

因此，我们就可以通过二重积分计算分布函数： $F(x,y) = \int_{-∞}^{x}\int_{-∞}^{y}f(s,t)dsdt$
下面我们给出几个性质：
【1】 $f(x,y) >0$
【2】 $\int_{-∞}^{+∞}\int_{-∞}^{+∞}f(s,t)dsdt = 1$
【3】 $f(x,y) = \frac{\partial^2F(x,y)}{\partial {x} \partial {y}}$ （这时计算联合密度函数的好办法！）
【4】如果题目给出来一个区域 $G$ ，它是 X, Y 平面的一个区域。那么，我们有： $P\{(x, y)∈G\} = \iint_{G}f(x,y)dxdy$
它也就是把 G 区域沿着 Z 轴拉伸，和 $f(x,y)$ 包围起来的那一部分体积

4.2 边缘密度函数

我们先定义一下边缘分布函数： $F_X(x) = F(x, +∞) = \int_{-∞}^x\int_{-∞}^{+∞}f(s,t)dsdt\\ \quad\\ F_Y(y) = F(+∞, y) = \int_{-∞}^y\int_{-∞}^{+∞}f(s,t)dsdt$

当然，通过联合分布函数 $F(x,y)$ 也可以计算处边缘分布： $F_X(x) = \lim_{y\to +∞}F(x, y)\\ \quad\\ F_Y(y) = \lim_{x\to +∞}F(x,y)$
那么，如果要计算 X 的边缘密度函数，我们就对 $F_X(x)$ 求导： $f_X(x) = F_X'(x) = \int_{-∞}^{+∞}f(x,y)dy\\ \quad\\ f_Y(y) = F_Y'(y) = \int_{-∞}^{+∞}f(x,y)dx$
简而言之，要计算 $f_X(x)$ ，可以在无穷范围内 $f(x,y)$ 对 $y$ 积分。要计算 $f_Y(y)$ ，可以在无穷范围内 $f(x,y)$ 对 $x$ 积分。

当我们说到这儿的时候，其实给出一道题做，套公式写出来没有任何问题。但是，真正的意义你理解了吗？下面我们看一个例子，博主打算用公式法+画图理解法剖析边缘密度函数的意义：

已知（X, Y)在椭圆 $\frac{x^2}{a^2}+\frac{y^2}{b^2} = 1$ 所围成的区域上服从均匀分布。其联合密度函数为： $φ(x,y) = \begin{cases} \frac{1}{πab}\quad \frac{x^2}{a^2}+\frac{y^2}{b^2} ≤1\\ 0\quad else\\ \end{cases}$
求 X ,Y 的边缘密度函数 $φ_X(x), φ_Y(y)$

首先，抛开问题本身，我们一般假设概率密度函数 $f(x,y)$ 就是一个草帽状函数，那么问一个问题：联合分布函数 $F(x,y)$ 的意义是什么？—— 根据定义思考一下： $F(x, y) = P\{X≤x, Y≤y\} = \int_{-∞}^x\int_{-∞}^yf(u, v)dudv$ 。下面我们看一张图理解一下：

具体一个 $F(x_0, y_0)$ 的意义就是分别用 $x = x_0$ 和 $y = y_0$ 这两把刀，去切割草帽，里面那部分的体积！

那么，边缘密度函数呢？如果我们还是以 $f_X(x_0)$ 为例？

既然是 $f_X(x_0)$ ，那么也就意味着只用 $x = x_0$ 这一把刀去切割草帽，我们发现，切割草帽的时候会得到一个切割线，如上图所示。那么 $f_X(x_0)$ 的意义就是这个切割线与 $y$ 轴所围成的面积！

那么，如果我们把这样的分析具体化到这道题目上，本题的分布密度函数如下图左图所示。那么一样的道理，如果考虑 $f_X(x_0)$ ，就是只用 $x = x_0$ 这一把刀去切割分布密度函数图，如果这把刀能够切割到函数体，那么自然就会产生一个切痕，所以就是切痕曲线与 $y$ 轴所围成的面积！

很显然，我们发现：这个分布密度函数在中间那个椭圆区域才有值，其他地方都是0.

现在，我们首先计算 $φ_X(x)$ ，很自然地，我们发现，如果 $x = x_0$ 这把刀放的太前（ $x ≥a$ ）或者太后（ $x ≤ -a$ ）我们都无法切到这个函数体，自然就没有切痕。那么 $φ_X(x)$ 就会等于 0.即： $φ_X(x) = 0\quad if\space |x| ≥ a$

下面考虑能切到的时候，即 $|x| < a$ ，那么刀刃的线如上面左图加粗的地方，切割线也是一样的。然后我们就是要计算切痕与 $y$ 轴所围成的面积（如上面的右图所示）

但是我们又发现，这个切痕也是在 $y$ 处于一定范围的时候才有值，其他时候为0. $y$ 的范围我们可以通过椭圆的方程很容易求出来，就等于： $±b\sqrt{1-\frac{x^2}{a^2}}$
这个面积还不好求？就是一个矩形的面积罢了对吧！所以我们得到： $φ_X(x) = \frac{1}{πab}2b\sqrt{1-\frac{x^2}{a^2}} =\frac{2}{πa}\sqrt{1-\frac{x^2}{a^2}} \quad if \space |x| < a$

$φ_Y(y)$ 的理解方法完全类似。式子的意义理解了，带公式解题也有了底气哈哈！

关于计算边缘分布密度的注记

在计算边缘分布密度的时候，积分的区间仍然是一个大坑。这里，博主总结了一个避坑方法：
在给出的联合分布密度函数中，x ,y 的范围有了的时候，我们一定要把这个 x, y 范围所表示的区域画出来，只要把这个区域画出来了，我们在后面对 x 或者 y 积分的时候，它们各自的积分区间一目了然，就不会搞错了。

凝望，划过星空.scut

发布了140 篇原创文章 · 获赞 411 · 访问量 4万+

私信关注

【概率论与数理统计 Probability and Statistics 8】—— 深入地理解二维随机变量及其分布函数、分布密度函数的意义