1 先从离散型随机变量和连续性随机变量说起

对于如何分辨离散型随机变量和连续性随机变量，在贾俊平老师的《统计学》教材中，给出了这样的区分：

如果随机变量的值可以都可以逐个列举出来，则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

进一步解释，离散型随机变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如，企业个数，职工人数，设备台数等，只能按计量单位数计数，这种变量的数值一般用计数方法取得。反之，在一定区间内可以任意取值的变量叫连续变量，其数值是连续不断的，相邻两个数值可作无限分割，即可取无限个数值。例如，生产零件的规格尺寸，人体测量的身高，体重，胸围等为连续变量，其数值只能用测量或计量的方法取得。

形象点来解释：：

画一幅画，左边是梯子，右边是斜坡。
像梯子一样能说出有多少层的，可描述的，是离散型随机变量；
像斜坡一样不能说出有多少层阶梯，不可描述的，是连续性随机变量。
需要注意的是，实际操作中梯子的阶高可能很小，看起来很像斜坡，需要放大看。

2 离散型随机变量的概率函数，概率分布和分布函数

在理解概率分布函数和概率密度函数之前，我们先来看看概率函数和概率分布是咋回事。

为什么我们花这么大的力气去研究这个概念。因为它实在太重要了，为什么呢？在这里，直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的：

研究一个随机变量，不只是要看它能取哪些值，更重要的是它取各种值的概率如何！

这句是本文的核心内容，本文的所有概念，包括概率密度，概率分布，概率函数，都是在描述概率！

2.1 概率函数和概率分布

2.1.1 概率函数

概率函数，就是用函数的形式来表达概率。

pi=P(X=ai)(i=1,2,3,4,5,6)

在这个函数里，自变量（X）是随机变量的取值，因变量（pi）是取值的概率。它就代表了每个取值的概率，所以顺理成章的它就叫做了X的概率函数。从公式上来看，概率函数一次只能表示一个取值的概率。比如P（X=1）=1/6,这代表用概率函数的形式来表示，当随机变量取值为1的概率为1/6，一次只能代表一个随机变量的取值。

2.1.1 概率分布

接下来讲概率分布，顾名思义就是概率的分布，这个概率分布还是讲概率的。我认为在理解这个概念时，关键不在于“概率”两个字，而在于“分布”这两个字。为了理解“分布”这个词，我们来看一张图。

离散型随机变量的值和概率的分布列表

在很多教材中，这样的列表都被叫做离散型随机变量的“概率分布”。其实严格来说，它应该叫“离散型随机变量的值分布和值的概率分布列表”，这个名字虽然比“概率分布”长了点，但是肯定好理解了很多。因为这个列表，上面是值，下面是这个取值相应取到的概率，而且这个列表把所有可能出现的情况全部都列出来了！

举个例子吧，一颗6面的骰子，有1，2，3，4，5，6这6个取值，每个取值取到的概率都为1/6。那么你说这个列表是不是这个骰子取值的”概率分布“？