0基础统计学学习之路----随机变量的分布

随机变量：

随机变量分为两种，第一种是离散型随机变量，我们可以把离散型随机变量想象为可数的数据，比如1个气泡，1个人，5只青蛙，类似这种的属于离散型随机变量，非离散型随机变量也称为连续性随机变量，如：一个人的身高是1.72米，一段路长20KM，经过的时间为20分钟，类似这种是连续型随机变量。

通常离散型随机变量是用来描述可列有限多个的数据，连续型随机变量描述的往往是区间，不可数的数据。

随机变量的分布函数：

长成这样的就是分布函数，图中我们要先区分X和x，他们两个不是一种数据，我们可以把小x看做为条件，当x<0的时候概率为0，0≤x<1的概率为0.1，这个时候把小x代入前面的公式X就≤0.1，1≤x<2时概率为0.7，在代入前面的公式X就≤0.7........。

我们利用这种公式可以描述出离散型随机变量和非离散型随机变量的分布规律。

分布函数的性质：

图中介绍了分布函数的性质，我们要注意，分布函数是一个叠加的过程，他是单调不减的，最后累加的结果都等于1，图中所说的右连续型的意思就是，因为这个描述的是概率，所以加的过程中在X轴方向只能向右。

概率密度：

图中介绍了概率密度的定义，我们仔细观察，公式里面有一个区间的标志，我们可以把它理解为X轴上-∞到x的面积，用这个面积来描述这个概率，而这个密度就是把这个面积分了多少份。但同时我们要注意，概率密度函数的性质。

分布：

数据分布的频率通过图形描述可以分为很多种分布规律，比如：正态分布，泊松分布，T分布，F分布等等，接下来咱们重点介绍一下分布。

均匀分布：

我们可以把均匀分布在图中想象为一个矩形，均匀分布案例：

指数分布：

在图中我们发现指数分布，这根曲线线面的面积，就是分布的概率，我们可以把指数分布想象成一个

正态分布：

当μ=0；σ = 1的时候就叫标准正态分布，他是这种图形：

图上的这条曲线就是正态分布的样子，中间的竖线，我们可以把它想象成：均值=中位数=众数。

这个图片画了三个不同的正态分布，实际就是偏移了，这个有什么区别呢，注意看，他们的平均值μ不同，所以就偏移了。μ也是正态分布最高的内个点。

正态分布在统计学中会经常使用，很多数据的概率都会接近正态分布。。

二项式分布：

二项分布我认为只要理解他的概念就可以了，二项分布就是事件发生的结果只有两种，就像抛硬币，要么正要么反，或者像打篮球，要么赢，要么输，不过我们还要思考上试验次数的问题，好比说打篮球，一天打20场，赢1场的概率是多少，赢两场的概率是多少，等等等等。。

上面的图中p是赢得概率，P=0.2的时候，赢4场的概率较高，P=0.9时，赢18场的概率较高，就是这个意思。

泊松分布：

泊松分布听上去感觉很复杂，其实泊松分布咱们生活的时候是经常会遇见的，例如每天到医院看病的人数，呼叫中心一天接到多少个电话，类似这种数据都属于泊松分布。

泊松分布公式：

图上的公式我们首先要理解其含义，为了方便咱们理解其含义，直接上栗子：

在图中表述了公式相对应的含义，我们要理解公式中参数相对应的含义，就好计算了，如果再想讨论这个公式是怎么推导出来的小弟弟就做不到了。。其中，P遗憾是概率，N表示函数关系，t是我们喜爱一个想要预测的时间段，或者区间段，n表示在该时间段或区间段发生事件的频率，λ表示的是原已知的时间段或区间段内发生时间的频率，内个e是个常数项，就像π一样，然后代入公式求解。。。

卡方分布：

在这里我们直接就可以把卡方分布想象成一个总体中抽取样本，构成的分布，就叫卡方分布。。

这个篇暂时先介绍到这里，以后会有更新，具体分布小弟弟会在以后的博客里面在详细的介绍各种分布及案例。。