统计学基本概念

  1. 总体方差:
    一组资料中各数值与其算数平均数离差平方和的平均数;一组资料中各数值与其算数平均数离差平方和的平均数;
    用希腊字母σ的平方表示,σ读作“西格玛”,代表总体的标准差。
    表示一组资料中各数值的离散程度,呈正比关系;

  2. 样本方差:
    先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。
    均值是指在一组数据中所有数据之和再除以数据的个数。
    样本方差是用来估计总体方差的,为了提供无偏估计,所以分母是 n-1;

  3. 标准差
    标准差(Standard Deviation) ,中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

  4. 随机变量
    简单地说,随机变量是指随机事件的数量表现。例如一批注入某种毒物的动物,在一定时间内死亡的只数;某地若干名男性健康成人中,每人血红蛋白量的测定值;等等。另有一些现象并不直接表现为数量,例如人口的男女性别、试验结果的阳性或阴性等,但我们可以规定男性为1,女性为0,则非数量标志也可以用数量来表示。这些例子中所提到的量,尽管它们的具体内容是各式各样的,但从数学观点来看,它们表现了同一种情况,这就是每个变量都可以随机地取得不同的数值,而在进行试验或测量之前,我们要预言这个变量将取得某个确定的数值是不可能的。
    按照随机变量可能取得的值,可以把它们分为两种基本类型:
    离散型
    离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。
    连续型
    连续型(continuous)随机变量即在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值,一批传染性肝炎患者的血清转氨酶测定值等。有几个重要的连续随机变量常常出现在概率论中,如:均匀随机变量、指数随机变量、伽马随机变量和正态随机变量。

  5. 概率密度函数
    概率指事件随机发生的机率,对于均匀分布函数,概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度,它的值是非负的,可以很大也可以很小;
    单纯的讲概率密度没有实际的意义,它必须有确定的有界区间为前提。可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为1。所以单独分析一个点的概率密度是没有任何意义的,它必须要有区间作为参考和对比。

6二项分布与泊松分布

  1. 什么是概率分布?
    概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。

  2. 概率分布能当饭吃吗?学了对我有啥用?
    下次遇到类似的问题,你就可以直接套用“模板”(这些特殊分布的规律)来求得概率了。

3.特殊的概率分布有哪些?
3种离散概率分布,分别代表了解决3种问题的“万能模板”

二项分布(Binomial distribution)
符合以下4个特点的就是二项分布

1)做某件事的次数是固定的。

2)每一次事件都有两个可能的结果(成功,或者失败)

3)每一次成功的概率都是相等的

4)你感兴趣的是成功x次的概率是多少

案例:

抛5次硬币,有2次正面朝上的概率是多少

你买了之前我介绍你的5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率多大。

几何何分布(Geometric distribution)
只要符合下面4个特点就可以判别你做的事情是就是几何分布了:

1)做某事件次数(也叫试验次数)是固定

2)每一次事件都有两个可能的结果

3)每一次“成功”的概率都是相等的,成功的概率用p表示

4)你感兴趣的是,进行x次尝试这个事情,取得第1次成功的概率是多大。

案例:例如你在玩抛硬币的游戏,想知道抛5次硬币,只有第5次(就是滴1次成功)正面朝上的概率是多大。

表白3次,第3次成功的概率多大

泊松分布(poisson distribution)
符合以下3个特点就是泊松分布:

1)事件是独立事件

2)在任意相同的时间范围内,事件发的概率相同

3)你想知道某个时间范围内,发生某件事情x次的概率是多大

案例:例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率

例如你是公司质检管理员,想知道一个月内某机器损坏的10次(假如超过10次一句认为不合格)的概率是多少。

猜你喜欢

转载自blog.csdn.net/weixin_44412976/article/details/86665550