离散趋势的应用——基于离散趋势识别“种子选手”

内容导入:

大家好,这里是每天分析一点点。本期给大家介绍的是数据分析基础系列离散趋势的基本原理与应用,包括极差、方差与离散系数的原理与计算,再结合股票案例分析,讨论收益的稳定性,根据离散趋势指标计算结果解释原因。文章内容适合数据分析小白,内容深入浅出,案例贴合实际。下期给大家介绍描述性统计分析的应用,欢迎大家关注。

概念介绍:

离散趋势的概念:

离散趋势在统计学中是指一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度,并且从另一个方面说明了集中趋势测度值的代表程度。描述数据离散程度采用的测度值,根据所依据数据类型的不同主要有极差、分位距、方差、标准差和离散系数。

极差的原理:

极差为一组数据的最大值与最小值之差,也称全距R。容易受极端值的影响。

方差的原理:

方差与标准差表示数据集波动的大小,方差小,表示数据集比较集中,波动性小,方差大,表示数据集比较分散,波动性大。这两个指标能较好地反映出数据的离散程度,是应用最广泛的离散程度的测度值,实际应用中更多使用标准差。

离散系数的原理:

离散系数也称为变异系数,是一组数据的标准差与其相应的平均数之比。是测度数据离散程度的统计量,主要用于比较不同样本数据的离散程度,离散系数大,说明数据的离散程度大;离散系数小,说明数据的离散程度小。

特别提示:

1、极差描述了数据的范围,但无法描述其分布状态。且对异常值敏感。

2、标准差只能用于统一体系内的数据比较。

3、离散系数是统一的数据波动性比较参数。

计算与应用方式:

极差的计算与应用:

极差为一组数据的最大值与最小值之差。

计算公式:

计算实例:假设一支股票8天的收益为10,11,12,13,14,15,16,17,现在计算这支股票的极差最大值是17,最小值是10。因此,极差=最大值-最小值=17-10=7。

极差对于数据的波动程度衡量不够准确,股票收入变成1, 10, 11, 12, 13, 14, 15, 16, 17, 101。当数据出现异常的离群值,极差准确性就受到影响。此时,极差=最大值-最小值=101-10=100;但是,正常区间的数据波动性没这么大。还记得第一期去除异常值的箱体图吗,当去除异常值1和101时,极差变成17-10=7,又回到了正常水平。

方差的计算与应用:

方差是各变量值与其平均数离差平方的平均数。

方差的平方根称为标准差。

计算实例:用方差与标准差计算下列股票的波动性,17, 11, 15, 13, 13, 13, 13, 14, 12, 12,12,12, 10, 16,

import numpy as np

data=np.array([17,11,15,13,14,12,10,16])

var=np.var(data);print(var)

std=np.std(data);print(std)

#方差为5.25

#标准差为2.29129

离散系数的计算与应用:

1、离散系数的计算

是一组数据的标准差与其相应的平均数之比。

计算实例:一个班的年龄如下:17,11,15,13,14,12,10,16,先计算平均数,再计算标准差,最终得到离散系数。

import numpy as np

data=np.array([17,11,15,13,14,12,10,16])

mean=np.var(data)

std=np.std(data)

Vs=std/mean

print(Vs)

#该数据离散系数为0.436436

为什么要有离散系数呢?是为了不同样本的波动性可比较。因为如果样本的平均值是相同的,那么我们比较方差或者标准差就能知道数据的稳定性。如果数据的平均值不同,无法通过上述比较得出结果,就需要应用离散系数。离散系数最通常的应用,对于股票的风险测量,股票的风险系数就是离散系数。

综合应用场景:

甲乙两个运动员都是中等水平,各连续打靶8次,请问哪个运动员发挥稳定?

甲乙连续打8次靶,按先后顺序记录如下:

甲运动员:[8,7,8,9,9,8,7,8]。

乙运动员:[5,6,6,7,7,10,10,10]。

通过计算,得出的离散趋势结果入下表所示:

如果计算的结果中有离散系数,我们可以直接使用离散系数进行比较,就不用看方差与标准差。通过方差、标准差、离散系数的比较,发现甲的离散趋势指标均比乙的指标小,因此,甲发挥的更加稳定。

各位看官,今天看得过瘾吗?还没有结束,我们为大家准备了离散趋势的相关python代码案例,作为小礼物送给大家,更多内容,请关注海数据公众号。

本期分享到这里,我们会在每周持续更新,咱们下期再见,期待您的光临。

有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。

猜你喜欢

转载自blog.csdn.net/qq_40433634/article/details/108803544