数据分析之定量数据的描述统计

从集中趋势和离中趋势两个方面进行分析:

1、集中趋势度量

(1)均值

主要问题时对极端值比较敏感,因此可以使用截断均值来度量。

算术平均数:=mean()

几何平均数:=exp(mean(log()))

计算数据样本的指定阶中心距(R语言):moment(X,order),计算样本X的order阶的中心距。

(2)中位数

(3)众数

众数更适用于定性变量。众数不具有唯一性。

2、离中趋势度量

(1)极差

极差 = 最大值 - 最小值

极差的问题是忽略了位于最大值和最小值之间的数据是如何分布的。

(2)标准差

(3)变异系数

度量标准差相对于均值的离中趋势,用来比较两个或多个具有不同单位或不同波动幅度的数据集的离中趋势。

CV=\frac{s}{\bar{x}}

(4)四分位数间距

上四分位数{Q}_U与下四分位数Q_{L}之差,包含了全部观察值的一半。

猜你喜欢

转载自blog.csdn.net/zjlamp/article/details/81321503