医学统计中的基础指标计算

一、案例介绍

某人调查了15名女大学生的腰围(cm),其测定值为:71.0,73.5,81.0,72.5,76.5,75.5,76.0,69.0,76.5,72.5,79.5,74.0,66.0,69.0,73.0,想要得到这15名大学生腰围的集中趋势的指标和离散趋势的指标以及分布的形状。

二、问题分析

集中趋势是指一组数据向某一中心值靠拢的程度,他反应了一组数据向某一中心值靠拢的程度,它反映了一组数据中心点位置的所在,其中常见的表示集中趋势的变量有中位数以及平均数等。离散趋势指标一般描述远离其中心值的趋势,常见的表示离散程度的指标有方差或者标准差、变异系数等。分布的形状一般反映数据分布的偏态(偏度)与峰态(峰度)想要得到这15名大学生腰围的集中趋势的指标、离散趋势的指标以及分布的形状,可以进行公式计算,或者利用软件快速得到。接下来我们一一进行描述。

三、公式计算

1.集中趋势的指标计算

表示一组数据集中趋势的指标有很多,我们这里对均值、中位数进行描述。

均值

均值,他是一组数据相加后除以数据个数得到的结果,均值是集中趋势的最主要测度值,它主要适用于定量数据而不适用于定类数据。其计算公式如下:

中位数

中位数是一组数据排序后处于中间位置上的变量值,想要得到15名大学生腰围的中位数,就需要先将数据排序,找到中间位置上的数值,经排序后中位数为73.5。

2.离散趋势的指标

对集中趋势的指标计算后,我们对表示离散趋势的指标进行计算,常见的指标一般有最大值,最小值,四分位差,方差,标准差,变异系数。

最大值

最大值一般就是指一组数据中最大的值。这里为81.0。由于只有15个数据,所以结论比较直观,如果分析的数据过多一般可能需要借助数据分析工具进行查看更方便。

最小值

最小值一般就是指一组数据中最大的值。这里为66.0。由于只有15个数据,所以结论比较直观,如果分析的数据过多一般可能需要借助数据分析工具进行查看更方便。

四分位差

四分位差也称四分间距(IQR),一般是指上四分位数和下四分位数之差,四分位数一般反映了中间50%的数据的离散程度,数值越小说明中间数据越集中,反之,数值越大说明数据越分散,四分位差在一定程度上说明了中位数对一组数据的代表程度,一般适用于定量变量。四分位数是将一组数据由小到大排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1、Q2、Q3。分别为71和76.5,所以四分位差为5.5。

方差

方差是各变量值与平均数离差平方的平均数,方差能够很好的反映数据的离散程度,也是应用最广的离散测度值。其计算公式如下:

标准差

标准差就是就是方差的平方根值,所以案例中的标准差为4.012。

变异系数

变异系数也叫离散系数,它是一组数据的标准差与其相应的平均数之比,变异系数是测度数据离散程度的统计量,主要用于比较不同样本数据的离散程度,变异系数大,说明离散程度大,变异系数小,说明数据的离散程度也小。其计算公式如下:

 3.分布的形状

虽然集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称,偏斜程度等等,其中偏度和峰度就是对数据分布形状的测度。

偏度

偏度也称偏态它是对数据分布对称性的测度,偏度可以描述数据的分布情况,具体如下:

 四、软件操作及结果解读

本案例只有15个数据,所以利用公式计算比较容易,如果一组数据有很多个,则不容易利用公式进行计算,这时,我们可以借助数据分析工具,快速准确的得到结果。

  1. 软件操作
    首先进行上传数据,数据格式如下:

一列为一个分析项,为一个指标。上传数据后点击【通用方法】→【描述分析】然后进行分析:

  1. 结果解读

结果如下:

结果分为基础指标和深入指标,基础指标如下:

深入指标如下:

可以发现分析工具得到的数据和计算的数据都一致,但是利用分析工具得到的数值更方便更迅速。

可以发现该组数据的平均腰围为73.7cm,并且方差为16.1,标准差为4.012,其中峰度为-0.089说明数据为扁平分布,偏度为-0.053说明数据为中等偏态分布。

五、结论

1、排序题如何分析?

排序题一般是计算平均排名值,通过排名大小进行对比和分析。直接使用描述分析即可,同时排序题也是‘定量’数据,可使用方差分析或t检验等对比排名的差异情况。特别提示,需要注意数字代表的意义,比如数字越小代表排名越好,还是数字越大代表排名越好。如果数字大小代表的排名好坏与从预期不符,建议可使用数据处理里面的数据编码进行反向处理后再分析即可。

2、如何计算众数?

众数是指出现频率最高的项,建议使用频数分析查看即可。有可能出现频数出现最高的项有多个,此时众数就有多个。众数的实际应用意义较少,建议用户可结合数据类型情况,使用百分比,或者平均值或者中位数等,而不使用众数。

猜你喜欢

转载自blog.csdn.net/m0_37228052/article/details/131452245