统计学原理 集中趋势的度量

集中趋势 (central tendency)

  • 一组数据向其中心值靠拢的倾向和程度
  • 测度集中趋势就是寻找数据水平的代表值或中心值
  • 不同类型的数据用不同的集中趋势测度值
  • 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据


分类数据:众数(mode)

1. 众数

  • 一组数据中出现次数最多的变量值
  • 适合于数据量较多时使用
  • 不受极端值的影响
  • 一组数据可能没有众数或有几个众数
  • 主要用于分类数据,也可用于顺序数据和数值型数据

2. 众数 (不惟一性)

  • 无众数
    原始数据: 10 5 9 12 6 8
  • 一个众数
    原始数据: 6 5 9 8 5 5
  • 多于一个众数
    原始数据: 25 28 28 36 42 42

顺序数据:中位数和分位数

1. 中位数 (median)

  • 排序后处于中间位置上的值
  • 不受极端值的影响
  • 主要用于顺序数据,也可用数值型数据,但不能用于分类数据
  • 各变量值与中位数的离差绝对值之和最小

2. 四分位数 (quartile)

  • 排序后处于25%和75%位置上的值
  • 不受极端值的影响

数值型数据:平均数

平均数(mean)

  • 也称为均值
  • 集中趋势的最常用测度值
  • 一组数据的均衡点所在
  • 体现了数据的必然性特征
  • 易受极端值的影响
  • 有简单平均数和加权平均数之分
  • 根据总体数据计算的,称为平均数;根据样本数据计算的,称为样本平均数。

1. 简单平均数 (Simple mean)

2. 加权平均数 (Weighted mean)

3. 几何平均数 (geometric mean)

  • n 个变量值乘积的 n 次方根
  • 适用于对比率数据的平均
  • 主要用于计算平均增长率

众数、中位数和平均数的比较

1. 众数、中位数和平均数的关系

2. 众数、中位数、平均数的特点和应用

(1)众数

  • 不受极端值影响
  • 具有不惟一性
  • 数据分布偏斜程度较大且有明显峰值时应用

(2)中位数

  • 不受极端值影响
  • 数据分布偏斜程度较大时应用

(3)平均数

  • 易受极端值影响
  • 数学性质优良
  • 数据对称分布或接近对称分布时应用

猜你喜欢

转载自blog.csdn.net/qq_43133192/article/details/106037029