可汗学院公开课统计学笔记 第1到10集 均值 中位数 众数 极差 统计图

 
 

第1集 均值mean 中位数median 众数mode

均值(mean)也就是算术平均值,即数据集中所有数据之和除以数据个数。
中位数(median, middle number)是数据集排序后,处在中间的数。
众数(mode)是数据集中出现次数最多的数。
 

第2集 极差range 中程数midrange

极差(range)是数据集中最大数减去最小数的统计量。
中程数(midrange)是最大数和最小数的均值。
 
极差:指的是数据集中数字分开的有多远
极差计算:数据集中最大的数 - 数据集中最小的数
极差意义:极差数值越小,数字之间就越紧密
 
中程数:最大数和最小数的平均值(算术平均值)
中程数意义:衡量数据的集中趋势
 

第3集 象形统计图 pictograph

象形统计图是用象形图像表示统计数据的图像,这一节讲象形统计图及例子。

第4集 条形图 bar graph

条形图又称柱形图,是一种重要的分类汇总工具,这一节讲条形图及例子。

第5集 线形图 line graph

线形图,是将数据点描出来,然后连线形成的图像。用来表示趋势,这一节讲线形图及例子。

第6集 饼图 pie graph

饼图,看起来像一块切开的饼,用于表示占比。这一节讲饼图及例子。

第7集 误导人的线形图 Misleading line graphs

下图主要误导人的地方有两点:
1. 左右两图的刻度不同,左图的起始刻度是50%,而右图起始刻度是0%,给人感觉像是喜欢Thrill Soda的人超过了Yummy Cola的人,实际上即使喜欢Yummy Cola的人在减少,喜欢Yummy Cola的人远多于喜欢Thrill Soda的人。
2. 左图和右图刻度距离不同,即右图10%的刻度距离差不多是左图10%距离的1.5倍,导致右图看起来上升幅度更大。
 
应该将两条折线放在一张图里面更准确、更真实。

第8集 茎叶图 stem and leaf plot

茎叶图是将数组中的数按位数进行比较,分别做出茎和叶,以此统计数据。这一讲讲茎叶图及例子。

第9集 箱线图 Box plot

盒须图是用四个四分位点分开数据集的图,能有效给出数据散布状况。这一讲讲盒须图及例子。
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
下图中位数是6,下四分位数是2.5,上四分位数是12.5,最小值是1,最大值是22

这组数据显示出:

  • 最小值(minimum)=5
  • 下四分位数(Q1)=7
  • 中位数(Med--也就是Q2)=8.5
  • 上四分位数(Q3)=9
  • 最大值(maximum)=10
  • 平均值=8
  • 四分位间距(interquartile range)={\displaystyle Q3-Q1}=2 (即ΔQ)

第10集 箱线图2

这一讲讲盒须图的另外一个例子,强化盒须图这一重要统计图表的概念。
 

猜你喜欢

转载自www.cnblogs.com/sxpujs/p/11145387.html