统计学 知识

均值:一种衡量平均趋势的方法。

中位数:从小到大排序,找中间的数。

众数:出现次数最多。

均值和中位数都是数字描述中间的一种方式

2、找出数字集的极差和中程数

65,81,73,85,94,79,67,83,82

(1)极差(range):数字集中最大数减去最小数。(最大数和最小数的差)

94-65=29,29就是这个数字集的极差,极差数越小,表示数字集越紧密,集中。

(2)中程数(midrange):考虑集中趋势的另一种方式,取最大数和最小数的平均值。

(最大数和最小数加起来算算术平均值)(94+65)/2=79.5

扫描二维码关注公众号,回复: 14727296 查看本文章

3、象形统计图

O-型有多少人?

2*8=16人

4、条形图

5、线形图(可以用于随时间变化的事物)

 问题:这一年中,股价是上涨,下跌,还是不变?

7月~8月,价格上涨。8月~9月,价格下跌。之后连续上涨2个月,下跌1个月,然后连续上涨数月,其中,2月至3月大幅上涨到17美元。之后下跌,最后又开始上涨。

但是问题不是逐月情况

而是整个一年间股价的情况。

因此,很明显,总体情况上涨。

6、饼图(题目:销售情况)

 销售情况最好的是:1月

销售情况最差的是:6月和7月

7、误导人的线性图

 上图的表格中分别是喜欢汽水和可乐的人数所占百分比,我们可以看到,喜欢可乐的百分比一直比喜欢汽水的百分比高。而线性图中,左侧喜欢可乐的人数在逐年下降,右侧喜欢汽水的人数在逐年上升。左右2副图对比,会让人产生一种汽水销量比可乐销量好的错觉,但这是错觉,因为纵向百分比的刻度不同。

所以,更好的方法是将2个线性表放在一张图上,使刻度相同。

8、茎叶图(茎、叶分明,能一眼看出分布状况)

 stem代表的是十位数上的数字,leaf代表的是个位上的数字。

所以图中,第一行数字,十位数上是0,表示0~9的数字都有啥,有几个

第二行数字,十位数上是1,表示10~20的数字都有啥,有几个

第三行数字,十位数上是2,表示20及以上数字都有啥,有几个

茎叶图 优点:能一眼看出分布状况。

题中问球队总共得多少分?

答:102分

9、盒须图

餐厅老板想知道顾客们从出发点到餐厅的距离,想知道这些距离的中位数是多少。

 看中位数,将数据从小到大排序。

1,1,2,2,3,3,4,4,6,7,8,10,11,14,15,20,22

排完了,中位数是6。

而中位数6左边的部分,即1,1,2,2,3,3,4,4 再算中位数。这组数的中位数为2+3/2=2.5,中位数6右边的部分,即7,8,10,11,14,15,20,22 再算中位数。这组数的中位数为11+14/2=12.5

如上图所示,各部分中位数 2.5,6,12.5 都表示出来了。

在整个数据集1~22部分中,中位数2.5~12.5的部分,我们画成盒形,称之为‘盒’,剩下的数据部分,用线段连接起来,称之为‘须’,这样‘盒须图’就画好了。

 题目:调查100棵树的年龄,求极差,和中位数。(如图所示,树的年龄的盒须图)

根据盒须图可知,

树的年龄的最低值为8,最高值为50,中位数为21;

        (1)此处可以计算极差,极差=50-8=42;

        (2)中位数,就想图中所看到的,21。

8~21区间的中位数为14,21~50区间的中位数为33;

 总共100棵树,25棵树在8~14区间,记为区间1Q;25棵树在14~21区间,记为区间2Q;25棵树在21~33区间,记为区间3Q;25棵树在33~50区间,记为区间4Q。

综上,可见虽然最老的树有50岁,可是中位数更接近于年龄的较低端。

11、统计学:集中趋势

描述性统计学

推论统计学

(1)描述性统计学

平均数:描述集中趋势的某特定数值,或者最能代表一组数据的一个数值。

均值(mean),中位数(medium),众数(mode)

                               ( 更能说明平均水平)

例子:3,3,3,3,3,100

mean:115/6=19又1/6

medium:3

mode:3

中位数和众数更能说明学生的平均水平。

12、样本和总体

μ:总体均值

:样本均值

13、统计方差

 在学习系统方差的概念前,小结一下前面学过的知识,这样一会学系统方差时可以对比学习。

广义上的“均值”可以分为3种情况:(1)算术平均数的均值(2)中位数(3)众数

这3种“均值”都是通过一个(由不同计算方法选出来的)特定数值来表现一组数据的集中趋势

通过上图可以看到,左侧这组数据和右侧这组数据的总体均值相同,但是,很明显,右侧数据中,均值2.5不能很好的代表0,0,5,5 这组数据,这些数据离均值太远。所以,均值可以衡量集中趋势,但不一定能很好的代表一组数据。

那么,如何解决呢?可以用总体方差来解决。

公式:

 

算左侧数据方差

 

 最后,根据公式,方差=(0.25+0.25+0.25+0.25)/4=0.25

同样地,右侧数据0,0,5,5 的方差=6.25

14、样本方差

15        标准差

猜你喜欢

转载自blog.csdn.net/qq_45444021/article/details/123305226