描述统计学:表格法和图形法
数据可以分为分类型或数量型
分类型数据
- 是用来标记或名称来识别项目的类型
数据量数据
- 是表示多少或大小的数值
分类型数据汇总
频数分布:表示在几个互不重叠的组别中每一组的项目个数,就是出现频率
- 如何使用表格法和图形法汇总分类型数据
- 统计后结果
统计结果信息:提供了更多原始数据看不到的内涵,受欢迎程度谁最高,谁最低一目了然
相对频数分布和百分数频数分布
相对频数分布
一组的相对频数是属于该组的项目个数的比例
例如:50次购买饮料中可口可乐的相对频数=19/50
百分数频数分布
- 相对频数*100%
条形图和饼形图
- 条形图:用来描绘已汇总的分类型数据的频数分布、相对频数分布或百分数频数分布(是不是很绕口),别担心,看图,官方装逼词就非把简单的东西复杂解释
总结:条形图就是需要先汇总原始数据,之后把分类的类型放横轴,出现的次数放纵轴
- 饼形图:是另一种描绘分类型数据的相对频数和百分数频数分布的图形方法。
- 汇总,算出相对频数
- 相对频数 * 360°
注意:在实际生活中,会有很多的饮料分类,大部分只有很少的购买次数,大多数的统计专家建议把频数较少的组合合并到一个叫"其他"的综合组去,频数为5%或更少的组常常这样处理
练习
一、
组别 | 相对频数 | 组别 | 相对频数 |
---|---|---|---|
A | 0.22 | C | 0.40 |
B | 0.18 | D |
a.组别D的相对频数是多少?
- 0.2 = 1-0.22-0.18-0.40
b.若样本容量为200,组别D的频数是多少?
- x = 200*0.2 = 40
二、
DH | CSI | DH | CSI | L&O |
---|---|---|---|---|
Trace | CSI | L&O | Trace | CSI |
CSI | DH | Trace | CSI | DH |
L&O | L&O | L&O | CSI | DH |
CSI | DH | DH | L&O | CSI |
DH | Trace | CSI | Trace | DH |
DH | CSI | CSI | L&O | CSI |
L&O | CSI | Trace | Trace | DH |
L&O | CSI | CSI | CSI | DH |
CSI | DH | Trace | Trace | L&O |
a.这些数据是分类型还是数量型的?
- 分类型
b.编制这些数据的频数分布和百分数频数分布
- 绘制如下
分组 | 频数 | 频数分布 | 百分数频数 |
---|---|---|---|
DH | 13 | 0.26 | 26% |
Trace | 9 | 0.18 | 18% |
CSI | 18 | 0.36 | 36% |
L&O | 10 | 0.10 | 10% |
c.绘制这些数据的条形图和饼形图
- 条形图
- 饼状图
d.以样本为依据,哪个节目拥有最多的电视观众?哪个位居第二?
- CIS第一,DH第二