统计学学习笔记——(2)数据可视化

频数

频数(Frequency):数据落在某一特定类别或组中的数据个数。

比例

比例(Proportion):一个样本(或总体)中各个部分的数据占全部数据之比。

比例

比例(Proportion):一个样本(或总体)中各个部分的数据占全部数据之比。

使用前面的数据集,不及格(< 60)的学生的比例为,9÷25=0.36或36%

进行数据整理,数据整理结果如下:

直方图

直方图(Histogram):数据分布的图形表示,离散的间隔将决定柱子的宽度。[图片上传中…(image.png-4ec779-1510218166837-0)]

整理后,生成的数据直方图如下:
组距为20的直方图

从上面的直方图中可以直观的看出60~80分段的人数最高。

可以修改组距为10来看到更多细节
组距为10的直方图

偏态分布(Skewed Distribution)

正偏态分布(Positive Skew):频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。
正偏态分布

负偏态分布(Negative Skew):频数分布的高峰向右偏移,长尾向左延伸则成为负偏态分布,也称左偏态分布。
负偏态分布

猜你喜欢

转载自blog.csdn.net/alistair_chow/article/details/78490208