统计学(一)

一、概念 统计:通过某种有意义的方式对原始事实和数据进行提炼。 统计的根本在于数据 搜集数据、分析数据、结论或评估 数据:定性数据、定量数据 饼图:对不同组所占比例进行比较 条形图:垂直和水平,堆积条形图(比较频数)和分段条形图(同时表示频数和百分数) 直方图:分组数据,考虑直方图,注意等宽与不等宽时(頻率密度),始终记住面积与频数成正比即面积=频数,先求宽度(组距)再求高度(频率密度),绘图。 折线图:累计频数,总体趋势 二、集中趋势量度 均值:平均数的一般度量 了解异常值的概念 异常值和偏斜数据使均值产生误导,使用其他方式寻找典型值。 中位数:另一种平均数的表现形式,奇数个则中间那个数,如果偶数个则中间两个数的均值. 当中位数和均值都出现误导时,众数:频数最大的数,不仅用于数值型数据还用于类别数据。   三、分散性和变异的量度 极差(全距):数据分散情况 max - min,仅仅描述了宽度 四分为数:将数据集按升序分成相等的四份 下四分位Q1 上四分位Q3  Q2为中位数 四分位距 IQR=Q3 - Q1 记住怎么取中位数(n/2)、上分位数(n/4)、下分位数(3n/4)  注意奇偶 四分位数的作用在于剔除异常值,弄清数据的分布情况 箱线图表示各种距 方差:计算变异性 标准差:比方差更直观,方差开方,与均值的距离,分散程度 标准分:不同数据集的数据进行比较,和自己比。Z=(X-U)/O    

猜你喜欢

转载自sosop.iteye.com/blog/2044523