数据分析 数据特征分析

一.分布分析
1.定量数据:

对定量数据而言,选择"组数""组宽"是进行分布分析时最重要的问题,一般按以下步骤进行:
①求极差
②决定组距与组数
③确定分点
④列出频率分布表
⑤绘制频率分布直方图
要求:
①各组间是互斥的
②每个数据点都包含在某组中
③各组的组宽应尽可能相等

2.定性数据:

对定性数据而言,常依据某个属性的不同值分组,绘制成饼图或条形图

二.对比分析

分为"绝对数比较""相对数比较"

三.统计量分析
1.集中趋势度量:

平均水平的指标是对数据集中趋势的度量,包括"均值"/"中位数"/"众数"(多用于定性数据)

2.离中趋势度量:

反映变异程度的指标则是对数据离中趋势的度量,包括"标准差"/"四分位间距"/"极差"/"变异系数"

四.周期性分析

五.相关性分析
1.绘制散点图
(1)单一散点图:
在这里插入图片描述
(2)散点图矩阵:

考察多个变量间的相关性时,可利用散点图矩阵同时绘制任意2个变量间的散点图,从而快速发现多个变量间的主要相关性.这在多元线性回归中十分重要

在这里插入图片描述
2.相关系数:

在二元变量的相关分析过程中常用的相关系数包括:"Pearson相关系数"(Pearson Correlation Coefficient),"Spearman秩相关系数"(
Spearman's Rank Correlation Coefficient)"判定系数"(Coefficient of Determination)

猜你喜欢

转载自blog.csdn.net/weixin_46131409/article/details/113357807