matlab数据挖掘学习篇----数据特征分析

3.2.1 分布分析
1.定量数据的分布分析
(1)求极差
(2)决定组距与组数
(3)决定分点
(4)列出频率分布表
(5)绘制频率直方图

2.定性数据的分布分析
饼图和条形图

3.2.2 数据的对比分析
1.绝对数比较
2.相对数比较
结构相对数、比例相对数、比较相对数、强度相对数、计划完成程度相对数、动态相对数

3.2.3 统计量分析
1.集中趋势度量
均值、中位数、众数
2.离中趋势度量
极差、标准差、变异系数、四分位数间距

%% 统计量分析
clear;
% 简单读入数据
sales=xlsread('jiang.xlsx');

%% 统计量分析
% 均值
mean_=mean(sales);
% 中位数
median_=median(sales);
% 众数
mode_=mode(sales);
% 极差
range_=range(sales);
% 标准差
std_=std(sales);
% 变异系数
variation_=std_/mean_;
% 四分位数间距
q1=prctile(sales,25);
q3=prctile(sales,75);
distance=q3-q1;

3.2.4 周期性分析

3.2.5贡献度分析
制作帕累托图

3.2.6相关性分析
1.直接绘制散点图
2.绘制散点图矩阵
3.计算相关系数
(1)Pearson相关系数
|r|<=0.3 不存在相关性
0.3<|r|<=0.5 低度线性相关
0.5<|r|<=0.8 显著线性相关
|r|>0.8 高度线性相关
(2)Spearson秩相关系数
连续变量取值服从正态分布
(3)判定系数
相关系数的平方,越接近1,相关性越强
corr_=corr(num);

猜你喜欢

转载自blog.csdn.net/sinat_39115040/article/details/78127917