谁说菜鸟不会数据分析(工具篇)----- 学习笔记2(数据分析:excel:power pivot)

1、数据分析方法:

(1)呈现现状的描述性统计(power pivot :pp ),通过对比与细分进行现状及原因分析。可制作数据透视表,通过求和、求均值以及数据组成了解其构成,还可通过不同时间维度的对比,查找数据变化原因,最后制作相关图表对现状进行呈现及描述。

(2)展望未来的预测性分析,分析现有数据间的相关性,探寻数据之间存在的联系,并进一步建立相关回归模型(分析工具库)的方式对未来进行预测。

2、power pivot:整合多数据源、处理海量数据、操作界面简洁、实现信息共享

三个数据处理分析工具优劣势对比
工具 优点 缺点
Access数据库

数据处理能力较强

使用SQL处理数据较为灵活

适合SQL初学者学习SQL语句

数据超千万条时性能会下降

使用SQL分析数据不如透视表灵活

Miscrosoft 适合SQL初学者学习SQL语句 数据处理性能弱于Access
PowerPivot

可处理大型数据集

可用数据透视表灵活分析数据

数据处理灵活性低
用户购买行为分析框架(5W2H分析法 )
WHY 用户购买目的是什么?-------- 市场调查获取数据
WHAT 用户主要购买的产品?-------- 各产品销量分布
WHO 用户有什么特征?------那女比例、年龄分布、地域分布、学历分布、收入分布、注册时间分布
WHEN

用户何时购买?---- 购买时间分布

多久再次购买?---- 购买间隔分布

WHERE 用户购买渠道有哪些?---- 渠道销量分布
HOW 用户购买支付方式?---- 购买支付方式分布
HOW MUCH

用户购买什么价位段的产品?---- 价格段分布

用户再次购买意愿如何?---- 用户购买频次分布

 

峰度系数:描述对称分布曲线峰顶尖峭程度的指标,相对正态分布而言

偏度系数:以正态分布为标准来描述数据对称性的指标。

偏度系数越接近于0,偏斜程度就越低。

峰度系数>0 两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布 偏度系数=0 分布对称
偏度系数<0(高峰左移) 长尾在右,正偏态分布
  偏度系数>0(高峰右移) 长尾在左,负偏态分布
峰度系数<0 两侧极端数据较少,比正态分布更矮更胖,呈平阔峰分布 |偏度系数|>1 高度偏态分布
0.5<|偏度系数|<1

中等偏态分布

猜你喜欢

转载自blog.csdn.net/mengjizhiyou/article/details/82810721