1、数据分析方法:
(1)呈现现状的描述性统计(power pivot :pp ),通过对比与细分进行现状及原因分析。可制作数据透视表,通过求和、求均值以及数据组成了解其构成,还可通过不同时间维度的对比,查找数据变化原因,最后制作相关图表对现状进行呈现及描述。
(2)展望未来的预测性分析,分析现有数据间的相关性,探寻数据之间存在的联系,并进一步建立相关回归模型(分析工具库)的方式对未来进行预测。
2、power pivot:整合多数据源、处理海量数据、操作界面简洁、实现信息共享
工具 | 优点 | 缺点 |
Access数据库 | 数据处理能力较强 使用SQL处理数据较为灵活 适合SQL初学者学习SQL语句 |
数据超千万条时性能会下降 使用SQL分析数据不如透视表灵活 |
Miscrosoft | 适合SQL初学者学习SQL语句 | 数据处理性能弱于Access |
PowerPivot | 可处理大型数据集 可用数据透视表灵活分析数据 |
数据处理灵活性低 |
WHY | 用户购买目的是什么?-------- 市场调查获取数据 |
WHAT | 用户主要购买的产品?-------- 各产品销量分布 |
WHO | 用户有什么特征?------那女比例、年龄分布、地域分布、学历分布、收入分布、注册时间分布 |
WHEN | 用户何时购买?---- 购买时间分布 多久再次购买?---- 购买间隔分布 |
WHERE | 用户购买渠道有哪些?---- 渠道销量分布 |
HOW | 用户购买支付方式?---- 购买支付方式分布 |
HOW MUCH | 用户购买什么价位段的产品?---- 价格段分布 用户再次购买意愿如何?---- 用户购买频次分布 |
峰度系数:描述对称分布曲线峰顶尖峭程度的指标,相对正态分布而言 | 偏度系数:以正态分布为标准来描述数据对称性的指标。 偏度系数越接近于0,偏斜程度就越低。 |
||
峰度系数>0 | 两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布 | 偏度系数=0 | 分布对称 |
偏度系数<0(高峰左移) | 长尾在右,正偏态分布 | ||
偏度系数>0(高峰右移) | 长尾在左,负偏态分布 | ||
峰度系数<0 | 两侧极端数据较少,比正态分布更矮更胖,呈平阔峰分布 | |偏度系数|>1 | 高度偏态分布 |
0.5<|偏度系数|<1 | 中等偏态分布 |