七周成为数据分析师05_数据可视化

数据可视化之美

数据可视化的目的是为了让数据更高效,让读者可以更高效阅读,而不单是自己使用。

数据可视化首先需要突出数据背后的规律和重要因素,其次才是美观。

数字可视化应该基于实际业务背景,比如地铁线路图并没有按照真实的地理距离来划分,但它却准确直观的传递给用户最关注的重点:应该如何乘车才能到达某地。

图表绘制部分主要为实操,这里就不做分享。原课程可以参考如下链接:

如何七周成为数据分析师:Excel技巧之甘特图绘制(项目管理)

 

图表的基本概念

1. 维度和度量

首先需要对维度和度量的概念进行区分。维度表示分析数据的角度/属性,度量则是衡量这个属性的数值大小。

  • 维度 Dimension:描述分析的角度和属性,属于分类数据
    • 如:时间、地理位置、产品类型
  • 度量 measure:具体的参考数值,属于数值数据
    • 如:元、销量、销售额

2. 维度主要分为三大类的数据结构:文本(类别)、时间、数值

如:地区分类为文本维度,年份为时间维度,销售额为数值维度

维度之间可以互相转换,如一个人的年龄,本来是时间维度,但可以将其转换为“青年、中年、老年”,转换为文本维度

常见的可视化图表

1. 散点图

散点图的优势在于揭示数据间的关系,发觉变量与变量间的关联。

散点图需要至少需要两个维度数据,一列放置于 X 轴,一列放置于 Y 轴

 对散点图进行扩展,可以绘制气泡图

区别之处在于气泡图引入了第三个度量,作为气泡的大小

2. 折线图

折线图常用于观察数据随时间变动的趋势。

此时 X 轴为时间维度,Y 轴为数值维度。

对折线图进行拓展,可以绘制面积图

区别之处在于面积图更易于对比各类别间的数据随时间变化的趋势,各类边数据此时是累加显示的。

3. 折线图

折线图常用于多个维度的比较和变化。

文本维度/时间维度通常作为X轴。数值型维度作为Y轴。柱形图至少需要一个数值型维度。

柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。

4. 饼图

饼图优点在于美观,但难以观察各类别间的差距。

5. 漏斗图

漏斗图主要反映一个转化流程,便于展示

6. 雷达图

也叫蛛网图,它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。

适用于个体的数据和属性可视化。

 

常见的高级图表

1. 树形图

树形图直观的以面积表示数值,以颜色表示类目。尤其适用于数据量较大类别较多的情况。

2. 桑基图

桑基图常用于表达信息的变动和流动状态,是揭示数据复杂变动趋势的图表。

桑基图可以一对多或多对一。如:用户在网页上的活动轨迹。

3. 热力图

热力图常用于表现数据在空间上的变化规律。

热力图也不一定表示纯粹空间,也可能是属性和维度的规律组合。

如在数据分析中常用热力图表示各特征间的线性关系。

4. 关系图

关系图常用于展示不同类别之间的数据关系,展现失误相关性和关联性。

如社交关系链、品牌传播

5. 箱线图

箱线图和直方图类似,主要用于统计中,用于观察数据分布情况和对比数据分布

6. 标靶图

也称子弹图,常用于衡量 KPI 完成情况

7. 词云图

词云图多用于展示,绘制简单

8. 地理图

地理图主要体现数据和空间之间的关系

猜你喜欢

转载自www.cnblogs.com/xingyucn/p/10403077.html