从零开始Tableau | 4.数据与字段类型

 

tableau对数据和字段有着特定的定义方式,弄清楚他们的具体含义,将有助于理解tableau的工作方式,从而更好的让tableau为我所用。本节内容包括:

  • 数据类型
  • 维度与度量
  • 离散与连续

数据类型

数据类型分类

数据源的所有字段在tableau中都会被分配一个数据类型,同时 tableau还会在各字段前加上一个特定的标识,用以直观提示该字段是哪一种数据类型,tableau中的数据类型主要有文本值、日期值、日期和时间值、数字值、布尔值、地理值六类。

图:tableau的数据类型

                                                                              图:tableau的数据类型

数据类型调整

每一个字段都有着属于自己的数据类型图标,当然,tableau分配给字段的数据类型并不总是准确的,是可以根据实际分析需求进行调整的。比如,它可能会将日期字段“年-月-日”(如2017-10-09)解释为文本,但我们需要用该字段进行时间分析,则必须将其调整为日期类型;比如,它可能会将地理位置字段“ 省市”(如深圳、湖南)解释为文本,但我们需要用该字段匹配地理位置,这就必须将其调整为地理值类型。

图:数据类型示例

                                                                                    图:数据类型调整示例

需要注意的是,有的字段的数据类型图标前面,多了一个“=”,这表名该字段是tableau中的自定义数据类型,如“=#”表示自定义的数字值字段,“=Abc”表示自定义的文本值字段,“=T|F”表示自定义的布尔值字段。这些字段一般都是通过“计算字段”功能获取。

图:自定义字段示例

                                                                               图:自定义字段示例

维度与度量

维度和度量是tableau中非常重要的字段类型,进入工作表工作区后,数据窗口中就直接显示了维度和度量两个区域,数据源中的各字段被tableau智能分配字段类型后,逐一分配到这两个区域中,可以说,维度和度量是使用tableau开展数据分析时,需要掌握的最基本概念。

图:维度和度量区域示例

                                                                                   图:维度和度量区域示例

维度

维度是观察数据的角度以及对数据的描述,维度可以用文本、时间表示,也可以用数值表示,简单理解,EXCEL首行字段中,非数值型的字段就可以看作是维度。数据源导入后,tableau会将离散分类信息的所有字段(比如值为字符串、布尔值的字段)分配到维度区域。

图:Excel首航字段示例

                                                                                    图:Excel首行字段示例

将“维度”字段拖到列或行功能区后,tableau就会将该字段以坐标轴的横轴或纵轴标题形式,体现在图表中。

图:维度字段在图表中的示例

                                                                             图:维度字段在图表中的示例

度量

度量通常是数值信息,数据源导入后,tableau会将数值型的所有字段分配到度量区域。将“度量”字段拖到列或行功能区后,tableau会在视图区显示为轴。通常,维度字段在拖到列行功能区后,一般会默认进行聚合计算。

轴是一个显示最小值和最大值之间的值的度量线。

图:度量字段示例

                                                                                      图:度量字段示例

转换

尽管大部分情况,tableau能够自动并且准确地将各个字段划入到“维度”或“度量”区域,但有的时候,它也会出错,或者说它的划分与我们的实际想法有出入。

举个例子,邮政编码是由一串数字组成,tableau会将其划入到“度量”,但实际上,邮政编码通过是作为分类信息来处理,如统计同一邮政编码客户的相关数据,而不是对邮政编码进行求和、求平均数、求最大最小值等计算。

再举个例子,产品的“价格”字段是数字型,tableau也会将其划入到“度量”,可以对产品价格进行求和、求平均等计算,但如果希望统计各个价格或某价格区间的产品销量,作为“度量”字段的“价格”显然不能满足分析需要,这时就需要将“价格”字段从“度量”转换为“维度”。

图:"价格"字段转换为维度示例

                                                                        图:"价格"字段转换为维度示例

需要注意的是,通常情况下,维度字段是蓝色,度量字段是绿色,可以作为区分维度和度量的直观依据,但依靠颜色来判别一个字段是维度还是度量并不可靠,如果在行列工作区直接将一个度量字段转换为维度,虽然该字段取消了聚合运算状态,但其颜色仍然是绿色,并没有变为蓝色。因此,辨别视图中的字段是度量还是维度的依据在于该字段是否已聚合,聚合的是度量,未聚合的是维度。

图:度量转换为维度示例

                                                                             图:度量转换为维度示例

离散与连续

离散与连续是另一种数据角色分类,辨别视图中的字段是离散还是连续的依据在字段颜色,蓝色是离散字段,绿色是连续字段。

离散

在数学上,“离散”指“各自分离且不同”。在tableau中将字段从数据窗口的“维度”区域拖到列行功能区时,tableau会默认该字段为离散字段,并将该字段的每一个值在视图中显示为行或列的标题。

需要注意的是,离散字段在视图中只是标题,并不是轴,如下图中,根据“价格”字段创建的标题展示了“价格”字段中的每一个价格值,这里只能使用散点图、条形图等图形,不能使用折线图。

图:离散字段示例

                                                                              图:离散字段示例

连续

在数学上,“连续”是指“构成一个不间断的整体,没有中断”。在tableau中,连续字段被拖到列行功能区时,tableau会创建轴,轴上是连续刻度。

与离散字段不同,连续字段创建的轴,是一个范围值,如下图中,“价格”字段创建的轴的刻度表示在0-110元之间,是连续的,因此可以使用折线图。

图:连续字段示例

                                                                                     图:连续字段示例


猜你喜欢

转载自blog.csdn.net/springyang2015/article/details/82222999