数据可视化-Tableau-连接数据

连接数据

开始使用 Tableau。第一步是加载一些数据。
如果尚未启动 Tableau 的话,请先启动。你应该看到如下所示的界面(如果版本是 10):
这里写图片描述
你将在左侧边栏中看到可以连接的数据源。对于文件资源,你可以连接到 Excel 文件、文本文件(例如 CSV)或统计文件(例如来自 SAS、SPSS 和 R 的文件)。

你可以使用 OData 连接到一些远程资源(连接到服务器),还可以连接到 Google 表格(点击更多…)。

开始加载 Global Superstore 数据。点击 “Excel”,然后选择 Global Superstore Excel 文件。
这里写图片描述
当 Tableau 连接到该数据后,你应该能够在左侧边栏中看到该 Excel 文件中的工作表(Orders、People 和 Returns)。大的橘色字体告诉你将工作表拖到此处,所以将 Orders 工作表拖到顶部面板上。
这里写图片描述
你现在应该能够在面板下方看到 Order 表格的数据预览。我还使用了 Data Interpreter(即左侧的复选框)。Data Interpreter 会尝试清理数据并添加格式,使数据更容易在 Tableau 中使用。

Tableau 会自动在标题行中查找列标签。它还会尝试检测每列的数据类型。标题栏里的小图标表示列的数据类型。Row ID 是数值数据,Order ID 是文本,Order Date 是日期,等等。
Tableau 还会查找地理空间数据,如下所示。
这里写图片描述
你可能注意到了,在第一幅图中,标题中的数值图标 (#) 是蓝色的,但是在上图中是绿色的。Tableau 会猜测数值数据是离散还是连续的,并用颜色表示,蓝色表示离散数据,绿色表示连续数据 。稍后你还会见到这类颜色编码。

Tableau 并非始终都能猜对数据类型,所以你可以通过点击数据类型符号手动设置。
这里写图片描述
例如,你可能需要将 Row ID 改成字符串(文本),因为你不会对其进行任何数学运算,只是一个标识符。你可以自己尝试如何进行设置。

因为 Tableau 从猜测的标题行中获取列名称,所以有时候列名称会不准确。幸运的是,你可以重命名,方法是点击三角形并出现下拉菜单,或者直接双击列名称。
这里写图片描述
对于字符串列,你可以进行一些简单的变换,比如将数据拆分成多列。例如,Order ID 包含用连字符分隔的三个部分。你可能希望每个部分都成一列。要拆分列,点击列标题中的三角形。
这里写图片描述
Tableau 根据分隔字符(此处是连字符)自动拆分。你还可以使用自定义拆分(选择 Custom Split…)选择按照不同的字符拆分。拆分过后,每个部分都自成一列。下面是拆分后的效果,你也可以自己试试。
这里写图片描述
在下拉菜单中,你还会看到 Create Calculated Field…。该选项使你能够根据现有列创建新的列。你可以在 Tableau 中体验该功能,或在相关文档中了解详情。
查看数据
对我来说,经常很有用的功能是在工作表中快速预览数据。如果将光标悬停在某个工作表上方,就会在右侧出现一个图标。点击该图标即可查看数据。
这里写图片描述

连结数据

你经常需要将多个来源的数据整合到一起,例如数据库中的不同表格或 Excel 文件中的工作表。例如,你可能需要包含 People 工作表和 Orders 工作表中的数据,以便分析每名销售人员的业绩。

在 Tableau 中,你可以将多个工作表拖到顶层面板上。根据你拖到的位置,会出现两种结果:联合模式或 连结模式。

联合union(类似于Excel中的concatenate)
如果将 People 拖到 Orders 下面,就出现联合效果。联合模式将数据相互堆叠,第二个工作表会附加到第一个工作表的结尾。如果多个工作表的列相同的话,这种方法就很不错,因为列将匹配。但是,如果列不同的话,就会出现很多 “null”,因为为两个工作表都创建了相关列,但是第一个工作表中没有第二个工作表中的某些列。
这里写图片描述
连结join(vlookup)
如果将第二个工作表或表格拖到顶部面板上,但是没有放在第一个工作表的上方,就会出现连结模式。连结模式不会将数据相互堆叠,而是根据共同值将每个工作表中的数据相结合。在这里,Orders 和 People 都具有列 Region,我们可以将其当做共同值。
这里写图片描述
Tableau 默认情况下会进行“内连结”。只要有共同值,就会结合数据。所以当 Orders 中的 Region 是 “East” 时,就从 Region 为”East”的 People 中获取数据。从上图中可以看出,People 中的 Person 列添加到了 Orders 中的数据上。

你可以点击连结符号来更改连结类型。此处,你还可以选择”左连结”(“left inner join”)。正常的内连结仅结合共同的数据,但是左连结会返回原始工作表中行不是 null 的数据。

请务必理解连结概念,因为你将经常组合数据。此处是关于连结的 Tableau 文档,如果你之前没遇到过连结的话,建议阅读下这篇文章。文章

猜你喜欢

转载自blog.csdn.net/weixin_41100555/article/details/80213878