优阅达 | Tableau微课堂(15):跨数据库联接

published: 2021-07-20

跨数据库联接

来自不同数据源的数据

许多组织在不同的系统中保存不同的数据。SQL Server 数据库中可能有财务数据,而 Amazon Redshift 中可能有产品数据。数据可能位于不同的环境中,但我们希望将所有东西放在一起分析。

为方便学习,我们使用基于以下两种不同文件的数据源:Excel 和 CSV。

在此处所用的数据结构中,销售数据包含产品 ID,但没有关于所售产品的其他信息。CSV 文 件中的产品数据是包含产品 ID、类别、子类别和产品名称的简单表格。

这种情况非常适合跨数据库联接。如果根据产品 ID,以左联接的方式将产品数据联接到销售数据,我们就可以将产品信息添加到每笔相关销售交易。

跨数据库联接

为使用跨数据库联接创建该集成数据源,从“销售”开始,单击 Excel 并打开“Sales 2016(2016 年销售)”文件。

我们双击并将此表命名为“销售”,以便理清头绪。

接下来,我们添加一个与该数据源的数据连接。

在“连接”区域旁单击“添加”按钮,而非工具栏中的“新建数据源”按钮,依次单击“添加”和“文本文件”。

打开“Products 2016(2016 年产品)”。

将其重命名为“产品”。

然后,将数据源命名为更具描述性的“2016 年销售和产品”。

与同一数据源中的所有联接一样,也可单击图标编辑联接,我们将选择左联接。

此时,可以看到数据已基于产品 ID 联接到行级别。在网格中,可看到产品信息(黄色)已添加到“销售”数据(蓝色)的每一行。

使用集成数据源

我们现在得到一个新的单一数据源,让我们测试一下。

可在数据窗格中看到单一数据源,但字段已按表格分开 - 如同相同数据源中的联接。 必要时可单击右键并选择“按文件夹分组”将其关闭,而不选择“按数据源表分组”。

为子类别和类别创建分层结构,添加产品 ID 和产品名称。

可在 CSV 表中隐藏产品 ID,因为它仅用于联接子句。

我们将“类别”移至行并将其展开、将“销售”移至列、按订单日期分开。

集成数据源的功能与任何其他单一来源数据源相似,甚至还可以发布和保存,这与混合不同。

现在,你已学完在Tableau Desktop里如何跨数据库联接。打开你电脑里的Tableau,亲手尝试操作,这对你的学习很有帮助!