优阅达 | Tableau 微课堂(70):Tableau Prep 联接步骤

published: 2023-05-31

Tableau Prep 联接步骤

欢迎观看这个有关 Tableau Prep 联接步骤 的视频。你可以向小优(微信dkmxiaoyou)索取本视频中的数据源和工作簿文件,跟着操作。

本期课程,我们将使用 “2018 Bestsellers” 和 “Books into Movies” 作为数据源演示操作。

创建联接

创建联接步骤,可以帮助你通过基于一个或多个共同字段名称来引入新的字段或列,从而将来自两个表的数据组合为一份数据表。

例如,我们有一份畅销书数据,并且想为电影改编及其发行日期添加新字段,那么可以将畅销书数据与基于共同字段(如标题)的电影数据联接起来。

它在 Tableau Prep 中是如何操作的呢?首先需要两个输入或清洁步骤进行联接。

在此,有一个 “2018 Bestsellers” 数据输入步骤和 “Books into Movies” 数据清节步骤的组合。

要创建联接,只需点击 “+” 图标并选择 “添加联接” ,然后将第二个步骤拖到其中。

或者我们可以简单地将一个步骤拖放到另一个步骤上,然后选择拖放到 “联接” ( Join )阴影区域。

如果想为这些步骤命名,以便联接配置窗格更易于理解,可以在流程窗格中直接命名。

联接配置窗格

当我们创建联接时,下面的窗格显示了大量关于联接的信息。在最左侧,我们可以看到“联接子句区域”。

默认情况下,Tableau Prep 基于所联接的表中的共同字段名称定义第一个联接子句,但也可以通过单击“+”号并选择字段名称来添加另一个联接子句。并且,还可以修改操作符(如等号、大于等于)。

还可以通过单击 “X” 来删除联接子句(当鼠标悬停时它会出现)。

在更下方,可以看到联接类型。被拖拽的步骤被认为放置在右侧,正如在这里看到的一样。因为之前将 Movies 拖拽到 2018 Bestsellers 上。

我们可以单击图表的某些部分来更改联接类型。

下面的“联接结果汇总”摘要更新显示了根据联接子句和类型包含或排除了哪些记录。

例如这里,我们看到9部电影匹配了93行图书信息,因为图书可以出现在多个列表中并持续数周,但有61部改编电影没有出现在畅销书列表中。

如果将联接类型切换为左联接,那些没有改编成电影的书籍(用蓝色的线框表示)将移到包含的列中,联接结果显示是1300行数据。

我们可以单击联接结果摘要上的条形,例如不匹配的值、匹配值或联接结果。这将决定了右侧窗格中可看到的内容。

联接子句

“联接子句”窗格显示联接子句中的所有值。红色值表示不同数据源之间的不匹配值;黑色值表示与联接子句的匹配值。

在更右侧,我们可以看到类似概要窗格的联接结果视图。

查看联接子句中错误匹配的红色值,可以发现在这两个列中 “A Wrinkle in Time” 是红色的。这不应该是一个黑色的联接匹配值吗?一定发生了什么错误。

每个标题看起来都是一样的,这让我觉得一定是某些“异常点”在制造麻烦。如果回到名为 Movies 的清洁步骤,可以使用 “清洁选项—移除标点符号”。

让我们看看联接是否匹配成功。现在左侧窗格显示有11个影片结果,并且 “A Wrinkle in Time” 也匹配上了。使用可视化联接界面可以简易识别错误并验证结果。

如果在联接步骤之后新增一个步骤,我们会看到联接两边的共同字段名称都被附加了一个 “-1” 用以区分新字段。

我们不需要来自 “Movies” 数据源的作者和标题,所以可以删除这些字段。现在,我们得到了一份整洁、已成功联接好的数据。

本节 Tableau 微课堂到此结束,感谢你的耐心阅读。

下节课将带你学习了解 Tableau Prep 并集步骤。