优阅达 | Tableau 微课堂(75):其他筛选主题

published: 2023-05-08

其他筛选主题

在 Tableau 中,筛选器非常强大的,但同时也非常复杂。在本期微课堂中,如果你已经对筛选器有了基本理解,就像之前在微课堂中的其他有关“筛选”介绍的那样,那么本期将展示一些有关筛选器的更深层概念。

上下文筛选器

首先是上下文筛选器。有一点需要注意的是,筛选器选项卡上的筛选器都是独立计算的。如果一个给定的筛选器会精简数据集,那么它适合添加到上下文中。

上下文筛选器将优先计算,所有其他筛选器随后再运行其筛选结果。

例如,我们只想查看机器子类别中的产品,可能会通过右键单击并选择“添加到上下文”来将其作为上下文筛选器。

筛选器现在由蓝色变成了灰色,任何后续的筛选器都将基于机器产品运行。

当要求筛选器返回的结果集要小得多时,使用上下文筛选器是最好的选择,因为其运行准则是筛选至原始数据的十分之一或更少。

理想情况下,上下文筛选器不应该被频繁更改,所以我们隐藏页面右侧的交互筛选器。

应用于工作表

当胶囊被放置在筛选器选项卡上时,默认情况下该筛选器仅应用于当前工作表。

如果想要更广泛地应用筛选器,可以单击胶囊的下拉菜单,选择“应用于工作表”,并将筛选器应用于 “使用相关数据源的所有项” 、 “使用此数据源的所有项” 或 “选定工作表” 来更改应用范围。

这在仪表板上尤其有用。在仪表板上,可以将与多个视图相关的筛选器设置为同时应用于所有视图或其中的部分视图。

默认情况下,交互筛选器只应用于已设置应用的视图。但是如果我们打开菜单,选择“应用到工作表”>“使用此数据源的所有项”。那么,相关视图都可进行筛选。

不仅仅是仪表板上的视图。现在,我们构建一个新的工作表。先后双击 “Sales(销售额)” 和 “Category(类别)” 字段。

在视图中,我们发现仅有一个类别显示。但幸运的是,在筛选器选项卡上可以看到一个视觉指示,这说明应用了筛选器。

这个图标旨在让你知道数据连接上应用了一个筛选器,所以如果这不是我们想要的效果,可以回溯并找到它。

另一个解决方案是 “应用到工作表-选定的工作表” ,这一选项只针对我们想要筛选的工作表。

需要注意的是,将 “应用到所有工作表” 筛选器从筛选器选项卡移除时会将其从所有视图中移除,并不只是当前看到的视图,所以进行移除操作时务必小心。

筛选器设置方式

为了能够精确地控制筛选的内容和方式,理解筛选设置方式非常重要。

假设我们想对销售额超过 10000 美元的客户进行营销推广。一个简单的方法是通过销售额建立一个客户视图,就像下图的一样。

然后对销售额的 SUM(总和)值进行筛选,值范围至少是10000 美元。

视图看起来是正确的,但是销售额 >$10,000的筛选器取决于视图的结构。

如果修改视图,就有可能改变筛选器的应用方式。从窗口底部看到,此视图有 12 行标记,这表示有 12 个客户符合我们的营销条件。

但如果将类别添加到颜色标记,就会突然减少到 6 行。这是为什么呢?被筛选掉的 6 名客户在同一类别中的销售额并没有超过 10000 美元,即使他们可能符合全部条件。

Tableau 通过筛选器运行每个标记,在这个视图中,每个客户每个类别都有一个标记。

试试另一种做法,将 “客户ID” 字段拖到筛选器选项卡,并使用 “条件” 来筛选出销售额>$10,000的客户。

与第一个方法一样,视图筛选出了 12 行标记。但如果再次把类别添加至颜色标记中,标记数量仍然保持在 12 行,并没有像上个方法那样被筛选掉。

由此可见,无论类别如何划分销售额,Tableau 都会通过筛选器计算客户的销售总额,然后将所有销售额>$10,000的客户纳入视图中。

以上操作,让我们认识到:不同的筛选器设置方式对可视化的影响,并该如何根据我们的需求把控筛选器的设置。

筛选应用优先级

筛选器在筛选器选项卡中的顺序对发送到数据源的查询并无影响,因为筛选器是被分组到 WHERE 查询子句中的。然而,筛选器是按固定优先级执行的,如下图所示。

排名首位的是数据提取筛选器(仅在使用数据提取时可用)会限制带入什么数据进行数据提取。而应用数据源筛选器(实时连接上可用的最高级别筛选器),将限制整个数据源在 Tableau 中可用的范围。

当数据进入 Tableau 后,将首先应用上下文筛选器,所有后续筛选器再基于其输出的临时表(新版本中为数据源查询)开始运行。

接下来是计算包含固定 LOD 表达式的筛选器。

下一级是对维度进行筛选(比如 ship 模式)。

随后是包括或排除 LOD 的筛选器。

然后是筛选措施(如运输成本)。

最后是表计算筛选器(因为这些仅对视图中的数据执行)。

性能和筛选查询

低效的筛选器是导致工作簿和仪表板性能低下的最常见原因之一。

在某些方面,应考虑筛选及其对性能的影响:由于需要在后台创建临时表,上下文筛选器的创建或更改速度很慢。但一旦创建成功,就可以提高性能,因为进一步的查询是在数据子集上运行,而不是整个数据集。

级联交互筛选器可以帮助缩小选项列表的范围,比如这里,我们只看到所选国家的州数据。

然而,当筛选器要求 Tableau 查找所有可能的字段值时,就需要一个复杂的查询,这需要耗费时间进行计算。

在这里,使用通配符匹配可能会加快性能。数据源中索引的存在和维护可以显著提高筛选性能。有关更多筛选性能优化,可点击 仪表板性能优化最佳实践之:筛选选择 学习。

本节 Tableau 微课堂到此结束,感谢你的耐心阅读。

下节课,我将带你学习了解 工具提示 。