Tableau 优课堂 | 第80 课:Tableau Prep 概要窗格

published: 2024-02-27

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 概要窗格。


概要窗格面板

当我们处于“清理”步骤时(在流程中用条形图标指示),流程下面的窗格是“概要”窗格。

概要窗格可以帮助我们探索数据并理解其内容,这是与数据交互的一种强大方式。

针对离散型数据,概要窗格中的一个灰色条表示字段本身的一个值。条的长度表示具有该值记录的数量,而通过可视化滚动条可以看到数据分布的概况。

例如,从“运输方式”字段中我们可以看到”常规空运”在数据中出现最多,鼠标放上去,工具提示中可以看到数据有3011行。


高亮显示

如果我们单击最多记录的“常规空运“一栏,它会以蓝色突出显示。在所有其他字段卡片上,与“常规空运“相关的值也会被高亮显示。

我们可以移动 “省份” 栏中的可视化滚动条,查看哪些省份采用“常规空运”的方式更多;同时,也可以看到哪些客户类型喜欢采用此运输方式。

此外,还可看到选用“常规空运”的客户订单单价范围集中在0~1000元,且所购买的产品大都采用了小型包装。显然,这种突出显示的交互方式可以便于我们检查数据结构,并查看各个字段分布和值之间的关系。


数据分布

连续型数据显示为条形图中的蓝色条,表示数据的范围。

以 “单价” 字段为例,可以看到最常见的价格是 0~1000 元,有 3979 行数据,而在 6000~7000 元范围内只有4行数据。

如果想看实际价格,可以打开字段卡片的下拉菜单,把查看状态从“摘要”更改为“详细信息”。

现在,在字段卡片右侧得到了一个可视化滚动条,它显示了更详细的分布情况。其中,我们可以看到两个峰值,显示价格相对便宜的产品,可能交易价范围略高;还有底部两个较长的条形,峰值出现在 60 元以上。

切换回到“摘要”视图,如果我们选择含有“ Small”字样的产品包装内容,可以清楚地看到那些小型包装的产品单价范围。

连续型数据的默认视图是间隔的摘要视图,这非常有利于检测异常值。如果在“详细信息”视图中,则很难看到其余记录与这些值之间的差距。


使用概要窗格识别错误

接下来,点击进入一个更复杂的流程。这一个案例,使用了示例超市 2014-2017年的全球订单数据。可以看到:“Order ID”字段出现了很多 null 值,这种状况出乎意料。

如果点击空值条形,则可看到它们来自哪一年的数据表。

回到输入步骤中。如果我们点击链接线上的灰色 “+” 号并选择“清理步骤”,就可以打开概要窗格,查看本年度的数据。但是,“Order ID” 字段中显示没有空值。

我们在另一个输入流程中用同样的方法插入一个清理步骤进行比较,也没发现有空值现象。那么这一定有什么别的原因。

经过探索发现,这个字段在 2017年数据表被称为“OrderID”,在其他年份数据表中被称为 “Order ID”,两者只相差了一个半角空格,但 Prep会识别成两个不同字段。

点击打开“并集“步骤的窗格看看,果然如此。现在,我们可以使用这些彩色条,识别出OrderID 和 Order ID 的列不匹配。

为此,我们将 OrderID 卡片拖到 Order ID 卡片上实现合并。现在,如果回到清理 2 步骤,就会看到 Order ID 字段内的空值消失了。这就是默认显示概要视图的好处,帮助我们检测异常值。



以上就是关于「Tableau Prep 概要窗格」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。


更多相关信息,请访问专题页: Tableau使用入门教程