测试您的数据并使用数据提取

  • 版本 :2022.1 及更高版本

适用于: Tableau Desktop

您可能无法控制数据库运行所需的硬件、处理能力和磁盘空间。也无法控制在任何给定时间访问数据库的人数、运行的服务数或网络的可靠性。但是,在开始生成工作簿之前,您可以测试数据的原始性能,以了解您的工作环境。您可以执行一些操作来影响您所创建的工作簿的性能,首先确定选择连接到数据的方式:您使用的驱动程序以及您的连接类型是“实时”还是“数据提取”

测试尽可能接近数据

测试数据的原始性能的好方法是在数据所在的计算机上安装 Tableau Desktop 并运行某些查询。这将从性能结果中消除外部因素,如网络带宽和延迟,并帮助您了解数据源中查询的原始性能。

此外,您可以对数据使用“本地主机”名称,而不是使用 DNS 名称,以帮助确定诸如慢速名称解析或代理服务器之类的环境因素是否正在降低性能。

使用本机数据库驱动程序进行连接

如果使用本机数据库驱动程序连接到数据,则与使用 ODBC 驱动程序连接到同一数据相比,您往往会感觉性能明显更快。当您使用本机数据库驱动程序时,请确保使用的是最新版本。数据库供应商一直在努力改善他们的驱动程序。有关驱动程序的列表,请参见 Tableau 网站上的驱动程序和激活

使用数据提取而不是实时数据

取决于您的数据,在数据源页上,您可以在实时连接或数据提取连接之间进行选择。实时连接直接连接到数据。Tableau 数据提取是呈现 Tableau 可视化项所需的压缩数据快照,此快照存储在本地并且会加载到内存中。数据提取旨在以最佳方式使用计算机内存的所有部分。

使用数据提取有几个原因,但与性能相关的主要原因是查询执行速度慢。数据提取数据格式旨在为分析查询提供快速响应。在这种情况下,您可以将数据提取看作查询加速缓存。

有关 Tableau 数据提取的详细信息,请参见提取数据。另一项参考是关于数据提取的三部分博客文章,第一篇博客为了解 Tableau 数据提取

减少数据量

创建数据提取时,使用筛选器排除不需要的数据。另外,询问自己是否需要数据源中的所有记录,或者是否可以将数据提取局限于代表性样本。有关详细信息,请参见提取数据

隐藏未使用的字段

当您创建数据提取时,未包括隐藏的字段。创建数据提取之前,使用“隐藏所有未使用的字段”选项隐藏不需要的字段。这使得数据提取较小,从而提高性能。有关详细信息,请参见隐藏或取消隐藏字段

优化数据提取

“立即运算计算”选项在数据提取中实现计算,这意味着会提前运算某些计算,并且这些计算的值将存储在数据提取中。根据数据提取中使用的计算的复杂性,这可能会加快将来的查询。

若要实现计算,请在“数据”菜单中选择数据源,然后选择“数据提取”>“立即运算计算”。有关详细信息,请参见在数据提取中实现计算

对基于文件的数据使用数据提取

通常,最佳做法是向 Tableau 导入基于文件的数据,即诸如 CSV、Microsoft Excel 电子表格和 Microsoft Access 文件之类的文本文件,以及像 SPSS、SAS 和 R 这样的统计文件。这会查询执行速度要快得多,也会产生小得多的文件来存储数据值。

如果您的数据是一个大文本或 Excel 文件,则使用数据提取不仅可以提高性能,也会向您提供更多的功能。请注意,如果您将 Tableau 连接到大型文本文件,则在 Tableau 发现文件太大而无法良好执行时将提示您提取数据。

避免使用自定义 SQL

在大多数情况下,自定义 SQL 运行速度比 Tableau 所创建的查询的运行速度慢。Tableau 无法对自定义的 SQL 执行查询优化。但如果必须使用自定义的 SQL,请使用数据提取,以便只需要运行一次查询。有关详细信息,请参见连接到自定义 SQL 查询