内容:

性能调整

  • 版本 :2022.1 及更高版本

本节介绍如何使用您收集的性能数据来确定提高 Tableau Server 性能的方式。因为两个服务器环境不可能完全相同,所以我们无法提供用于调整服务器性能的硬性快速规则。但是,您可以依据所收集的数据中的模式得出有关性能的结论。

本节介绍如何使用您收集的性能数据来确定提高 Tableau Server 性能的方式。因为两个服务器环境不可能完全相同,所以我们无法提供用于调整服务器性能的硬性快速规则。但是,您可以依据所收集的数据中的模式得出有关性能的结论。

例如,是否存在定期峰值?您在管理视图中注意到的任何模式是否与 监视工具中的类似模式相对应?通过观察像这样的模式,将能引导您完成测试和增量调整。

Tableau Server 的大多数性能调整都可归结为这些常规方法:

呈现视图和刷新数据提取在服务器上产生的负荷最大,所以应该针对您的组织最感兴趣的任务进行优化。

最佳做法是针对性能优化工作簿。有关如何优化工作簿的详细信息和资源,请参见优化工作簿性能

此部分中的其他文章

如果您有很多活动 Tableau Server 用户,而需要数据提取刷新的已发布数据源很少,则可以针对流量进行优化。

何时针对用户流量进行优化

视图加载缓慢

使用示例性能工作簿的“Requests and Sessions”(请求和会话)仪表板来分析视图加载所花费的时间。

如果多个视图的加载时间都超过 10 秒,并且加载缓慢是由大量会话造成的,则可能表明用户流量拖慢了服务器。

但是,如果特定视图无论何时查看都要花费很长时间才能加载,则表明视图的工作簿需要优化。可以使用加载时间统计数据管理视图来确定哪些工作簿需要优化。优化工作簿的一些简单方式包括:在每个视图中显示较少的信息或拆分视图、减少筛选器数量,以及使用数据提取。

用户流量造成的高资源使用率

如果服务器在高峰流量时段显示高 CPU 和内存使用率,则您应针对用户流量进行优化。若要确定高峰流量时段并分析服务器上有多个并发用户,请使用“Users and Actions”(用户和操作)仪表板。此外,您可以使用到视图的流量管理视图来查看有多少用户流量牵涉到访问视图(而不是执行管理功能、发布或其他任务)。

如果单击“Number of Users”(用户数)视图中的某个点,仪表板将显示当前处于活动状态的用户,以及哪些用户执行的用户操作的数量。默认情况下,显示的唯一用户操作是用户视图,但您可以使用“Action Types”(操作类型)筛选器来显示其他用户操作。

记下一天中存在多个并发用户和视图的时段,以便您能够将此数据与资源使用量进行比较。经验法则是:用户数应与高用户操作数对应。但是,在负载生成测试过程中,此示例中的视图会为单一用户显示虚假的高操作数。例如,您可以将 6 月 28 日 12 AM 的高视图数与后面阐述的仪表板中的资源使用量进行比较。

使用“CPU Usage”(CPU 使用率)仪表板来显示总 CPU 使用率百分比,以及每个进程的 CPU 使用率百分比。在下面的示例中,请注意总 CPU 使用率和 VizQL Server 进程在 6 月 28 日 12 AM 时的大型峰值。由于 VizQL Server 进程加载和呈现视图,因此 VizQL Server 进程通常是在高用户流量下显示高负荷的第一个进程。

注意:单独进程 CPU 使用率百分比的和加起起来可能会超过 100%。这是因为单独进程的处理器利用率是针对给定处理器内核度量的。与之相比,总 CPU 使用率则针对所有处理器内核进行度量。

使用“Memory Usage”(内存使用率)仪表板来显示总内存使用率百分比,以及平均内存使用量(以 GB 为单位)。一般情况下,内存使用率会随着用户流量稳定增长。同样,VizQL Server 进程是在高流量下显示高负荷的第一个进程。

针对用户流量进行优化的方式

如果像前面所示的示例中一样,高资源使用率带来了很高的用户流量,则应针对用户流量进行优化。

调整 VizQL Server 进程数

针对用户流量进行优化的最有效方式是调整 VizQL Server 进程数。一次添加一个 VizQL Server 进程,并使用更多的性能监控功能来衡量效果。由于 VizQL Server 进程可能会耗用大量的 CPU 和内存,因此添加太多进程可能会拖慢服务器。如果一直看到很高的内存使用率,请尝试减少 VizQL Server 进程数来减少保留的内存量。

有关配置进程的详细信息,请参见配置节点

调整其他进程的数量

尽管针对用户流量提高性能的最有效方式是调整 VizQL Server 进程数,但您也可以调整为 VizQL Server 进程提供支持或使 VizQL Server 进程无法访问资源的其他进程。例如,VizQL Server 进程会向缓存服务器进程发出频繁请求,因此您可能也需要增加缓存服务器进程数。另一方面,后台程序进程可能会与 VizQL Server 进程争用 CPU 资源。因此,如果您不需要频繁运行数据提取刷新,则可以减少后台程序的进程数。如果您确实需要后台程序的额外实例,并且在群集上运行 Tableau Server,则可以将这些后台程序进程转移到专用节点。

调整 VizQL 会话超时限制

在前面显示的示例中,VizQL Server 进程使用的内存量会随用户流量增加,并且在流量完成后一段时间内,Tableau Server 会一直保留该进程。这是因为 VizQL Server 进程会为每个会话保留内存一段指定的时间。如果 VizQL Server 进程占用了很高比例的可用内存,请尝试缩短每个会话的超时,提高内存再次可用的速度。

为此,请使用 tsm configuration set 命令缩短 vizqlserver.session.expiry.timeout 设置。默认值为 30 分钟。

降低刷新缓存的频率

如果您的用户并不总是需要最新数据,则可以将 Tableau Server 配置为尽量缓存和重复使用数据,从而针对用户流量进行优化。

为此,请使用 tsm data-access caching list 命令确认刷新频率。默认值为 Low。使用 tsm data-access caching set 命令更改刷新频率。

评估视图响应性

用户打开视图时,视图组件会先经过检索和解释,然后再显示到用户的 Web 浏览器中。对大多数视图来说,显示呈现阶段在用户的 Web 浏览器中进行,且大多数情况下会生成最快的结果和最高级的交互响应性。在客户端 Web 浏览器中处理大多数交互可减轻带宽压力,并降低往返请求延迟。如果视图非常复杂,Tableau Server 将在服务器(而非客户端 Web 浏览器)中处理呈现阶段,因为这样做通常可获得最佳性能。如果您发现视图的响应情况不尽如人意,可以测试和更改导致视图由服务器呈现(而非在客户端 Web 浏览器中呈现的阈值)。有关详细信息,请参见配置客户端呈现

此部分中的其他文章

在 Tableau Server 中导航到视图时,显示视图所需进行的处理(称为呈现)可由客户端设备或 Tableau Server 执行。具体选择取决于视图的复杂程度,而视图的复杂程度由标记数、行数、列数等因素确定。如果视图不太复杂,则客户端设备呈现视图会更快。如果视图的复杂程度较高,则向 Tableau Server 发送请求的速度更快,并可利用服务器的更出色计算能力。

注意:如果视图使用了多边形标记类型或页面历史记录功能,那么即使已启用了客户端呈现,系统也会始终执行服务器端呈现。

支持的浏览器

Internet Explorer 9.0 版或更高版本、Firefox、Chrome 和 Safari 都支持客户端呈现。所有这些 Web 浏览器都包含客户端呈现所需的 HTML 5 元素。

Tableau Mobile 应用软件也支持客户端呈现。

为计算机和移动设备配置复杂程度阈值

由于计算机的处理能力要强于移动设备,因此,相对于移动设备而言,Tableau Server 会在计算机上执行更多客户端呈现。

作为服务器管理员,您可以通过调整各自的复杂程度阈值来配置何时在计算机和移动设备上进行客户端呈现。举例来说,如果您注意到视图在移动设备上显示缓慢,则可以降低移动设备的阈值。或者,您可能增加阈值来减少发送到 Tableau Server 的请求数。

默认情况下,计算机 Web 浏览器的复杂程度阈值为 100。若要调整计算机的复杂程度阈值,请使用以下命令:

tsm configuration set -k vizqlserver.browser.render_threshold -v [new value]

默认情况下,移动设备的复杂程度阈值为 60。若要调整移动设备的复杂程度阈值,请使用以下命令:

tsm configuration set -k vizqlserver.browser.render_threshold_mobile -v [new value]

例如,若要将移动阈值更改为 40,您可以输入以下命令:

tsm configuration set -k vizqlserver.browser.render_threshold_mobile -v 40

有关如何使用 tsm option set 的详细信息,请参阅tsm configuration set 选项

禁用客户端呈现

客户端呈现默认处于启用状态,并且,我们建议使用客户端呈现来改善视图的性能。但是,如果要进行测试,或者服务器主要由处理能力极其有限的计算机或移动设备访问,您可能需要暂时禁用客户端呈现。

使用以下命令来禁用客户端呈现:

tsm configuration set -k vizqlserver.browser.render -v false

有关如何使用 tsm option set 的详细信息,请参阅tsm configuration set 选项

使用 URL 参数进行测试

若要在会话基础上测试服务器端呈现,请在视图的 URL 末尾键入 ?:render=false。例如:

http://localhost/views/Supplies/MyView?:render=false

如果 Tableau Server 上的客户端呈现已停用,请输入 ?:render=true 来为会话启用客户端呈现:

http://localhost/views/Supplies/MyView?:render=true

您也可以在单个视图上测试特定的复杂度阈值,以查看能否针对您的服务器和网络状况调整服务器范围的阈值。例如,您可能会发现在到达低复杂度(例如 80)或高复杂度(例如 120)的临界点时,用户交互得到的响应会更强。要测试阈值,您可以保留服务器的默认配置(在已启用客户端呈现的情况下)并在视图网址末尾输入测试阈值数字。例如:

http://localhost/views/Supplies/MyView?:render=80


如果数据提取计划对应于高资源使用量,或者数据提取花费很长时间才完成,请尝试针对数据提取进行优化。

何时针对数据提取进行优化

数据提取计划产生高 CPU 使用率

使用示例性能工作簿的“Background Jobs”(后台作业)仪表板来查看 Tableau Server 运行的后台作业数,包括数据提取刷新作业。该仪表板还显示长时间后台作业的延迟时间,即对后台作业进行计划和实际运行后台作业所间隔的时间量。如果在一天中的特定时间看到长时间延迟,或者有很多作业同时运行,请尝试将作业计划分布在一天中的不同时间来减少服务器上的负载。

同时,将出现很多后台作业或长期延迟的时间与服务器的 CPU 使用率进行比较。使用“CPU Usage”(CPU 使用率)仪表板来显示总 CPU 使用率百分比,以及每个进程的 CPU 使用率百分比。由于后台程序进程运行后台作业,因此,如果有很多数据提取刷新作业或者数据提取刷新作业运行缓慢,则第一个进程会显示负荷很大。请注意,后台程序进程的 CPU 使用率会定期但短暂地达到 100%。这表明刷新作业重复地集中出现。

注意:单独进程的 CPU 使用率百分比加起来的和可能会超过 100%,因为单独进程的处理器利用率是针对给定处理内核度量的。与之相比,总 CPU 使用率则针对所有处理器内核进行度量。

数据提取失败或运行缓慢

使用数据提取后台任务管理视图来确定失败的数据提取的数量以及完成数据提取所花费的时间。频繁失败可能表明特定数据源存在问题。

针对数据提取进行优化的方式

如果像前面所示的示例中一样,数据提取刷新计划带来了很高的 CPU 使用率,则应针对数据提取进行优化。

调整数据提取刷新计划

使用示例性能工作簿的“Background Jobs”(后台作业)仪表板来确定运行数据提取的最佳时间。除了在非高峰时段运行数据提取外,您还可以分开运行数据提取刷新,以尽量减少并发服务器负载。如果数据提取刷新继续产生问题,请通过以下方式尽量减小数据提取刷新的频率:

  • 将数据提取计划在服务器不忙的时候运行。

  • 减小刷新的频率。

加快特定数据提取的速度

使用数据提取后台任务管理视图来确定失败的数据提取和长时间运行的数据提取。

  • 减少数据提取的大小。您可以使数据提取的数据集保持较短,利用筛选或聚合,以及隐藏未使用的字段来缩小范围,所有这些方法有助于提高服务器性能。若要进行这些更改,请使用 Tableau Desktop 选项“隐藏所有未使用的字段”“聚合可视维度的数据”。有关详细信息,请参见 Tableau 帮助中的创建数据提取

    有关构建性能良好的工作簿的一般提示,请在 Tableau 帮助中搜索“性能”。若要查看工作簿发布到 Tableau Server 后的执行情况,您可以创建性能记录。有关详细信息,请参见创建性能记录

  • 使用增量刷新作业。增量刷新作业会将新行附加到现有数据提取,而不是从头开始创建数据提取。这种类型的数据提取刷新运行很快,因为它只处理自上次数据提取刷新作业运行以来添加的数据。但是,它不会考虑更新(而不是附加到数据源)的数据。因此,如果运行增量刷新作业,您仍然应该偶尔运行完全刷新作业。例如,您可以为数据源一周运行一次或两次完全刷新作业,而不是每天运行。

为数据提取刷新配置执行模式

创建数据提取刷新计划时,请确保计划以并行执行模式运行。并行运行计划时,计划将在所有可用后台程序进程上运行,即使计划只包含一个刷新任务。以串行方式运行计划时,计划仅在一个后台程序进程上运行。默认情况下,执行模式设置为并行,以便刷新任务能尽快完成。

但是,在某些情况下,将执行模式设置为串行也可能有意义。举例来说,如果一个非常大的作业由于会占用所有可用后台程序进程而使其他计划无法运行,则您可以将执行模式设置为串行。

增加后台程序进程数

对于某些任务,单个后台进程可能会占用 100% 的单个 CPU 内核。因此,您应运行的实例总数取决于计算机的可用内核数。如果在群集中安装了 Tableau Server,并且在单独的节点上运行后台程序进程,一条好的经验法则是:将后台程序进程数设置为介于运行后台程序进程的计算机的一半内核数和全部内核数之间。

有关配置进程的详细信息,请参见配置节点

隔离进程

如果在群集中安装 Tableau Server,则您可以通过将后台程序进程转移到单独的节点来避免资源争用,从而获得最大的好处。这是因为后台程序进程会占用非常大量的 CPU,如果在其他大量占用 CPU 的进程所在的同一节点上运行该进程,将可能会拖慢服务器。例如,VizQL Server 进程和数据引擎进程都可能会大量占用 CPU。有关更多详细信息,请阅读推荐的基准配置中的双节点配置。


本主题提供有关设置特定 Tableau Server 拓扑和配置的指导,以帮助优化和提高数据提取查询环境中的性能。

什么是数据提取查询密集型环境?加载工作簿、视图和仪表板时会查询数据提取和联合数据源,从而产生大量查询工作负载。因此,如果您有大量的数据提取和联合数据源,则可以说您拥有“数据提取查询密集型环境”。

如果您的环境是上面定义的数据提取查询密集型环境,那么接下来的部分可以帮助您确定此配置是否适合您。

何时使用此配置

此配置背后的关键原因:Hyper 是 Tableau 的内存优化数据引擎技术,适用于快速数据摄取和分析处理,使其成为优化查询密集型工作负载的关键。随着数据提取使用量的增长,我们建议在 Tableau Server 群集的专用节点上配置数据引擎。此配置允许 Tableau Server 在查询数据提取时横向扩展基础结构以优化性能。

在查看使用数据提取和联合数据源的内容时,有几个因素会影响 Tableau Server 的性能。此处的目标是在服务器上查看内容时实现一致且可靠的查询性能。如果您的环境符合以下情况之一,请使用此配置:

  • 您会发现工作簿加载时间存在很大差异,并且工作簿使用数据提取或联合数据源。

  • 您的 Tableau Server 部署的 Creator、Explorer、Viewer(查看者)和基于数据提取的内容的数量不断增加,因此您希望有效地横向扩展。

  • 如果计算机上存在文件存储,您会看到数据引擎和 VizQL Server 之间出现资源争用情况。

  • 您分析大量数据。此配置有助于优化大数据场景中的性能,包括数据摄取和分析。若要了解有关 Tableau 和大数据的详细信息,请参见使用 Tableau 进行 Hyper-charge 大数据分析

注意:使用服务器端性能记录来确定查询执行时间。若要确定 Tableau 的资源使用情况,请为 Windows 安装使用“性能监视器”,为 Linux 安装使用 sysstatvmstat 工具。

使用此配置的好处

为数据引擎配置专用节点有以下主要好处:

  • 专用数据引擎节点将减少数据提取查询与其他资源密集型工作负载(例如 VizQL Server 处理的工作负载)之间的资源争用。

  • 数据提取查询在专用节点上动态负载平衡,并考虑系统的当前状态,以确保没有一个节点被过度使用或未充分利用。

  • 加载依赖于数据提取的工作簿时,用户体验更加一致。这里的重点是建立一致且可靠的性能,而不是使单个查询更好。

  • 您可以更好地控制横向扩展需要更多资源的 Tableau Server 进程。如果 VizQL Server、数据引擎和后台程序都在同一个节点上运行,并且缓慢的数据提取查询是问题所在,那么通过添加包含所有三个进程的第二个节点将很难看到性能改进。使用此配置,您可以添加更多节点来专门改进数据提取查询工作负载。

  • 有助于提高可用性和正常运行时间。如果发生故障并且专用数据引擎节点之一不可用,VizQL Server 将尝试将问题节点上的挂起请求路由到其他专用数据引擎节点。

  • 数据引擎可以利用计算机上尽可能多的内核。因此,您可以灵活地向专用数据引擎节点中添加更多的资源以缩短查询响应时间和减少昂贵的数据提取查询的可变性,或者添加更多专用数据引擎节点以在服务器中获得更多的数据提取查询吞吐量。

何时不使用此配置

  • 如果您没有遇到基于数据提取的查询负载问题,硬件资源可能会更好地分配给 Tableau Server 的其他部分。

  • 在文件存储、数据引擎和 VizQL Server 共存的节点上,您看不到数据引擎和 VizQL Server 之间的资源争用。

  • 在实施此配置之前,强烈建议对 VizQL Server 和随文件存储一起安装数据引擎的节点的 CPU 使用情况进行评估。

配置

此配置的主要目标是在一个或多个专用节点上拥有数据引擎。

  • 在本地安装文件存储的部署中,这意味着在一个或多个专用节点上配置文件存储。数据引擎自动安装在与文件存储相同的节点上。

  • 在您配置外部文件存储的部署中,您仍然可以在 Tableau Server 上的专用节点上配置数据引擎。

通过隔离 VizQL Server 和文件存储进程,数据提取查询与视图查看或交互之间的负载可得到平衡和更好的管理。此配置的目标是在查询数据提取时保持一致的性能。

下面是配置的可视化表示形式,其中数据引擎/文件存储进程有两个专用节点,即节点 5 和 6。这是一个在本地配置文件存储的示例,这就是数据引擎和文件存储进程位于同一位置的原因。

相同的配置适用于具有外部文件存储的部署,但在这种情况下,节点 5 和 6 将仅配置数据引擎。

此外,由于节点 1 还具有存储库和文件存储进程,因此执行备份所需的所有数据都存在于节点 1 上,这可以提高备份性能。

硬件指南

为了充分利用此配置,您需要尝试各种硬件规模和配置,以了解最适合您的峰值负载性能目标的配置。Hyper 是一种高性能数据库技术,影响性能的关键资源是内存、内核和存储 I/O。了解 Hyper 如何使用资源来处理查询将有助于您进行硬件选择并在不同配置之间进行推理。

  • 内存:当为用户或后台进程处理基于数据提取的查询时,Tableau Server 会选择一个专用的数据引擎节点来处理查询。然后,该专用数据引擎节点会将数据提取从本地存储(通常是服务器硬盘)复制到内存中。拥有更多可用系统内存可以让操作系统更好地管理 Tableau 的内存使用情况。专用数据引擎节点使用系统内存来存储所执行查询的结果集。如果结果集仍然有效并且操作系统没有将其从内存中清除,则可以重用内存中的结果集。

    Tableau Server 的最低硬件推荐配置是 32 GB 内存,但如果您预计基于数据提取的工作簿加载量很大,则应考虑使用 64 GB 或 128 GB。如果您遇到除内存之外的其他资源限制(如内核),与其扩展到 128 GB 内存,不如扩展到额外的 64 GB 专用数据引擎节点。

    将数据提取从本地存储复制到内存的过程可能需要时间,并且可能需要优化磁盘性能。“存储 I/O”部分介绍了优化磁盘性能。

  • 内核数:在处理基于数据提取的查询时,内核数是重要的硬件资源,可能会影响性能和可扩展性。CPU 内核负责执行查询,拥有更多可用内核将可加快执行时间。一般来说,内核数增加一倍会使查询执行时间缩短一半。例如,如果当前使用 4 个物理内核或 8 个 vCPU 完成查询需要 10 秒,那么升级到 8 个物理内核或 16 个 vCPU,则执行查询只需要 5 秒。

    当前的 Tableau Server 最低硬件推荐配置是 8 核,但如果您的部署使用数据提取,请考虑使用 16 或 32 核计算机。需要注意的重要一点是,如果内存和 I/O 是您的瓶颈,那么增加可用内核数不会提高您的查询性能。

  • 存储 I/O:Hyper 旨在利用数据提取存储设备的可用性能来加速查询处理。我们建议选择具有高读/写速度的快速磁盘存储,如固态硬盘 (SSD)。目前,使用 NVMe 存储协议的 SSD 提供最快的可用速度。

注意:为专用数据引擎节点调整资源大小只会影响数据提取查询性能。加载工作簿时,还涉及许多其他过程,这些过程构成了 VizQL 加载请求的总时间。例如,VizQL Server 进程负责从数据引擎获取数据并呈现可视化项。

其他性能调优和优化:

除了上述基本配置之外,您还可以使用其他功能来优化性能。下面描述的优化适用于本地文件存储和外部文件存储部署。

  • 数据提取查询负载平衡:为了确定将数据提取查询路由到何处,数据引擎使用服务器运行状况指标 - 数据引擎消耗的资源量以及可能在同一节点上运行的其他 Tableau 进程的负载。除了评估系统资源之外,还会考虑节点上的内存中是否已存在数据提取,以确保将数据提取查询发送到具有最多可用资源的节点来处理查询。这将实现更有效的内存和磁盘利用率,并且数据提取不会跨节点在内存中重复。有关更多详细信息,请参见数据提取查询负载平衡帮助文章。

    Tableau Server 2020.2 及更高版本中默认启用数据提取查询负载平衡功能。

  • 使用节点角色优化工作负载:使用后台程序和文件存储节点角色,服务器管理员可以更灵活地控制哪些节点应该专用于运行数据提取查询和数据提取刷新。如上面的拓扑图中所述,某些数据引擎节点专用于处理数据提取查询,并且仅运行文件存储和数据引擎进程。节点角色随数据管理加载项一起提供。有关节点角色的详细信息,请参见通过节点角色管理工作负载

下图使用与上述基本配置相同的拓扑,但具有节点角色。

  • 数据提取刷新后台程序节点角色:通过将节点 3 设置为数据提取刷新后台程序节点角色,只有增量刷新、完全刷新和加密/解密作业才会在该节点上运行。通过将节点 4 设置为非数据提取刷新台程序节点角色,除数据提取刷新之外的所有后台作业都将在此节点上运行。使用联合数据提取和影子数据提取时,数据服务器和网关可帮助数据提取刷新作业。有关后台程序节点角色的详细信息,请参见文件存储节点角色

    此外,由于节点 1 还具有存储库和文件存储进程,因此执行备份所需的所有数据都存在于节点 1 上,这可以提高备份性能。

    后台程序节点角色可用于 Tableau Server 2019.3 版及更高版本中的服务器管理加载项。

  • 数据提取查询文件存储节点角色:作为专用数据引擎节点的节点 5 和 6 具有数据提取查询文件存储节点角色,以确保它们仅处理可视化项负载、订阅和数据驱动型通知的查询。

  • 数据提取查询交互节点角色:对于具有数据提取查询文件存储节点角色的专用数据引擎节点,服务器管理员可以进一步隔离交互式和计划工作负载以在特定的专用数据引擎节点上运行。这对于在大量订阅期间有大量用户交互和加载工作簿的时候很有用。例如,假设有 1000 个订阅安排在星期一早上 8 点。与此同时,许多用户也在一天开始时加载仪表板。订阅量和用户查询量的组合可能会导致用户体验到更慢、更多变的工作簿加载时间。使用数据提取查询交互式文件存储节点角色,您可以指定专用数据引擎节点仅接受交互式用户(正在等待查看屏幕的用户)的查询。这些优先用于交互式工作负载的专用数据引擎节点将免受大量竞争订阅作业的影响,并提供更一致的查询时间。此外,服务器管理员可以使用此节点角色来更好地规划增长,因为他们可以独立地为交互式和计划工作负载添加专用数据引擎节点。有关详细信息,请参见文件存储节点角色

    文件存储节点角色可用于 Tableau Server 2020.4 版及更高版本中的服务器管理加载项。

  • 使用外部文件存储优化:此功能允许您使用网络共享作为文件存储的存储,而不是使用 Tableau Server 节点上的本地磁盘。通过将存储集中在一个位置,您可以显着减少在文件存储节点之间复制数据所花费的网络流量。例如,在文件存储使用本地磁盘的情况下,当使用本地文件存储刷新 1 GB 数据提取时,1 GB 数据将通过网络复制到运行文件存储进程的所有节点。在 Tableau Server 配置有外部文件存储的情况下,1 GB 数据提取只需复制到网络共享一次,所有文件存储节点都可以访问该单个副本。存储的集中化还减少了文件存储节点上所需的本地存储总量。

    此外,Tableau Server 备份可利用快照技术显着减少完成备份的时间。

    虽然您不需要专用的数据引擎节点配置来获得外部文件存储的好处,但可以一起使用具有文件存储节点角色和数据提取查询交互式节点角色的附加工作负载管理功能。有关更多详细信息,请参见Tableau Server 外部文件存储主题。

    Tableau Server 2020.1 及更高版本中的服务器管理加载项提供外部文件存储。


Tableau Server 可以随需求的变化纵向和横向扩展。下面是一些准则,有助于您确定是否是时候向系统添加更多节点和/或重新配置服务器:

  • 超过 100 个同时存在的用户:如果部署是用户密集型(超过 100 个同时存在的 Viewer(查看者)),则务必运行足够的 VizQL 进程,但进程数量不能超过硬件的处理能力。另外,启用 Tableau Server 来宾用户帐户可以将同时存在的潜在 Viewer(查看者)数量增加到超过您可能认为自己拥有的用户列表范围。管理视图可帮助您对此进行衡量。有关详细信息,请参见特定用户的动作

  • 大量使用数据提取频繁刷新数据提取:数据提取可能会占用大量内存和 CPU 资源。没有一种度量方法可以将站点限定为数据提取密集型。仅有一些过大的数据提取时,可能会将站点归入此类别,这与有众多小数据提取一样。通常,对于频繁刷新数据提取(例如,一天刷新多次)的站点,更重视处理刷新任务的后台进程会很有帮助。使用数据提取后台任务管理视图来查看当前刷新率。对于大量使用数据提取的站点,在自己的计算机上将后台程序进程隔离开,会获益良多。有关详细信息,请参见 推荐的基准配置主题中的双节点配置。

  • 有大量查询的环境:如果使用数据提取的工作簿查询性能缓慢,则隔离通过 VizQL 进程处理数据提取查询的节点可以改善和稳定性能。有关详细信息,请参见针对数据提取查询密集型环境进行优化

  • 停机可能性:如果服务器系统被视为任务关键的服务器系统,且要求高级别的可用性,则可以配置服务器系统,使处理数据提取、存储库和网关的服务器进程有冗余。