社区
博客
Minitab 应用专题 | 方差分析(ANOVA)——化学工程师的秘密武器
Minitab 的方差分析(ANOVA)如何助力化学工程师提高效率,发挥统计的价值?

如果你的职业是一名化学工程师,那么你很有可能正在开发和设计化学制造工艺。

与其他类型的工程师不同,化学工程师可能需要应用到化学、生物学、物理学和数学原理,来解决化学品、燃料、药物、食品或其他产品的生产或使用问题。

正因为将大多数精力用在了科学方面,所以你可能没有时间专心投入统计分析之中。如何解决呢?不用担心,Minitab 随时可以为你服务!

今天,就让我们先来康康: Minitab 的方差分析(ANOVA)如何助力化学工程师提高效率,发挥统计的价值!


方差分析有何作用?

许多工业应用都需要进行实验,目的是了解组与组之间是否存在差异。

举个简单的例子,我们想要了解一个因子(比如:催化剂类型)以及该因子的各水平(比如:催化剂 1、2、3、4)在统计上是否存在显着差异。当各组的测量是连续且满足某些假设时,我们使用方差分析来比较各组的均值。

从某种意义上来说,“方差分析”这个用词并不恰当,因为我们想要比较的是各组的均值。但是,通过分析组内和组间的数据变化,有助于我们在统计意义上确定各组均值是否不同。

接下来,我们用方差分析来检验一个原假设:总体均值(用符号 µ 标出)均相等。如果这个原假设被否定,则结论是:总体均值并不完全相等。

原假设:Ho: µ催化剂 1 = µ催化剂 2 = µ催化剂 3 = µ催化剂 4

图示:产品产量箱线图

简单来说,我们需要先假设各组的均值相等,并收集证据来验证这个观点。这意味着,如果我们观察到这些均值之间存在较大差异,则更有可能否定此观点并假设组水平内存在差异。


01 单因子方差分析

假设,一位化学工程师想要比较使用 4 种不同催化剂的产品产量。她将催化剂加热并将其与产品一起进行反应。接下来,要如何通过方差分析,确定与不同催化剂反应的产品产量是否有明显差异呢?

首先,工程师收集了一些数据,如下图所示:

图示:催化剂数据

接下来,她运行了单因子方差分析。从图中可以看到:产品产量方差分析的 p 值很小,这表示:如果原假设为真(即催化剂均值相等),得出此结果的可能性非常小,因为 p 值小于 5% 显着性水平(示例使用 alpha = 0.05)。

图示:方差分析

如此看来,原假设被否定了。第一步检验的结论是:不同催化剂组的平均产品产量不同。


02 使用 TUKEY 方法进行多重比较

在得知某些组的均值不同后,工程师需要进行更深入地比较才能了解到底哪些组的均值不同。在此,Minitab 提供了“比较”功能来实现这个需求。

在下方示例中,化学工程师使用“Tukey 比较法”来正式检验组对之间的差异,以了解哪些组对在统计上有显著差异。Tukey 多重比较是多种检验法中最保守的方法,可用于确定一组均值中的哪个均值与其他均值不同。

在方差分析后使用 Tukey 比较法(也被称为事后检验法),可用于为因子水平均值之间的所有成对差异创建置信区间,同时将整体误差率控制在指定的水平。

图示:Tukey 同步 95% CI

从图中包含 Tukey 整体置信区间的图形可以看到:催化剂 2 和 4 的均值差异为 3.114 到 15.886。此范围不包括 0,这表明均值之间的差异显着。工程师可使用此差异的估计值来确定差异是否确实显着。相反,其余均值对的置信区间都包括 0,这表明差异不明显。

Q:为何不通过一组 T 检验来判别差异?

A:这是个很好的问题,并且很常见!问题的答案与犯错的风险有关,特别是错误地认为存在统计显着差异的风险,这就是我们所说的 Alpha (阿尔法)风险。

当我们进行一项检验时,有 5% 的几率我们会说存在差异,但实际上并没有。在本次示例中,有 4 种催化剂,这将导致 6 次 t 检验!

那么,偶然观察到至少一个显著性结果的概率是多少呢?

P(至少一个显着结果)

= 1 - P(无显着结果)

= 1 - (1 - 0.05) 6

≈ 0.264

因此,即使所有检验实际上都不显著,但在进行 6 次检验后,我们仍有 26 %的几率观察到至少一个显着性结果。

显然,事后检验更能控制实验的误差率。换句话说,我们希望能将“错误认为任何催化剂对存在显著性差异的几率”保持在 5%。这正是 Tukey 检验法能实现的!


方差分析的作用,你 Get 到了吗?

通过方差分析,化学工程师能够检验混料以查看结果是否具有显著统计意义;同时,还可以使用“比较检验”确定整组是否存在差异,或者差异是否只存在于组的某部分内。

在上述示例中,只有催化剂 2 和催化剂 4 在产品产量方面具有显著统计差异。根据这些信息,化学工程师可能会深入比对其他催化剂,来确定哪种催化剂最具成本效益、保质期最长,或最容易获得(因为知道它将产生类似数量的产品)。

想深入了解更多 Minitab 功能应用?欢迎试用 Minitab 统计软件,或者联系我们咨询!