【5.2.2】多重比较法--Tukey法

多重比较法是多个等方差正态总体均值的比较方法。经过方差分析法可以说明各总体均值间的差异是否显著,即只能说明均值不全相等,但不能具体说明哪几个均值之间有显著差异。t检验只能说明两个均值的差异是否显著。比较m个均值,需要单独进行(m/2)=m(m-1)/2次t检验,不但工作量大,而且误差也大。多重比较法可以克服这些缺点

通过方差分析,若检验得各水平均数之间无显著性差异,则不需作进一步处理,但是当各水平均数之间有显著性差异时,则需进一步分析哪些水平间的差异是显著的,哪些是不显著的,这种比较称为多重比较法

因为方差分析的主要目的是通过F检验讨论某因素对指标的影响与否,借以对两组以上的平均数进行差异的显著性检验,得到一个整体性的检验结果。如果经F检验的结果差异不显著,说明试验因素对试验指标无显著影响,至此检验结束。如果检验结果差异显著,则只是说明试验因素的所有水平作为一个整体对试验指标的影响显著,而不能说明各水平两两之间的差异显著。因为各水平组中只要有一对平均数的差异显著就会导致方差分析结果的差异显著。若想找出哪一对或哪几对均数的差异显著,则需进一步对各水平组的平均数进行比较。当然这不能用t检验进行比较,而需要用多重比较法进行检验。

二、算法示例

Tukey检验的一个重要的优点是非常简单,而且所需实验样本相对较少。其检验结果的可信度达到95%的置信水平时,最少的情况下只需6个样本进行验证(改善前3个样本、改善后3个样本)。运用Tukey检验无需掌握复杂的统计学知识,因此,生产一线的操作工也容易掌握。

Tukey检验首先计算终结计数(EC: End Count),再查对终结计数的临界值,若所计算的终结计数值大于某一置信水平下的终结计数临界值,则认为在该置信水平下改善前和改善后的质量存在差异,否则不能确定在该置信水平下存在差异。

举例:

假设在制程采取改进措施前统计了某生产线上连续10个班的产品合格率分别为:89.7%,81.4%,84.5%,84.8%,87.3%,79.7%,85.1%,81.7%,83.7%,84.5%。制程采取改进措施后连续统计的10个班的产品合格率分别为:84.7%,86.1%,83.2%,91.9%,86.3%,79.3%,82.6%,89.1%,83.7%,88.%。初看起来,采取改进措施后平均产品合格率为85.54%,比采取改进措施前提高了1.3%(采取改进措施前平均产品合格率为84.24%)。那么到底采取改进措施之后是否有比较显著的改善效果呢?我们运用Tukey检验方法来做验证:

第一步:我们把制程采取改进措施前的合格率用A标记,采取改进措施后的合格率用B标记

第二步:将这20个数据按从小到大的顺序排序,得到如下结果:

第三步:计算终结计数。按Tukey理论,采取改进措施前后产品合格率若发生显著变化,则A,B两系列的数据就不会完全重叠,未重叠的数据个数即为终结计数。分别从顶端和底端计数未重叠的数据个数,称之为顶端终结计数和底端终结计数,两端终结计数之和即为总终结计数。若某一系列的数据区间被另一比对系列的数据区间全部包含,则总终结计数计为零(如本例所示);若两系列的数据区间不存在一个系列完全包含另一个系列的状况,则计数方法为:从已合并排序的整个数据列的顶端第一个数据开始数起,一直数到序列标记变更为止,连续的同系列数据的个数为顶端终结计数;若在数据系列变更时,对应的两个数据相等,则变更时的那个数据按1/2计数。同理,从底端第一个数据开始数起,一直到序列标记变更为止,可得底端终结计数值。示例如下:

第四步:将所得的终结计数值与Tukey检验的某置信水平下终结计数的临界值比较,如果所得的终结计数值大于该临界值,则表明采取改进措施后,在该置信水平下可以认为产品合格率发生了变化。(下图中的显著水平针对的双边计数(Two-Sided),若单边计数(One-Sided)则对应的显著水平为图示的一半,即双边计数时显著水平5%对应的终结计数临界值与单边计数时显著水平为2.5%对应的终结计数临界值是一样的)

第五步:结论。终结计数EC=0,而根据上表可以看出,在95%的置信水平(也就是5%的显著水平)下,终结计数的临界值为7。所以在95%的置信水平下,不能认为采取措施后,产品合格率发生了显著变化。如果终结计数EC=8,则表明在95%的置信水平下,可以认为采取措施后,产品合格率发生了显著变化(改进有效果)。

现在我们用Minitab中的2样本t检验方法来做检验。示例中的第一种情形终结计数EC=0时,对应的t检验结果如下:

该检验的零假设是“采取改进措施前后产品合格率没有显著变化”。t检验的p值为39%,表明如果拒绝零假设,犯第一类错误的概率高达39%,因此不能拒绝零假设。也就是说,不能认为采取改进措施后,产品合格率发生了显著变化。从95%的置信区间包括0值来看,我们可以认为“产品合格率未发生显著变化”的结论其置信水平可达95%。

示例中的第二种情形下,t检验的结果如下:

此时,t检验的p值为1.7%,表明如果拒绝零假设,犯第一类错误的概率只有1.7%,因此能够拒绝零假设。也就是说,可以认为采取改进措施后,产品合格率发生了显著变化。从95%的置信区间不包括0值来看,我们可以认为“产品合格率发生显著变化”的结论其置信水平可达95%。

由此可见,t检验的结果与Tukey检验的结果是等效的,但Tukey检验不需要借助专门的统计软件就可以由一线操作工来完成。正因为如此,我对Tukey检验倍加推崇

三、多个样本比较

在介绍Tukey方法前,首先了解学生化极差分布。

在概率论和统计学中,学生化极差分布是极差的抽样分布。该分布是一种连续型概率分布,用于在样本量较小且总体标准差未知的情况下估计正态分布总体的极差。

假设要比较的组数为k,那么在零假设成立的条件下,下面的随机变量服从学生化极差分布。

$$ q=\frac{\bar{X}_{max}-\bar{X}_{min}}{\sqrt{\frac{S^2_c}{n}}} $$

公式中分子分别是最大和最小样本的均值, $ {S^2_c} $ ​是所有样本的联合方差 ,n为每个样本的样本含量。该统计量有两个自由度,分别为k和n-k。

Turkey的HSD (Honestly significant difference)是基于学生化极差的成对比较。其思想和LSD方法类似,通过计算HSD统计量,如果两组均数的差异大于该极差,认为差异是显著的,因此拒绝零假设,认为两组均数不同。计算临界HSD的公式为

$$ HSD=q_α(k,ν)\sqrt{\frac{S^2_c}{n}} $$

k为组数,ν为联合方差的自由度,即N-k,n为每个样本的样本含量。从HSD公式上看,Tukey法较LSD法保守,即较LSD不易发现显著差异。Tukey法要求比较的样本容量相差不大,一般用于样本容量相同的组之间均数的比较。

$ $

$$ $$

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn