【5.2.1.1】多重比较法--LSD、Sidak、Bonferroni、Dunnett

October 04, 2021 Significance testing 阅读量：次

LSD法

LSD法全称least significance difference,即最小显著差异法。由Fisher最先提出，本质上是一种t检验。通常用于1对或者几对专业上有特殊意义的样本均数间的比较。

为了更好的理解LSD法的计算原理，我们首先回顾两独立样本t检验：

$$ t=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})}}$$

其中 $ S^2_c $ 是两个样本的联合估计的方差（满足样本方差齐的前提下），本质就是组内误差的均方，该统计量服从自由度为N-2的t分布。

$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2}{n_1+n_2-2} $$

与上述类似，LSD法也进行的是两两比较的t检验。所不同的是，在满足方差齐性的前提下，LSD法采用所有样本的联合方差来估计均数差的标准误，而不是要比较的两个样本的联合方差。以三样本之间均数差异比较为例，其公式为

$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2+(n_3-1)S^2_3}{n_1+n_2+n_3-3} $$

LSD法往往计算最小显著差异，即

$$ LSD=t_{α/2}\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})} $$

当两组均数差大于LSD时，说明差异达到显著的水平，也就可以拒绝零假设，认为两组均数不相等。需要注意的是，LSD法单次比较的检验水准仍然为α。LSD法检验的灵敏度最高，但是会因为对比的频数增加使得第一类型错误概率增加。为解决该问题，便出现了Sidak法和Bonferroni法。

Sidak法

Sidak法的也是一种t检验，计算公式和LSD法的相同。但是Sidak法对α进行了调整。其调整方法如下：如果有k组，对k组进行两两比较的次数为

$$ c=\frac{k(k-1)}{2} $$

那么做完c次比较，累积犯一类错误的概率为：

$$ 1-(1-α_{a})^c $$

令上面的公式值等于0.05，由此可以反推出调整后的 $ α_{a} $ 。例如进行6次事后比较，则Sidak法的=0.0085，以 $ α_{a} $ 作为单次比较的显著性水平，显然 $ α_{a} $ 变小了。由于 $ α_{a} $ 减小，结论趋于接受无效假设，因此该方法要比LSD法保守的多。

Bonferroni 校正

Bonferroni法与Sidak法类似，同样是在LSD法的基础上对α进行了调整。其调整方法基于Bonferroni不等式。若有k组，其计算公式为

$$ α_a=\frac{α}{k} $$

一般认为Bonferroni法是最为保守的，仍然以上面例子来说明。若进行6次比较，则Bonferroni法的调整=0.0083，比上面的sidak法还要小。事实上，当比较的次数不多时，该方法效果比较好，当比较次数较多时（如k>10)，该方法对 α的调整有些矫枉过正，效果不如Sidak法。

Bonferroni 校正法可以称作是“最简单粗暴有效”的校正方法，它拒绝了所有的假阳性结果发生的可能性，通过对p值的阈值进行校正来实现消除假阳性结果。

Bonferroni 校正的公式为p*(1/n)，其中p为原始阈值，n为总检验次数。

如果像我们举的例子一样，原始的P值为0.05，检验次数为10000次，那么在Bonferroni 校正中，校正的阈值就等于5%/ 10000 = 0.000005，所有P值超过0.00005的结果都被认为是不可靠的。这样的话假阳性结果在10000次检验中出现的次数为 10000 * 0.000005 =0.5，还不到1次。

但是这也存在问题：Bonferroni 委实太过严格，被校正后的阈值拒绝的不只有假阳性结果，很多阳性结果也会被它拒绝。

Dunnett法

Dunnett法检验统计量为 td ，故又称为Dunnett-t检验，实际上该方法的计算与LSD法相同，但是LSD法临界值表基于t分布，而该方法有特殊的临界值表，通常用于多个实验组和一个对照组均数的比较。

$$ $$

参考资料

这里是一个广告位，，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn