【5.2.1.1】多重比较法--LSD、Sidak、Bonferroni、Dunnett

LSD法

LSD法全称least significance difference,即最小显著差异法。由Fisher最先提出,本质上是一种t检验。通常用于1对或者几对专业上有特殊意义的样本均数间的比较。

为了更好的理解LSD法的计算原理,我们首先回顾两独立样本t检验:

$$ t=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})}}$$

其中 $ S^2_c $ 是两个样本的联合估计的方差(满足样本方差齐的前提下),本质就是组内误差的均方,该统计量服从自由度为N-2的t分布。

$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2}{n_1+n_2-2} $$

与上述类似,LSD法也进行的是两两比较的t检验。所不同的是,在满足方差齐性的前提下,LSD法采用所有样本的联合方差来估计均数差的标准误,而不是要比较的两个样本的联合方差。以三样本之间均数差异比较为例,其公式为

$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2+(n_3-1)S^2_3}{n_1+n_2+n_3-3} $$

LSD法往往计算最小显著差异,即

$$ LSD=t_{α/2}\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})} $$

当两组均数差大于LSD时,说明差异达到显著的水平,也就可以拒绝零假设,认为两组均数不相等。需要注意的是,LSD法单次比较的检验水准仍然为α。LSD法检验的灵敏度最高,但是会因为对比的频数增加使得第一类型错误概率增加。为解决该问题,便出现了Sidak法和Bonferroni法。

Sidak法

Sidak法的也是一种t检验,计算公式和LSD法的相同。但是Sidak法对α进行了调整。其调整方法如下:如果有k组,对k组进行两两比较的次数为

$$ c=\frac{k(k-1)}{2} $$

那么做完c次比较,累积犯一类错误的概率为:

$$ 1-(1-α_{a})^c $$

令上面的公式值等于0.05,由此可以反推出调整后的 $ α_{a} $ ​ 。例如进行6次事后比较,则Sidak法的​=0.0085,以 $ α_{a} $作为单次比较的显著性水平,显然$ α_{a} $变小了。由于 $ α_{a} $ ​减小,结论趋于接受无效假设,因此该方法要比LSD法保守的多。

Bonferroni 校正

Bonferroni法与Sidak法类似,同样是在LSD法的基础上对α进行了调整。其调整方法基于Bonferroni不等式。若有k组,其计算公式为

$$ α_a=\frac{α}{k} $$

一般认为Bonferroni法是最为保守的,仍然以上面例子来说明。若进行6次比较,则Bonferroni法的调整​=0.0083,比上面的sidak法还要小。事实上,当比较的次数不多时,该方法效果比较好,当比较次数较多时(如k>10),该方法对​ α的调整有些矫枉过正,效果不如Sidak法。

Bonferroni 校正法可以称作是“最简单粗暴有效”的校正方法,它拒绝了所有的假阳性结果发生的可能性,通过对p值的阈值进行校正来实现消除假阳性结果。

Bonferroni 校正的公式为p*(1/n),其中p为原始阈值,n为总检验次数。

如果像我们举的例子一样,原始的P值为0.05,检验次数为10000次,那么在Bonferroni 校正中,校正的阈值就等于5%/ 10000 = 0.000005,所有P值超过0.00005的结果都被认为是不可靠的。这样的话假阳性结果在10000次检验中出现的次数为 10000 * 0.000005 =0.5,还不到1次。

但是这也存在问题:Bonferroni 委实太过严格,被校正后的阈值拒绝的不只有假阳性结果,很多阳性结果也会被它拒绝。

Dunnett法

Dunnett法检验统计量为 td ​,故又称为Dunnett-t检验,实际上该方法的计算与LSD法相同,但是LSD法临界值表基于t分布,而该方法有特殊的临界值表 ,通常用于多个实验组和一个对照组均数的比较。

$$ $$

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学