【5.2.1.1】多重比较法--LSD、Sidak、Bonferroni、Dunnett
LSD法
LSD法全称least significance difference,即最小显著差异法。由Fisher最先提出,本质上是一种t检验。通常用于1对或者几对专业上有特殊意义的样本均数间的比较。
为了更好的理解LSD法的计算原理,我们首先回顾两独立样本t检验:
$$ t=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})}}$$
其中 $ S^2_c $
是两个样本的联合估计的方差(满足样本方差齐的前提下),本质就是组内误差的均方,该统计量服从自由度为N-2的t分布。
$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2}{n_1+n_2-2} $$
与上述类似,LSD法也进行的是两两比较的t检验。所不同的是,在满足方差齐性的前提下,LSD法采用所有样本的联合方差来估计均数差的标准误,而不是要比较的两个样本的联合方差。以三样本之间均数差异比较为例,其公式为
$$ S^2_c=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2+(n_3-1)S^2_3}{n_1+n_2+n_3-3} $$
LSD法往往计算最小显著差异,即
$$ LSD=t_{α/2}\sqrt{S_c^2(\frac{1}{n_1}+\frac{1}{n_2})} $$
当两组均数差大于LSD时,说明差异达到显著的水平,也就可以拒绝零假设,认为两组均数不相等。需要注意的是,LSD法单次比较的检验水准仍然为α。LSD法检验的灵敏度最高,但是会因为对比的频数增加使得第一类型错误概率增加。为解决该问题,便出现了Sidak法和Bonferroni法。
Sidak法
Sidak法的也是一种t检验,计算公式和LSD法的相同。但是Sidak法对α进行了调整。其调整方法如下:如果有k组,对k组进行两两比较的次数为
$$ c=\frac{k(k-1)}{2} $$
那么做完c次比较,累积犯一类错误的概率为:
$$ 1-(1-α_{a})^c $$
令上面的公式值等于0.05,由此可以反推出调整后的 $ α_{a} $
。例如进行6次事后比较,则Sidak法的=0.0085,以 $ α_{a} $
作为单次比较的显著性水平,显然$ α_{a} $
变小了。由于 $ α_{a} $
减小,结论趋于接受无效假设,因此该方法要比LSD法保守的多。
Bonferroni 校正
Bonferroni法与Sidak法类似,同样是在LSD法的基础上对α进行了调整。其调整方法基于Bonferroni不等式。若有k组,其计算公式为
$$ α_a=\frac{α}{k} $$
一般认为Bonferroni法是最为保守的,仍然以上面例子来说明。若进行6次比较,则Bonferroni法的调整=0.0083,比上面的sidak法还要小。事实上,当比较的次数不多时,该方法效果比较好,当比较次数较多时(如k>10),该方法对 α的调整有些矫枉过正,效果不如Sidak法。
Bonferroni 校正法可以称作是“最简单粗暴有效”的校正方法,它拒绝了所有的假阳性结果发生的可能性,通过对p值的阈值进行校正来实现消除假阳性结果。
Bonferroni 校正的公式为p*(1/n),其中p为原始阈值,n为总检验次数。
如果像我们举的例子一样,原始的P值为0.05,检验次数为10000次,那么在Bonferroni 校正中,校正的阈值就等于5%/ 10000 = 0.000005,所有P值超过0.00005的结果都被认为是不可靠的。这样的话假阳性结果在10000次检验中出现的次数为 10000 * 0.000005 =0.5,还不到1次。
但是这也存在问题:Bonferroni 委实太过严格,被校正后的阈值拒绝的不只有假阳性结果,很多阳性结果也会被它拒绝。
Dunnett法
Dunnett法检验统计量为 td ,故又称为Dunnett-t检验,实际上该方法的计算与LSD法相同,但是LSD法临界值表基于t分布,而该方法有特殊的临界值表 ,通常用于多个实验组和一个对照组均数的比较。
$$ $$
参考资料
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn