【3.1】T检验和方差齐性检验

值得注意的是t检验是方差齐性检验,因此在使用t检验前需要检验方差齐性,方差不齐的话要进行非参数检验。

单样本资料与配对设计资料的 t 检验

一、概述

以 t 分布为基础的一类比较均数的假设检验方法,t分布的发现使得小样本统计推断成为可能。

T检验,亦称student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

T检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于Claude Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈特特于1908年在Biometrika上公布T检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,戈斯特的真实身份不只是其它统计学家不知道,连其老板也不知道。

1. T检验用途:

  1. 样本均数与总体均数的比较;
  2. 两个样本均数的比较。

研究者可能有两种目的:

  1. 推断两个总体均数有无差别。不管是病人高于正常人,还是低于正常人,两种可能性都存在,研究者同等关心,应当用双侧检验
  2. 根据专业知识,已知病人不会低于正常人,或是研究者只关心病人是否高于正常人,不关心病人是否低于正常人,应当用单侧检验

2.t 检验的应用条件:

  1. 随机样本;
  2. 来自正态分布总体(小样本时) ;
  3. 两独立样本比较时(两样本均数比较),要求两总体方差相等(方差齐性) (方差齐性的具体解释见下一篇博文)

3.双侧检验和单侧检验

在进行t检验时,如果其目的在于检验两个总体均数是否相等,即为双侧检验。例如检验某种新降压药与常用降压药效力是否相同?就是说,新药效力可能比旧药好,也可能比旧药差,或者力相同,都有可能。

如果我们已知新药效力不可能低于旧药效力,例如磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用磺胺药,这时,无效假设为H0,  备择假设为

H1:μ1>μ2 ,统计上称为单侧检验。

样本均数(其总体均数为μ)与已知的总体均数μ0作比较

目的           H0     H1
双侧检验 是否μ≠μ0 μ=μ0 μ≠μ0
单侧检验 是否μ>μ0 μ=μ0 μ>μ0
单侧检验 或是否μ<μ0 μ=μ0 μ<μ

两样本均数比较(其总体均数分别为μ1与μ2)

目的           H0       H1
双侧检验 是否μ1≠μ2  μ1=μ2 μ1≠μ2
单侧检验 是否μ1>μ2     μ1=μ2    μ1>μ2
或是否μ1<μ2     μ1=μ2    μ1<μ2

4. 检验水准

假设检验还需根据不同研究目的事先设置是否拒绝原假设的判断标准,即检验水准。检验水准也称显著性水准,它指无效假设H0为真,但被错误地拒绝的一个小概率值。一般取α=0.05。

•H0、H1和α的确定,以及单侧检验或双侧检验的选择,都应结合研究设计,在未获得样本结果之前决定,而不受样本结果的影响。

5.选定检验方法和计算检验统计量

  • 要根据研究设计的类型和统计推断的目的选用不同的检验方法。如成组设计的两样本均数的比较用t检验,多个样本均数的比较用F检验。
  • 检验统计量是用于抉择是否拒绝H0的统计量,其统计分布在统计推断中是至关重要的,不同的检验方法要用不同的方式计算现有样本的检验统计量值。

5.确定P值和做出推断结论

  • P值是指由H0成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。
  • 当P≤α时,结论为按所取检验水准拒绝H0,接受H1,这样做出结论的理由是:在H0成立的条件下,出现等于及大于现有检验统计量值的概率P≤α,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持H0因而拒绝它;如P>α,即样本信息支持H0,就没有理由拒绝它,此时只好接受它

假设检验的结论是具有概率性的。不管是否拒绝H0,都有可能发生错误。拒绝H0,不能认为H0肯定不成立,因为在H0成立的条件下,出现现有检验统计量值及更极端情况的概率虽小,但仍可能出现,只是可能性很小而已;同理,不拒绝H0,也不能认为H0肯定成立。因为检验假设时,必须对被检验的假设做出明确判断,只能从“拒绝”或“不拒绝”中选择一个较为合理的决定。

二、单样本资料的 t 检验

目的:比较样本均数所代表的未知总体均数μ已知总体均数μ****0

检验的假设:

H0: μ=μ0 H1: μ≠μ0 (双侧)

统计量: $$t = {\frac{\bar X - \mu_{0}}{{\frac{S}{\sqrt{n}} }}}$$

分子:样本均数与μ0的差距; 分母:样本均数的标准误; t : 用标准误来度量样本均数与μ0的差距, 没有量纲

理论依据:

H0 成立时,统计量

$$t={\frac{\bar X - \mu_{0}}{S/{\sqrt{n}}}} \sim t_{\left(v\right)} ,v=n-1 $$

理论:

H0 成立时,统计量 t 服从自由度为 ν =n­-1 的 t 分布 ­­,我们就是根据这一知识来计算相应的 P 值

统计推断:

事先规定一个“小”的概率 α (检验水准) ;若P值小于α,拒绝零假设;若P值不小于α ,则不拒绝零假设。

适用条件:

  1. 已知一个总体均数;
  2. 可得到一个样本均数及该样本标准误;
  3. 样本来自正态或近似正态总体。

例1:

大量检测已知正常人血浆载脂蛋白E(apo E)总体平均水平为4.15mmol/L。某医师经抽样测得41例陈旧性心机梗死患者的血浆载脂蛋白E平均浓度为5.22mmol/L,标准差为1.61mmol/L。据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致?

1.建立检验假设和确定检验水准

H0:μ=μ0
H1:μ≠μ0
α=0.05

2.选定检验方法和计算统计量用单样本的t检验

t=(X-u0)/(s/√x) = (5.22-4.15)/(1.61√41)=4.26

自由度ν=41-1=40

3.确定P值和作出推断结论

查t界值表,t0.05/2,40=2.021,t > t0.05/2,40,P<0.05。按α=0.05水准,拒绝H0,接受H1,可认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的差别有统计学意义,结合专业可以认为前者平均浓度较高。

例2

难产儿出生体重n=35, \bar{X}=3.42, S =0.40, 一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否?

1.建立假设、确定检验水准α

H0:μ = μ0 (无效假设,null hypothesis) H1:μ != μ0(备择假设,alternative hypothesis,)

双侧检验,检验水准:α=0.05

2.计算检验统计量

t=(X-u0)/(s/√x)=(3.42-3.3)/(0.4/√35) =1.77,v=n-1=35-1=34

3.查相应界值表,确定P值,下结论

查附表1,t0.05 / 2.34 = 2.032,t < t0.05 / 2.34,P >0.05,按α=0.05水准,不拒绝H0,两者的差别无统计学意义

三、配对设计资料的 t 检验

配对设计:将受试对象的某些重要特征按相近的原则配成对子,目的是消除混杂因素的影响,一对观察对象之间除了处理因素/研究因素之外,其它因素基本齐同,每对中的两个个体随机给予两种处理。

目的:判断不同的处理是否有差别

  • 配对设计(paired design)是一种特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和异 体配对之分。
  • 配对设计资料的分析着眼于每一对观察值之差,这些差 值构成一组资料,用 t 检验推断“差值的总体均数是否为 0”。

配对设计资料分三种情况:

  • 两种同质对象分别接受两种不同的处理,如性别、年龄、体重、病情程度相同配成对。
  • 同一受试对象或同一样本的两个部分,分别接受两种不同的处理自身对比。
  • 即同一受试对象处理前后的结果进行比较。

检验的假设:

H0: μd=0 H1: μd ≠ 0

统计量: $$ t= {\frac {\bar d - 0} { \frac {S_{d}} {\sqrt{n}} } }$$

分子:样本差值d 的均数与0的差距

分母: d 的均数的标准误

n:对子数

已知:H0成立时, $$ t= {\frac {\bar d - 0} { \frac {S_{d}} {\sqrt{n}}}} \sim t _{\left(v\right)} , v = n-1$$`

故以α为检验水准,如果 t 大于相应的界值,则P<α,拒绝H0;否则不拒绝 H0

例一

1.建立检验假设,确定检验水准

H0 : μd=0,即差值的总体均数为0 H1 :μd ≠ 0 ,即差值的总体均数不为 0, α= 0.05

2.计算统计量

n=15,d =0.06,sd =0.10

$$ t= {\frac {\bar d - 0} { \frac {S_{d}} {\sqrt{n}}}} = {\frac {0.06 - 0} { \frac {0.1} {\sqrt{15}}}} = 2.33 , v=n-1 = 15-1=14$$

  1. 确定 P 值,作出推断

查 t 界值表,0.02< P <0.05,在α=0.05 的水准上拒绝 H0,可认为孪生兄弟的出生体重与出生顺序有关,先出生者的体重大于后出生者。

例二:

将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E饲料,测得两组大白鼠肝中维生素A的含量,试比较两组大白鼠中维生素A的含量有无差别。

大白鼠配对号 正常饲料组 维生素E缺乏组 差数 d
1 3550 2450 1100
2 2000 2400 -400
3 3000 1800 1200
4 3950 3200 750
5 3800 3250 550
6 3750 2700 1050
7 3450 2500 950
8 3050 1750 1300
Mean 3318.75 2506.25 812.5

1.建立检验假设和确定检验水准

H0:μd=0 H1: μd≠0 α=0.05

2.选定检验方法和计算统计量

d=6500/8=812.5

sd=√((7370000-(6500)2/8) /(8*(8-1)))=193.1298  (这一步是怎么来的??)

3.确定P值和作出推断结论

–查t界值表(双侧),t>t 0.05/2, 7=2.365, P<0.05

–按α=0.05水准,拒绝H0,接受H1,可以认为两种饲料喂养的两组大白鼠中维生素A的含量有差别。正常饲料组比缺乏维生素E饲料组的含量要高。

三、两独立样本资料的 t 检验

  • 两独立样本的 t 检验 抽样: 从同一对象群,随机抽取两组,各接受不同处理 或者 从两个对象群,各随机抽取一组,接受相同处理
  • 数据:两独立样本的资料
  • 目的:检验两个总体均数是否相等
  • 假定:两个总体均服从正态分布,方差相等(方差齐性)

例一

某医师要观察两种药物对原发性高血压的疗效,将诊断 为II期高血压的 20 名患者随机分为两组(两组患者基线时血 压之间的差别没有统计学意义);

一组用卡托普利治疗,另一组用尼莫地平治疗; 3 个月后观察 舒张压下降的幅度(mmHg),结果如下: 卡托普利组(X1):12 17 13 8 4 10 9 12 10 7 尼莫地平组(X2):11 8 12 13 9 10 8 0 7 16 试比较两药平均降压效果有无差异。

经检验, 两组舒张压下降值均服从正态分布、方差齐性。 $$X_{1} \sim \left(\mu_{1},\sigma^{2}\right), X_{2} \sim \left(\mu_{2},\sigma^{2}\right)$$

  1. 建立检验假设,确定检验水准

    H0: μ1 = μ2,或 μ1-μ2=0 H1: μ1 ≠ μ2, 或 μ1 - μ2 ≠ 0 α =0.05

2.计算统计量

$$ \bar X_{1} \sim N\left(\mu_{1}, {\frac{\sigma ^{2}}{n_{1}}} \right)$$

$$ \bar X_{2} \sim N\left(\mu_{2}, {\frac{\sigma ^{2}}{n_{2}}} \right)$$

$$ \bar X_{1} -\bar X_{2} \sim N\left(\mu_{1}-\mu_{2}, {\frac{\sigma ^{2}}{n_{1}}} +{\frac{\sigma ^{2}}{n_{2}}} \right)$$

检验统计量为:

$$ t = {\frac{ \bar X _{1} - \bar X _{2} }{\sqrt{ S_{c}^{2}\left({\frac{1}{n_{1}}}+{\frac{1}{n_{2}}} \right) } }} $$ Sc2是利用两样本联合估计的方差 $$ S_{c}^{2} = {\frac{ \left(n_{1}-1\right)S_{1}^{2} + \left(n_{2}-1\right)S_{2}^{2} }{ n_{1} + n_{2}-2 }} $$

已知,当H0成立时,统计量服从自由度n=n1+n2-2的t分布

$$ S_{c}^{2} = {\frac{ \left(n_{1}-1\right)S_{1}^{2} + \left(n_{2}-1\right)S_{2}^{2} }{ n_{1} + n_{2}-2 }} = {\frac{ \left(10-1\right)*3.58^{2} + \left(10-1\right)*4.27^{2} }{ 10 + 10-2 }} = 15.52 $$

$$ t = {\frac{ \bar X _{1} - \bar X _{2} }{\sqrt{ S_{c}^{2}\left({\frac{1}{n_{1}}}+{\frac{1}{n_{2}}} \right) } }} = {\frac{ 10.2 - 9.4 }{\sqrt{ 15.52 \left({\frac{1}{10}}+{\frac{1}{10}} \right) } }} =0.454$$

3.确定 P 值,作出推断

按照a =0.05 的水准,t0.05/2,18=2.101;

t=0.454< t0.05/2,18,P>0.5,不拒绝 H0, 差异无统计学意义;

结论:尚不能认为这两种药物降压效果有差别。

两样本所属总体方差不等怎么办?

近似 t 检验(Satterthwaite近似法)

例2

为比较特殊饮食与药物治疗改善血清胆固醇(mmol/L) 的效果,将 24 名志愿者随机分成两组,每组 12 人,甲组为 特殊饮食组,乙组为药物治疗组。 受试者试验前后各测量一次血清胆固醇,差值见下表,请比较两种降血清胆固醇措施的效果是否相同?

组别 |例数 |均数(mmol/L) | 标准差(mmol/L) 特殊饮食组 | 12 |0.5592 |0.5110 药物治疗组 | 12 | 0.1467 | 0.1107

经正态性检验(见后),两组血清胆固醇差值均服从正态分布条件;暂将此资料视为总体方差不相等(关于方差齐 性的检验见后)

N(μ1,σ12),N(μ2,σ22),σ12≠σ22

$$ \bar X_{1} \sim N\left(\mu_{1}, {\frac{\sigma ^{2}}{n_{1}}} \right)$$

$$ \bar X_{2} \sim N\left(\mu_{2}, {\frac{\sigma ^{2}}{n_{2}}} \right)$$

$$ \bar X_{1} -\bar X_{2} \sim N\left(\mu_{1}-\mu_{2}, {\frac{\sigma ^{2}}{n_{1}}} +{\frac{\sigma ^{2}}{n_{2}}} \right)$$

检验统计量为:

$$ t' = {\frac{ \bar X _{1} - \bar X _{2} }{\sqrt{ {\frac{S_{1}^{2} }{n_{1}}}+{\frac{S_{2}^{2} }{n_{2}}} } }} $$

H0成立事,t’的分布比较复杂, Satterthwaite(1946)提出可由自由度为下式的 t 分布来近似 t¢ 分布。

$$ v = \frac{ \left( {\frac{S_{1}^{2}}{n_{1}} } +{\frac{S_{2}^{2}}{n_{2}} } \right)^{2} }{ {\frac{ \left ( {\frac{S_{1}^{2}}{n_{1}}} \right)^{2} }{n_{1}-1}} + {\frac{ \left ( {\frac{S_{2}^{2}}{n_{2}}} \right)^{2} }{n_{2}-1}} } $$

据此近似地得到相应的 P 值.

  1. 确定 P 值,作出推断

查 t 界值表,得 t0.05/2,12 = 2.179 , t0.01/2,12 = 3.055 ,t0.02/2,12 = 2.681,t =2.733 时,0.01< P <0.02,故在a =0.05 水平上拒绝 H0。 两组样本降血清胆固醇效果的差异具有统计学意义;结论:可以认为两种降血清胆固醇措施的效果不同。

例三

将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。这样的设计称为两组完全随机化设计,也叫成组设计。

目的是推断两总体均数μ1与μ2有无差别。

例:某医院研究乳酸脱氢同工酶(LDH)测定对心肌梗死的诊断价值时,曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH测定值的差别,结果如下,试

问LDH测定值在两组间有无差别?

患者:23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0

健康人:20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 31.0

确定P界作出结论

t=(43.48/31.01)/3.72=3.352,v=10+10-2=18

t>t 0.005/2,18=3.197, P<0.005

按α=0.05 水准,拒绝H0,接受H1。可以认为乳酸脱氢同工酶测定值在心肌梗死与健康

人之间有差别,心肌梗死患者的含量比健康人的要高。

如何判断两个的方差是否相等

例四(两独立样本资料的方差齐性检验)

某口腔医院选择所在城市 40­50 岁慢性牙周炎患者 36 例, 测得吸烟组(18 人)菌斑指数(PLI)均值为 84.71、标准差为 8.14;非吸烟组(18 人)菌斑指数的均值为 82.20、标准差为 6.18,试检验两总体方差是否相等?

N(μ1,σ12),N(μ2,σ22),σ12≠σ22

1.建立检验假设,确定检验水准

H0: σ12=σ22 H1: σ12≠σ22 α = 0.05

  1. 计算统计量

$$ F = \frac{ S_{1}^2}{ S_{2}^2} , v1=n1-1, v2=n2-1 $$ S12 表示较大方差

$$ F = \frac{ S_{1}^2}{ S_{2}^2} = \frac{ 8.14^2}{ 6.18^2} =1.7349 $$

v1= n1 -1 = 18-1=17, v2 =n2-1=18-1=17

  1. 确定 P 值,作出推断

查 F 分布的双侧临界值表, F0.05/2(17,17) = 2.67 , P >0.05,在 α =0.05的水准上不能拒绝 H0 ,两个样本方差的差异不具有统计学意义。 结论:不能认为两个总体方差不相等。

四、T检验注意事项

  • 要有严密的抽样设计随机、均衡、可比
  • 选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)
  • 单侧检验和双侧检验(单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。)
  • 假设检验的结论不能绝对化(不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误)
  • 正确理解P值与差别有无统计学意义 (P越小,不是说明实际差别越大,而是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同)

假设检验和可信区间的关系:

  • 结论具有一致性
  • 差异:提供的信息不同(区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。)

五、R代码的实现

t.test(x, y = NULL,
            alternative = c("two.sided", "less", "greater"),
            mu = 0, paired = FALSE, var.equal = FALSE,
            conf.level = 0.95, ...)

其中x, y是我们样本数据构成的向量,alternative表示备择假设的形式,“two.sided”表示双边检验(H1: μ1≠μ2), “less”表示单边检验(H1:μ1<μ2),“greater”表示单边检验(H1:μ1>μ2),paired表示样本是否是配对的,var.equal表示两总体方差是否相等。

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn