【7.2】 偏倚

案例1:

[新闻1+1]中国患癌高发区病因被曝和食用转基因大豆油相关

案例2:

巧克力与诺贝尔奖之间的关系 – NEJM 2012;367:1562-1564

案例3:

科学研究结果是如何被一步步误读成谣言的

案例4:

来自科学的责难

epidemiology faces its limits

案例5:击败坏科学

TED: battling bad science

一、偏倚的基本概念

1.1 流行病学研究中的误差

  • 可靠性
  • 真实性

误差的概念,类型和特点:

概念:研究结果与真实值之差

类型: 随机误差、系统误差

特点: 误差的大小,方向

误差的大小:

假设真实的测量疾病的频率是8 ‰, 某研究测量疾病的频率为 10 ‰,则:

  • 绝对误差为: 10 ‰ - 8 ‰ = 2 ‰
  • 相对误差为: (10 ‰ - 8 ‰ )/8 ‰ * 100% = 25%

误差的方向

  • 随机误差不纯在方向问题 – 精确性问题
  • 系统误差的方向很重要 – 正确性问题

1.2 偏倚的概念、类型和特点

概念: 偏倚是指流行病学研究中的各种系统误差

类型:

  • 选择偏倚(selection bias)
  • 信息偏倚(information bias)
  • 混杂偏倚(confounding bias)

偏倚的方向

若:真实值RR, 测量值RR’ (RR=1表明暴露与结局无关联,接受无效假设)

偏倚的方向分为三种:

  • 趋于无效假设(低估关联强度)
  • 远离无效假设(高估关联强度)
  • 颠倒(混淆)

偏倚的方向:

  • 趋于无效假设(toward the null)
    • RR=5.0, RR’ =1.3
    • RR =0.3, RR’ = 0.9
  • 远离无效假设(away from the null)
    • RR =2.0,RR’ =8.0
    • RR =0.8, RR’ =0.5
  • 颠倒(switchover bias)
    • RR =2.0,RR’ = 0.5
    • RR =0.8, RR’ =2.0

偏倚的大小:

偏倚的大小通常以相对数表示:

Bias = (测量值 - 真实值) /真实值 * 100%

例: 测量值RR’ = 1.2,真实值 RR=2.0

Bias = (1.2 - 2.0) /2.0 * 100% = -40%

大小: 40%,方向:趋于无效假设(不必考虑正负符号)

1.3 常见偏倚的种类及其控制

1.3.1 入院率偏倚(Berkson’s Bias)

社区的一般人群的病例对照研究更符合真实的情况

入院率偏倚(admission rate bias)

  • 当以医院病人作为研究 对象进行病例对照研究时,由于不同患者入院率的不同所导致的系统误差。
  • 解决办法: 尽量选择社区的一般人群

1.3.2 排除偏倚 exclusion bias

  • 非甾体抗炎药(non-steroidal anti-inflammatory drugs, NSAIDs) 预防结直肠癌的病例对照研究
  • 对照来源于风湿科,NSAIDs暴露机会高,关联强度变强,远离无效假设;
  • 对照来源于消化科,NSAIDs暴露机会低,关联强度变弱,趋于无效假设。

排除偏倚:在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致该因素与疾病间的错误估计,称为排除偏倚。

解决办法:选择不同类型的多加医院或多个科室。

1.3.3 现患-新发病例偏倚(Neyman Bias)

现患-新发病例偏倚(prevalence-incidence bias )

  • 以现患病例为对象进行研究,与以新病例为对照进行研究时相比,因研究对象的特征差异所致的系统误差。
  • 解决办法: 尽量选择新发病例

1.3.4 检出征候偏倚(Detection Signal Bias )

某因素与研究疾病在病因学上可能无关,但由于该因素的存在导致了所研究疾病相关症状或体征的出现,使其及早就医,以致该人群比一般人群该病的检出率高,从而得出该因素与疾病相关联的错误结论,所致的系统误差称为检出征候偏倚。

  • 解决办法:尽量包括早、中晚各期的病例。

1.3.5 易感性偏倚(susceptibility bias)

研究对象暴露与某可疑致病因素与否,与许多主、客观原因有关,其有可能直接或间接地影响研究对象所研究疾病 的易感程度,从而导致某因素与某疾病间的虚假联系。

  • 健康工人效应(healthy worker effect )

1.3.6 无应答偏倚(non-response bias)

  • Seltzer等曾采用邮件问卷的方式,调查1987名美国波士顿的百人男性退伍军人的吸烟状况。
  • 30天后总结收到的回复并进行核实发现:
    • 不吸烟者的应答率为85%
    • 吸烟者的应答率为67%
  • 这将会导致低估吸烟与所研究结局之间的关系。

在特定的研究样本中,无应答者的患病状况,以及对某些研究因素的暴露情况,与应答者可能不尽相同,银耳导致的系统误差。

  • 失访偏倚 (loss to follow-up bias)
  • 志愿者偏倚(volunteer bias)

1.3.7 选择偏倚(selection bias)

定义:由于被选入到研究中的研究对象,与没有被选入者特征上的差异,所导致的系统误差。

特定: 一旦发生,难以纠正,研究的真实性受影响;需在研究的各个阶段尽力避免。

控制:

  • 研究设计阶段:严格的科学设计,正确选择研究对象,可采用多种对照;
  • 资料收集阶段:减少无应答,加强随访,尽力使研究对象、研究内容完整;
  • 资料分析阶段:用以往的知识与他人的经验评估偏倚的大小与方向,对无应答或失访者进行基线特征的比较并矫正。

1.3.8 回忆偏倚( Recall Bias)

指研究对象在回忆以往发生的事情或经历时,由于在精确性和完整性上的差异,所导致的系统误差。

1.3.9 诊断怀疑偏倚 (diagnostic suspicion bias)

对长期服用氯霉素的患者,医生反复查血象,甚至进行骨髓象等检查,可较早较多的发现粒细胞减少症,再生障碍性贫血等疾病,而服用其他药物的疾病则不注意血象检查,使以上疾病不能被及时发现,结果夸大了服用氯霉素与粒细胞减少症,再障等疾病的关联。

定义: 研究者若实现了解研究对象研究因素的暴露情况,在主观上倾向于应该或不应该出现某种结局,在作诊断或分析时,有意无意地倾向于自己的判断,由此而导致的系统误差称为诊断怀疑偏倚。

1.3.10 暴露怀疑偏倚 (exposure suspicion bias)

  • 1962年Nishiyama和Raventos等人报告了使用不可比的方法调查儿童甲状腺癌与过去放射性物质暴露史的关系;
  • 分别在36例和22例两组患儿中发现:
    • 以常规和查阅医疗记录方法调查,有暴露史者分贝为28%和0
    • 进过深入调查和询问,有暴露史者分别为47%和50%

定义:研究者若事先了解研究对象的患病情况或某结局,可能会对其采取与对照组不可比的方法探寻认为与某病或某结局有关的因素,由此而导致的系统误差称为暴露怀疑偏倚。

小结:信息偏倚 ( information bias)

定义:在流行病学调查收集资料阶段,由于测量暴露或测量结局的方法有缺陷,使各比较组所获得的信息产生的系统误差。也叫观察偏倚(observation bias)或错分偏倚(misclassification bias)

控制:

  • 严格信息标准
  • 采用客观指标
  • 盲法收集信息
  • 调查技术的应用
  • 统计学处理

1.3.11 混杂偏倚( confounding bias)

巴拿马与瑞典的死亡率比较(1962年)

巴拿马:

  • 人口数 = 1,075,000
  • 死亡数 = 7,871
  • 死亡率 = 7310000

瑞典:

  • 人口数 = 7,496,000
  • 死亡数 = 73,555
  • 死亡率 = 9810000

混杂因素(confounder )

特点:

  • 与所研究的结局(outcome)有关;
  • 与所研究的暴露因素(exposure)有关;
  • 不是研究的暴露因素与研究结局因果链上的中间环节

混杂偏倚( confounding bias)

控制:

  • 限制(restriction)
  • 随机化(randomization)
  • 匹配 ( matching )
  • 统计学处理

总结:偏倚(bias)

  • 偏倚是一类系统误差,造成研究结果偏离真实情况(夸大、缩小或混淆);
  • 选择偏倚主要发生在研究的设计阶段;
  • 信息偏倚主要发生在研究的实施阶段;
  • 混杂偏倚发生在研究的设计和分析阶段;
  • 在各个几段有效控制偏倚,才能保证研究结果的真实性。

参考资料:

北京大学公共卫生学院 唐迅老师的 《流行病学绪论》 课件

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学