【1.1】 医学统计学绪论

一、关于医学统计学

1.什么是统计学?

“A branch of mathematics dealing with the collection, analysis, interpretation, and presentation of masses of numerical data.”(Webster’s International Dictionary)

“The science and art of collecting, summarizing, and analyzing data that are subject to random variation.” (A Dictionary of Epidemiology).

  • 统计学: 处理数据中变异性的科学与艺术
  • 内容: 收集、分析、解释和表达数据
  • 目的:求得可靠的结果
  • 统计学的现实地位:合作、审稿、基金申请 (NIH)、药物开发与申报(FDA)、卫生决策

Pierre-Charles-Alexandre Louis (1787­1872)

循证医学奠基人

放血疗法的评价

(1) 52例重伤寒病员: 39例放了血,平均生存时间是25.5天; 13例没有放血者,平均生存时间却是28天

(2) 恢复期伤寒病员: 62例放了血,平均带病期是32天;26 例没放血,平均带病期是31天

明确宣布:放血疗法无效!

Galton Sir Francis Galton (1822­1911)

第一位定量遗传学家

  • 最早利用量表,定量研究了有成就的人及 其家庭,发现智力也有遗传
  • 最早发明回归直线和相关分析
  • 利用豌豆的大小,定量研究遗传规律, 发现“regression toward the mean”这一普遍现 象疗法的评价

Karl Pearson (1857–1936)

现代统计学之父

  • Galton 的学生
  • 1894年,开出第一门统计学理论的高级课程
  • 1901年, 创办第一份统计学杂志 Biometrika ,发表他和他的生物统计 学派的研究成果
  • 但是,1903年,在剑桥只有两个订户

Ronald A. Fisher (1890­1962)

首创随机对照试验

《Statistical Methods for Research Workers》 (1925), 《Design of Experiments》 (1935) 提 出对付误差的三原则:对照(Control)、随机化 (Randomization) 和适当组织 (Relevant organizing)

“为了由局部推断整体,统计学家在实验的设 计阶段就必须参与”

“做完实验后才找统计学家,就好像要他作尸 体解剖。他会说,这实验‘死’于什么原因。”

Austin Bradford Hill (1897­1991)

随机化临床试验的先锋

链霉素治疗肺结核的临床试验

病人随机地分到链霉素加卧床休息组和单 纯卧床休息组; X­光片由两位放射学家和一位 临床学家独立评价; 结果: 链霉素组病人的生存和X光片两方面 都有较好的改善。

《Principles of Medical Statistics》

“相对而言,医生个人的临床经验是无计划、 杂乱的,而且是非常不可靠的” 成功说服英国 医学界,将Fisher的实验设计原理导入医学试验

Jonas Salk (1914­1995)

史上最大规模、花费最多临床试验

  • 1954年在美国实施了一项临床试验旨在评价疫 苗预防小儿麻痹或死于脊髓灰质炎的效果。180 万儿童参与,花费超过500万美元
  • 开始时随机化分组遇到一些阻力,最后约有1/4 参与者得到了随机化。最终肯定了该疫苗的效 果, 命名为Salk疫苗。
  • 此后,美国FDA为临床试验规定了一整套制度, 使之成为确定药物疗效的标准方法。

二、统计学与公共卫生的互动

与临床医生治疗个体病人不同,公共卫生考虑的是群体的规律。

公共卫生对统计学天然的亲和,公共卫生专业人员视统计学为必备素养:

设计群体调查 疾病和卫生资源的分布特征 在偶然性的背景中识别危险因素 评价卫生措施 科学决策

Graunt: 最早的寿命表(1600’s)

Graunt 发展了最早的人口 统计和普查方法,创造了第 一个寿命表,给出了各年龄 的生存概率,为人口统计学 奠定了基础。

寿命表

  • John Graunt (1620­1674) 开始搜集死亡方面的数据,编制了寿命表,从而创造了人口统计这一学科;
  • William Farr (1807­1883) 英国出生和死亡注册局医学统计官。他建立了一套常规的死亡人数 和死因的汇编系统。他进一步改进寿命表方法,在英国创造了世界上最 好的官方生命统计系统;
  • 蒋庆琅Chin­Long Chiang (1914­2014) 以现代统计学和随机过程的观点系统研究了古老寿命表的原理,使 之成为生物统计学的重要组成部分;以世界卫生组织顾问的身份推动了 寿命表在国际范围的应用,直至如今。

蒋庆琅: 使寿命表现代化

  • 美国加州大学生物统计学教 授、 第一任主任。1987年, 获"The Berkeley Citation” 奖。
  • 他在现代统计学和随机过程 基础上研究寿命表。
  • 作为世界卫生组织特聘专家 , 将寿命表普及于世界。

Richard Doll:Smoking and Lung Cancer

英国生理学家,将流行病学发展成严格的科学。证明吸烟引发肺癌,增加

心血管疾病风险:

(1) Case­control study (病例­对照研究) 1948­1949

(2) Cohort study (队列研究) 1951­

公共卫生对统计学的挑战:

(1) 非感染性疾病 众多危险因素的分析

生存时间的分析 疾病自然史的模型 化学毒物或药物评价

(2) 动物实验

定性检验:处理组和对照组之间的比较来确定化学物是否对人体引起有害健康的效应;

危险度定量评价:借助复杂的统计模型。 人群药物代谢动力学:统计学几个分支交叉结合

(3) 遗传流行病学 父母向子女的传递

同胞对内部的异同 缺失数据

(4) 艾滋病研究 总体成员及其规模往往未知

个体感染和发病的起点未知 发展了逆向估计 捕获­再捕获等新的抽样与估计方法。

(5) 卫生服务研究

成本­效果分析、成本­效益分析

目的

(1) 统计思维享用一生

事件的不确定性 (Laplace)

由样本推断总体,结论的不确定性有可能犯错误 (Pearson)

统计学任务: ­­­­ 限定犯错误概率的大小, 在此前提下,作决策

(2) 掌握概念是首位

  • 研究设计的原则 (Fisher)
  • 确定样本量的依据
  • 参数估计的精度
  • 决策的两类错误

案例辨析:在辨析中提高,从反面吸取教训

四、几个重要概念

  1. 总体与样本
  • 总体 (population): 大同小异的对象全体
  • 目标总体(target population): 试图下结论的某个总体。例 如,英国成年男子为目标总体
  • 研究总体(study population) : 资料来源的较小的总体。例 如,1951年英国全部注册医生

需要谨慎: 就研究总体所下结论未必适用于目标总体

  • 抽样(sampling):从研究总体抽取部分个体
  • 样本(sample) :抽取的部分个体
  • 数据(data):观察所得资料
  • 信息(information):数据分析的产物
  • 推断(inference): data information knowledge

统计推断的工具:Probability Theory

需要注意: 推断的结论从来不是完全肯定或完全否定

关键与核心:抽样方法、样本的代表性和推断的方法

2.同质与变异

  • 同质性(homogeneity) 共性,大同小异 n 变异(variation) 个体差异,多样性 没有同质性就构不成一个总体; 总体内没有变异性就无需统计学。

统计学的任务:在变异的背景上,

  • 描述同一总体的同质性,
  • 揭示不同总体的异质性 (heterogeneity)。
  1. 变量

见博文专题介绍

4.因果与联系

目的常常是探索因果关系 (causation) , 例如,危险因素与疾病。首先要问有没有联系(association)? 但是,联系不等于因果关系!

在解释统计分析的结果以及下结论时, 务必对“causation” 慎之又慎

参考资料:

方积乾 卫生统计学 (第7版) ,人民卫生出版社 2012 (含光盘)

方积乾 卫生统计学学习指导与习题集,人民卫生出版社 2014(含光盘)

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn