【2.5】粗率的标准化法

一、标准化法的意义和基本思想

如果两组个体的年龄、性别、病情等变量在两组内的分布存在差异,则粗死亡率、粗发病率、粗治愈率等不能直接进行比较。

为消除两组个体其它变量分布不同的影响,需要首先对两组数据作标准化处理。

例子:

某医院用A、B两种疗法治疗某病, 对象有普通型和重型两类患者,病人数和治愈数分别如表3­9所示,试比较这两种疗法的治愈率。

上表资料表明:

对于普通型,A=60.0%<B=65.0%

对于重型,A=35.0%<B=41.7%

对于合计,A=53.8%>B=47.5%

为什么出现矛盾??

关键在于,这两个治疗组病人的病型分布有很大不同,A疗法组的 普通型病人多于重型病人,B疗法组相反,普通型病人少于重型病人, 两个治疗组的粗治愈率无可比性。

这时就必须克服两组治疗对象病型分布不同的困难,办法之一就是标准化法。

“标准”选择:

  1. 选定两组之一,将其作为“标准”;
  2. 两组合并,作为“标准”;
  3. 在两组之外另选一个群体,如采用全国、全省或全地区的对象, 将其作为“标准”。

二、标准化率的计算

1、直接标准化法

1)选定“标准人口” 本例,将A、B两组合并,作为“标准人口”。

2)分别计算“标准人口”的预期治愈人数 。

2) 分别计算两种疗法的标准化治愈率

对于A疗法,标准化治愈率为:

P= 预期治愈人数之和/标准人口数 = (N1P1 +N2P2) /N *100 % = 380800 *100%=47.5%

对于B疗法,标准化治愈率为: P= 预期治愈人数之和/标准人口数 = (N1P1 +N2P2) /N *100 % = 427800 *100%=53.4%

经标准化后,B疗法治愈率高于A疗法。

一般地,设有一个重要的分类变量,它在两组个体(j=1,2)中的分布不同;已知第j组每个类别中发生某事件的频率Pij,i=1,2…

(1) 选定“标准人口”,每个类别中的个体数记为 Ni,i=1,2…。

(2) 分别计算“标准人口”的预期治愈人数之和 ∑NiPij,j=1,2i

(3) 分别计算两种疗法的标准化治愈率

$$p'_{j}= {\frac {\sum _{i} N_{i}p_{ij} } {N}} $$

$$p'_{j}= \sum _{i} \left( {\frac {N _{i}}{N}} \right) p_{ij}$$

2.简介标准化法

例3­6 某人于1998年在某省城市和农村分别抽样调查了776名和789名老年妇女,从中分别检出了322名和335名原发性骨质疏松症患者(表3­ 11)。由于城市和农村被调查者年龄分布很不相同,但缺少各年龄组患者人数和患病率资料,不便采用直接法计算标准化率。试用间接标准化 法比较城市和农村的标准化患病率。

步骤:

1)选另一个地区某年的50岁以上老年妇女原发性骨质疏松症的年龄组患病 率Pi 作为标准患病率(表3­12第2列)。

2)分别计算城乡两地被调查者中的预期患病人数。(第4和6列)

3) 分别计算城乡两地实际患病人数与预期患病人数之比和标准化患病率。

标准化患病率 = 标准患病率 * 实际患病人数之和 / 预期患病人数之和

城市标准化患病率 = 42.1% * 322 / 305= 44.6% 农村标准化患病率 = 42.1% * 335 /353 = 40.0%

可见,经间接标准化后,城市老年女性骨质疏松症标准化患病率高于农村

一般地,设有一个重要的分类变量,它在两组个体(j=1,2 )中的分 布不同;已知第j组每个类别中的个体数nij , i=1,2..和实际发生某事件的总 人数rj ,j=1,2。

(1) 选定该事件的“标准发生率”,每个类别中的发生率记为Pi,i=1,2.. , 合计发生率为 P。

(2)分别计算两组每个类别中发生某事件的预期人数之和 ∑ nijPi,j =1,2

(3)分别计算两组合计发生率 与SMR的乘积,称为间接法标准化发生率。 标准化发生率

$$ p'_{j} = P {\frac {r_{j}} {\sum_{i}n_{ij}P_{i}}} $$

如果上述“某事件的发生率”为死亡率, 则实际死亡人数与期望死 亡人数之比称为标准化死亡比(standard mortality ratio,SMR)。

  • 若SMR >1, 表示被标准化人群的死亡率高于标准死亡率;
  • 若SMR <1, 表示被标准化人群的死亡率低于标准死亡率。

三、应用标准化法的注意事项

  1. 标准化法的应用范围很广。
  2. 标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。
  3. 标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较。选择不同的“标准”,算出的标准化率也会不同。
  4. 两样本标准化率是样本值,存在抽样误差。样本小时,进行假设检验。

参考资料

中山大学课程 《医学统计学》方积乾

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学