【2.2】临床试验终点--OS/PFS/ORR/DFS/TTP/TTF/DCR
晚期肿瘤作为不可治愈的疾病,治疗目标非常明确:活的长,活的好,这是临床诊疗领域的共识。
- 活的长:自肿瘤被诊断之后,通过治疗让患者活的越久越好,常用总生存时间(OS: Overall Survival)表示;
- 活的好:自肿瘤被诊断之后,无论治疗或治疗间期,改善患者的生活质量,常用生活质量(QoL: Quality of life)表示。
一直以来,OS和/或QoL有统计学显著性和临床意义的提高是评价一个抗癌药物疗效的金标准。尤其是OS,堪称肿瘤药物疗效评判金标准,原因在于晚期恶性肿瘤生存时间太短,实体肿瘤OS基本在1年之间。
随着对肿瘤疾病认知的不断进步,尤其是近年来各种新的治疗模式横空出世,传统的化疗之外,靶向治疗和免疫治疗,让晚期肿瘤治疗逐步从一线治疗、二线治疗推进到N线治疗的可能性,治疗的排兵布阵逐渐丰富起来,但是想要做出OS获益的研究却变得越来越难,于是替代性(surrogate)评估指标:无疾病进展生存期(PFS: Progression Free Survival)逐渐被接受。 PFS作为主要研究终点的研究,从1975-1984年间的0%比重,提升到2005-2009年间的26%。
2009年对于肿瘤治疗是个分水岭的一年,开天辟地的IPASS研究启动了靶向治疗新时代,近年来,O药、K药等免疫治疗也是崭露头角,到底选择PFS还是OS作为主要研究终点,又是一个全新的挑战。
在传统的肿瘤药物的研发中,早期的临床试验目的是评价安全性以及药物的生物活性,如肿瘤缩小,如以影像检查或体检等肿瘤评估方法测得的 ORR。在随后的数十年中,人们逐渐认识到有效的研究应该评价药物是否让患者得到临床获益,如生存期延长、症状改善、生活质量提高等。
到肿瘤临床研究,就不得不说临床试验终点(End Point),比如大家熟知的 OS、PFS、ORR 还有 DFS、TTP、TTF……不同的终点服务于不同的研究目的。
这些终点可能不像血压、血细胞计数等那些经过充分验证的指标,但也可合理预测临床获益。临床试验需确证某药物的实际临床获益,才能获得国家食品药品监督管理局的批准。如果不能,则不得上市或需撤出市场。
可以这么说,支持药物批准的临床试验终点通常应当是反映临床获益的指标,临床的获益决定了能不能获批。
一、各项指标
1.1总生存(Overall survival,OS)
定义
从随机化开始至(因任何原因)死亡的时间。对于死亡之前就已经失访的受试者,通常将最后一次随访时间计算为死亡时间。
数据意义
被认为是肿瘤临床试验中最佳的疗效终点,当患者的生存期能充分时,它通常是首选终点。
优点
最大的优点是记录方便,无论是院内还是院外,确定患者死亡的日期基本上没有困难。如果研究结果显示生存有小幅度提高,就可认为是有意义的直接临床获益证据。
缺点
缺点也是有的,大型试验随访期较长,所以在 临床试验中常常会用到 5 年生存率,即——某种肿瘤经过各种综合治疗后,生存五年以上的患者比例。
肿瘤患者治疗后,一部分复发转移、一部分死亡,一部分生存。80% 复发转移常发生在根治术后 3 年内,10% 左右发生在 5 年内,5 年后再次复发概率很低。所以以 5 年为节点,这是有一定科学性的。当然,也有用三年生存率和十年生存率表示疗效的。
除了 OS 外,其余的终点都是要基于肿瘤测量的。不同的肿瘤试验,肿瘤测量的精确性有较大差异,这就要求研究者充分评估获益和偏倚。药物上市申请时如果采用基于肿瘤测量的临床试验终点作为有效性的唯一证据,那么通常应提供来自第二个试验得到的确凿证据。
1.2 客观缓解率( Objective Response Rate,ORR)
定义
肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例,为完全缓解和部分缓解比例之和。
数据意义
缓解期通常是指从开始出现疗效直至证实出现肿瘤进展的这段时间。ORR 是一种直接衡量药物抗肿瘤活性的指标,在单臂试验中进行评价。
ORR 的缓解标准应在试验开始前的方案中提前定义,评估内容包括缓解程度、缓解持续时间以及完全缓解率(没有可测量到的肿瘤),不包括疾病稳定——肿瘤缩小是直接疗效,疾病稳定是疾病的自然进程。
1.3 无进展生存期(progression-free survival,PFS)
定义
从随机化开始到肿瘤发生(任何方面)进展或(因任何原因)死亡之间的时间
数据意义
与 OS 相比,增加了「发生恶化」这一节点,而「发生恶化」往往早于死亡,所以 PFS 常常短于 OS,却也能在 OS 之前被评价,因而随访时间短一些。PFS 的改善包括了「未恶化」和「未死亡」,即间接和直接地反映了临床获益,它取决于新治疗与现治疗的疗效 / 风险。
无进展生存期也通常被理解为耐药期,也就是大概服用多久就会出现耐药,但PFS的数据中还包含了其他情况引起的进展。所以在实际服用中,患者实际的耐药期常常可以超过临床报道的无进展生存期。
而正因为增加了「发生恶化」这一节点,而不同肿瘤进展的定义不同,不同研究在判断肿瘤进展时容易产生偏倚。因此,在临床试验设计中,「肿瘤进展」的标准必须要进行明确的定义,还包括 PFS 的评估、观察、分析方法,随访和影像学评价必须是均衡的,最好有一个由影像学专家和临床专家组成的处于盲态的独立裁定小组进行。
PFS 包括死亡,更好地反映了药物毒副作用,因此与 OS 有更好的相关性。然而,如果评估 PFS 的过程中,发现大部分患者不是死于肿瘤,而是其他疾病,这时势必 PFS 会有很大偏倚。此时就不得不说与 PFS 类似的另一个评估指标——TTP。
1.4 疾病进展时间(time to progress,TTP)
定义为:从随机化开始到肿瘤发生(任何方面)进展或(进展前)死亡之间的时间
TTP 主要记录疾病「恶化」,不包括「死亡」,考虑的是肿瘤活性,因而当多数死亡事件与肿瘤无关,TTP 是一个可被接受的终点。此外,如果多重治疗,存在交叉疗效——TTP 的差异不会被第二种治疗所掩盖。
TTP 与 PFS 一样,评估所需样本量小,随访时间短于 OS。
存在的问题就是,如果受试者在恶化前就已经死亡,那么一定观察不到他的 TTP,这时记录的 TTP 是不完整的,统计学上叫做 censoring(删失),这对于缺失数据的处理和数据的截止时间决定比较困难。
此外,由于多数临床试验不是双盲设计,这就会将偏倚引入 TTP 的决策中。而患者的随访存在难度:需要确定所有部位的病变,随访时间和间隔不同,TTP 就会存在差异,而多大的差异才能决定临床意义难以确定。
可见,TTP 在预测临床获益差于 PFS,存在多个问题,而且还也需要对「进展」进行明确的定义和评估。
1.5 无病生存期(Disease-free survival,DFS)
定义为:从随机化开始至疾病复发或(因任何原因)死亡之间的时间
DFS 最常用于根治性手术或放疗后的辅助治疗的研究,目前是乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助化疗的主要审批基础。
疾病复发就需要认真的随访,而记录同样比较困难,且肿瘤患者常有合并症容易干扰 DFS 的判断。当患者死于院外时,没有预先记录肿瘤进展情况,此时又往往不能尸检,无法确定复发情况。
1.6 治疗失败时间(time to treatment failure,TTF)
定义为:由随机化开始至「退出试验」,退出原因可能是患者拒绝、疾病进展、患者死亡、不良事件等。
由于不单单展现药物疗效,因而不建议用于疗效确认性试验。TTF 的本质是一具有综合特性的指标,所以,可造成为了达到毒性的降低,而潜在影响了预期疗效的产生。
1.7 CR、PR、SD、PD
这些代称与下面客观缓解率与疾病控制率解释相关,故提前说明。
实体瘤疗效评价标准(不同肿瘤类型会略有差别,请以各肿瘤项目为准)
- 完全缓解(CR),肿瘤完全消失超过1个月。
- 部分缓解(PR),肿瘤最大直径及最大垂直直径的乘积缩小达50%,其他病变无增大,持续超过1个月。
- 病变稳定(SD),病变两径乘积缩小不超过50%,增大不超过25%,持续超过1个月.
- 病变进展(PD),病变两径乘积增大超过25%
1.8 疾病控制率,disease control rate, DCR
定义
经治疗后获得缓解(PR+CR)和病变稳定(SD)的病例数占可评价例数的百分比。简而言之即DCR=CR+PR+SD。且RECIST标准为至少维持4周
数据意义
疾病控制率与缓解率的区别在于:由于病变稳定(SD)也属于治疗有效的一种结果,故DCR将病变稳定的病例数记录在内,作为判断疗效的指标,较缓解率更为科学
二、讨论
2.1 PFS究竟能否真正替代OS
在部分实体肿瘤,如结直肠癌,证实了PFS和OS的相关性,但在绝大多数肿瘤,大多数PFS获益都没有转化为OS获益,PFS+ ≠ OS+。
PFS到底有没有用?这是学术界一直以来的争议。
首先需要洞察OS和PFS的不同意义。
OS是以事件为终点,即患者的死亡。OS的优势在于客观,不存在研究者的主观偏倚。劣势在于观测时间较长,需要记录所有事件的发生,即所有患者的死亡。研究所需的样本量较大。研究资金要求也较高。并且由于伦理要求,大多数患者因为交叉到后线治疗,药物的混淆将导致观测组药物OS无法有效且正确的评估。显著提高了药物上市的门槛和周期。
PFS是以人为设置的评估标准为终点(如实体肿瘤领域最常使用的RECIST标准)。PFS的优势在于观测时间较短,1-2年内即可观察到结果。研究所需的样本量较小。研究资金要求也相对较低。相比OS显著降低了药物上市的门槛和周期。劣势在于主观,易产生评价偏倚(因此常常采用独立的第三方评估纠偏),并且评价先于疾病变化,无法判断对患者生存的影响。PFS作为主要研究终点,很多时候(特别是TKI的研究)更像是探索治疗顺序的优化,而并非OS获益。
其次需要洞察PFS和OS的内在联系。
-
所有的PFS之和差不多就是OS了,在临床实践中可能是这个公式,OS=PFS1+PFS2…+…PFSN
-
OS更侧重反映肿瘤治疗的整体结果,它是多因素作用下的综合结局,既受到治疗疗效的影响,也受到副作用的影响,甚至可能受到药物相互作用的影响,而PFS相对单纯,更侧重反映肿瘤治疗的中短期疗效。
简单剖析PFS获益没有转化为OS获益的原因可能如下:
- 肿瘤缩小的幅度不足以影响总体生存,尤其是肿瘤本身负荷较小的患者,有研究显示,对于这类型患者,即使肿瘤病灶减少44%,也不足以将PFS获益转化为OS获益。肿瘤种子理论:肿瘤细胞未必严格遵循由近及远按部就班地侵袭正常组织,也有可能脱落进入血液循环远处播散。
- 有时候PFS的获益是基于精妙的统计学设计,如果PFS获益的不够powerful,无法有效地转化成OS获益。
- PFS的观测取决于方法的选择、测量病灶的选取、观察周期的影响,存在观察者的主观偏倚和评价偏倚。
- 肿瘤的世界严格遵循着丛林法则,有些药物虽然获得了PFS获益,但可能改变肿瘤的生物学特征,引起肿瘤的进行性改变,如靶向治疗中,肿瘤的优势克隆被消灭,劣势克隆成长为优势克隆,导致肿瘤进展后更快速的进展,从而抵消前期的治疗优势。
从临床研究上看,许多临床研究由于伦理要求,后续都会有交叉(Crossover)的情况发生,交叉又分为两种,一:互相交叉,这种情况建立在研究的对照组是后线治疗的标准治疗;二:交叉到另外一种后线治疗的标准治疗上。无论哪种情况,都增加了OS获益的难度。
参考下图,仅有D,实现了PFS和OS的双重获益。对于ABC这3种情况,虽然不能改变OS,但是我们可以看到PFS的改善,正如OS是长度,PFS是宽度,如果我们不能改变人生的长度,那么改善人生的宽度也是不错的。假如一位患者只能活一年,那么是一个月进展一次换一个药,每个月都担心疾病进展,还是说半年进展一次,让他能够尽可能享受这半年的人生?显然后面更好,这也许就是PFS的意义之一。
- PFS是对疾病的观察,考察的是一个药物或者方案对疾病的控制程度。
- OS是对病人的观察,考察的是药物或者方案对病人总体生存期的影响。
- 经常会有PFS有区别,但OS没有区别,那提示这个方案对疾病有控制,但毒副反应比较大。
- 如果是OS有区别,而PFS没有区别,那么这个方案与对照组虽然在疾病控制上没有很大优势,但毒副反应小,可以提高患者的长期生存。
参考资料
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn