【1.2.2】肿瘤免疫学的计算方法

November 11, 2022 genetalks 阅读量：次

癌症免疫疗法的显著成功，特别是检查点阻断抗体，在一部分患者中重新激活了肿瘤免疫串扰及其在反应异质性中的作用的研究。高通量测序和成像技术可以帮助概括肿瘤生态系统的各个方面。计算方法提供了一系列工具，可以有效地分析、量化和整合从这些不同但互补的高通量数据集中挖掘的肿瘤免疫的多个参数。

一、前言

肿瘤细胞与其微环境中的多种因素和细胞类型相互作用，影响肿瘤动力学、转移能力以及对治疗的临床反应(Binnewies等，2018;Fouad & Aanei, 2017;friedman, Zitvogel, Saute ' s- friedman， & Kroemer, 2017;Joyce & Fearon, 2015)。免疫疗法在包括黑色素瘤、肺癌、头颈癌、肾癌、胃癌和尿路上皮癌在内的多种癌症类型中取得了前所未有的成功，这激发了人们对理解肿瘤免疫相互作用在调节肿瘤进展中的协同作用的兴趣。免疫疗法，特别是免疫检查点阻断(ICB)抗体，在对其反应良好的患者中显示出持久的临床益处。但是，免疫治疗

初始反应率很低(约为20%)，
相关的治疗费用非常高(约为150,000美元/年)
并且缺乏用于患者选择的强大的癌症不可知性生物标志物(Cyriac & Gandhi, 2018)。

目前，fda批准的唯一用于晚期癌症ICB的伴随诊断生物标志物是肿瘤组织中的PD-L1表达水平(基于免疫组织化学)和/或肿瘤微卫星不稳定性(MSI)/DNA错配修复缺陷(dMMR) (Tray, Weber， & Adams, 2018)。尽管推荐在临床决策中使用PD-L1水平或MSI状态作为患者预后的独立生物标志物，但它们导致了不一致的结论(Yi et al .， 2018)。肿瘤与其生存的微环境处于持续的相互作用状态，并且每个患者的肿瘤也非常不同，因此，一个自变量不太可能足以作为生物标志物来预测患者的预后(Bhinder & Elemento, 2017;Blank, Haanen, Ribas， & Schumacher, 2016)。

需要一种多模式的方法，结合肿瘤免疫学的各个方面，来解决未满足的临床需求，选择合适的患者，并最大限度地提高癌症患者护理的成本效益关系。

预测患者对精准癌症疗法（包括免疫疗法）的反应需要了解肿瘤如何逃避免疫监视。有效的抗肿瘤免疫反应需要存在足够数量的功能性免疫效应物和肿瘤相关免疫原性抗原（源自基因组或转录组改变，也称为新抗原）。

这个等式可以在多个层面上被破坏以触发免疫逃逸:(

肿瘤可能没有足够的免疫效应细胞(即肿瘤微环境(TME)没有发炎inflamed
肿瘤微环境发炎但免疫效应细胞功能失调，
肿瘤微环境发炎但新抗原未充分呈现(图1)(Jiang等人，2018;Rosenthal et al, 2019)。

基于这些原则，Rosenthal等人将治疗中性肺肿瘤(TRACERx联盟)分为低免疫逃避组(免疫炎性TME或无免疫逃避证据)和高免疫逃避组(免疫耗尽TME或有免疫逃避证据);免疫逃逸是由HLA-LOH(人类白细胞抗原-杂合性缺失)的存在、细胞抗原加工机制基因的破坏或预测的新抗原缺失决定的(Rosenthal等人，2019)。基于这种分层，该小组表明，免疫逃避低的患者在接受全身治疗后的无病生存期(DFS，disease-free survival)显著延长。

通过量化肿瘤免疫学多个参数的免疫逃避并显示其与 DFS 的关联，本研究强调了在免疫微环境背景下研究肿瘤特征的临床相关性

免疫基因组学研究表明，肿瘤及其免疫微环境在相互选择的压力下持续共同进化。 Rosenthal等人的研究表明，在非小细胞肺癌(NSCLC)中，特定的基因组谱与特定的免疫谱相关，而基因组异质性肿瘤与稀疏的免疫浸润相关，而同质性肿瘤与密集的免疫浸润相关(Rosenthal等人，2019)。Smyrk等研究表明，MSI-H肿瘤与结直肠癌(CRC)中较高的细胞毒性t细胞浸润呈正相关(Smyrk, Watson, Kaul， & Lynch, 2001)。Schwitalle等人从结直肠癌患者和健康供者的肿瘤组织和外周血中分离浸润性t细胞，并采用ELISpot法检测t细胞对移位突变预测的新抗原的反应性;高活性的新抗原特异性t细胞不仅存在于msi -高(MSI-H) CRC患者中，也存在于MSI-H相关突变的健康携带者中，但不存在于msi -稳定型CRC或非MSI-H携带者健康供体中(Schwitalle等，2008)。当新抗原引发的t细胞浸润TME时，肿瘤学会选择高免疫原性的新抗原(Anagnostou等，2017;Riaz et al, 2017;Verdegaal等，2016;Vitale et al, 2019)。

Verdegaal等人对两名接受过继性t细胞治疗的晚期黑色素瘤患者的连续病变进行了分析，结果表明，如果TME中存在新抗原特异性免疫细胞，免疫原性新抗原可能会随着时间的推移而丢失(Verdegaal等人，2016)。据报道，在Nivolumab治疗晚期黑色素瘤患者时，预测的免疫原性突变被选择对抗;与对PD1或CTLA4抗体敏感的非小细胞肺癌肿瘤相比，在耐药的非小细胞肺癌肿瘤中发现了类似的预测免疫原性突变丢失(Anagnostou等，2017;Riaz et al, 2017)。总之，这些证据表明肿瘤的基因组和免疫组成之间存在密切关系，从而使肿瘤具有生长优势

以上所有的例子都表明，肿瘤的研究不能脱离其微环境，必须考虑多种方法来探索肿瘤的整体免疫学。虽然肿瘤免疫学中的实验方法对于真正的机制洞察是必要的，但在发现的初始阶段，它们可能是费力和昂贵的，并且需要前瞻性的规划(如组织收集，储存，试剂，实验设备)。

相比之下，计算方法可以提供更快的替代方案来询问数据模式并制定经验数据驱动的假设，以便稍后进行实验测试。

此外，计算方法还允许对存档数据集进行回顾性分析。在本章中，我们描述了研究肿瘤免疫学主要内容的计算方法。我们提供策略来利用从不同平台获得的大量数据来对 TME 进行全面的表征。以下部分描述了计算方法及其对主要量化肿瘤基因组和转录组谱的重要性：铁汉 15:30:06

使用突变负担和免疫原性改变来研究肿瘤免疫原性，
使用基因表达和表观遗传谱将 TME 解卷积为其组成细胞类型，
使用对免疫浸润进行分类的各种估计，并使用深度学习直接从数字化组织病理学幻灯片评估 TME 内免疫定位的空间背景（图 2）。

我们建议采用本章所述方法的综合多变量方法，对给定癌症队列中的肿瘤免疫学进行全局分析

二、基因组改变和新抗原

2.1肿瘤突变负荷测定

肿瘤突变负担(Tumor mutation burden, TMB)是对给定肿瘤样本中非同义体细胞突变(可能包括插入和缺失)总数的定量度量，归一化为每百万测序区域中覆盖的碱基数量(Chan等人，2019;Melendez et al, 2018;Samstein et al, 2019)。据报道，高TMB与多种癌症(如转移性黑色素瘤、非小细胞肺癌、尿路上皮癌和头颈癌)接受ICB免疫疗法治疗的患者预后改善相关(Chan等，2019;Hellmann et al, 2018;Hugo et al, 2016;Lauss et al, 2017;Le et al, 2015;Miao et al .， 2018;Rizvi等，2015;Snyder et al .， 2014;Van Allen et al, 2015)。

在CheckMate 227研究中，高TMB (10 Mutations/ mb) -无论肿瘤的PD-L1表达水平如何-被证明与单独化疗相比，在接受联合免疫治疗(nivolumab加ipilimumab)的NSCLC患者的一线治疗中，与改善无进展生存(PFS)相关(Melendez等，2018)。这些发现使研究人员提出使用TMB作为免疫治疗的可能伴随诊断。

然而，一项 ICB 临床试验调查显示，即使对于同一癌症类型，不同研究组报告的高 TMB 阈值也不一致（Chan 等人，2019 年；Mel endez 等人，2018 年）。与被视为临床生物标志物所必需的指标不同，对于患者高 TMB 的构成因素，没有通用的金标准。下面讨论了建立高 TMB 的临床相关阈值的关键考虑因素：

选择高通量测序 panel:虽然全外显子组测序(WES)是最常用的TMB定量平台，但较小的成本效益靶向基因面板(例如Oncomine, Foundation Medicine, MSK-IMPACT)也被用于TMB估计(Chan等人，2019;Melendez et al, 2018)。此外，与 WES 和靶向测序相比，全基因组测序可以更大规模地识别基因组变异。通过无浆细胞DNA等微创技术定量TMB的方法也在广泛开发中(Volckmar等人，2018)。随着各种可用的平台和panel不断扩大，不同捕获试剂盒所覆盖的测序区域的变化对TMB计算的影响程度仍有待检验。量化TMB所需的目标panel的最小推荐尺寸估计约为300个基因或1Mb基因组覆盖范围，但WES面板覆盖的基因组区域从39Mb到高达70Mb (Melendez et al, 2018)。即使在目标小组中，测序试剂盒捕获的基因组区域也各不相同，例如，只有50%的MSK-IMPACT基因(靶向468个基因)也被基础医学小组(靶向315个基因)覆盖(Melendez et al, 2018)。此外，用于TMB计算的突变类别可能因测序面板的选择而异，例如，TMB通常使用非同义体细胞突变来计算，但也有报道称将同义突变纳入目标面板的TMB计算中(Chan et al, 2019)。这些因素可能影响TMB测量的特异性。
技术因素:技术因素包括样品收集、文库制备、组织固定方法、污染或降解(例如，DNA断裂和细胞嘧啶脱氨在福尔马林固定石蜡包埋(FFPE)组织中很常见)、肿瘤纯度、测序深度和测序读长(Melendez et al, 2018)。不同实验室的相关实践和专业知识可能有所不同，这可能会影响突变检测的敏感性。例如，测序组织中的低肿瘤纯度可能来自病理学家选择进行宏观解剖的肿瘤区域的选择。此外，采用高读取深度的测序方案可以识别在低等位基因频率下发生的变异，与低读取深度测序相比，这增加了突变检测的灵敏度
数据处理策略的选择:数据分析的变化来自于测序校准器、变量调用工具和下游过滤方法的选择。将原始测序读数与参考基因组对齐的预处理步骤是相当标准的(图3)。一旦数据对齐，应用变体调用工具(variant calling)来识别体细胞突变列表;对所使用工具的偏好在很大程度上仍然是主观的。从不同的变异呼叫者（variant callers）中鉴定出的突变之间普遍存在较差的一致性(Krøiga˚rd, Thomassen, Lænkholm, Kruse， & Larsen, 2016)。因此，独立调用者经常被组合成一致的突变集。例如，癌症基因组图谱(TCGA)联盟描述了一个名为MC3的详细工作流程，以努力协调其数据集(Ellrot等人，2018)。 MC3 是七种不同突变和 Indel callers（MuTect、MuSE、Somatic Sniper、Radia、VarScan2、Pindel 和 Indelocator）的组合，用于从配对肿瘤正常组织 (Ellrot) 的 WES 中获得≥2个callers 一致的突变列表（2018）。建议在MC3管道中进行下游过滤的步骤包括:(a)设置最小等位基因读取深度的阈值以保留变体，(b)从样品污染(使用称为ContEst的工具)或DNA降解(使用称为OxoG的工具)中识别和去除预测的伪影，(c)排除在捕获试剂盒未覆盖的基因组坐标中识别的假阳性，以及(d)使用正常面板(PoN，Panel of Normals )来限制平台特定的测序伪影。MC3管道作为一个dockerized软件包公开提供，供科学界使用(Ellrot et al, 2018)。此外，dbSNP、1000 Genomes project和ExAC等数据库已被用于筛选常见的种系变异。虽然WES的突变分析通常是使用配对的肿瘤正常组织进行的，但配对的正常组织大多不会对目标小组进行测序，因此过滤可能是种系变异的假阳性对目标小组来说变得更加重要。在使用公开可用的数据库时，需要注意的是，非欧洲血统的个体代表性不足，这限制了对种族特定生殖系变异的识别，因此可能导致对癌症基因组中假定的体细胞变异的夸大(Garofalo et al, 2016)。

突变负荷的异质性（Heterogeneity in mutation load）:每个肿瘤的突变总数在不同癌症和同一癌症类型内可能相差高达1000倍(Chalmers等人，2017;Chan等人，2019;Lawrence et al, 2013)。Samstein等人对ICB治疗的多种癌症类型(n-10)进行了靶向小组(MSK-IMPACT)测序，发现不同癌症类型的高TMB (TMB分布的前20%)的截止值显著不同，例如CRC、膀胱癌和乳腺癌的TMB截止值分别为52.2、17.6和5.9 (Samstein等人，2019)。在本研究中，针对每种癌症类型单独计算的高TMB阈值仅与10种癌症类型中4种癌症的总生存率(OS)显著提高相关(Samstein等人，2019)。
肿瘤的高易变性(Hypermutability in tumors ):由于DNA修复基因(包括MLH1、MSH2、MSH6和PMS2)的突变导致高MSI或dMMR缺陷，肿瘤的一个子集，无论癌症类型如何，都可以积累非常高的突变数量。在一项泛癌症分析中，Chalmers等人报告称，16%被确定为超突变的肿瘤也具有高MSI (Chalmers等人，2017)。具有 MSI-H 表型的肿瘤还与肿瘤免疫学 ICB 中 217 种计算方法的临床反应改善相关。例如，MSI-H结直肠癌患者从派姆单抗中表现出如此持久的临床益处，以至于FDA批准该药物用于任何具有MSI-H/dMMR缺陷表型的转移性实体肿瘤(Hellmann等人，2018;Le et al, 2015;Marcus et al, 2019)。由于并非所有的高突变肿瘤都是MSI- h，因此将MSI状态与TMB相结合以改善患者反应分层的多变量模型仍有待检验

2.2 来自基因组改变的新抗原

新抗原是肿瘤相关的突变肽，可被患者的免疫系统识别为非自体。免疫原性新抗原绕过胸腺中枢和外周耐受，可以使患者的免疫细胞产生抗肿瘤免疫反应。某些免疫原性新抗原在患者中的流行不仅推动了免疫疗法(特别是ICB)的前所未有的临床成功，而且也是开发过继性t细胞疗法和肽疫苗的基础(Aurisicchio等人，2019;Kalaora等人，2018;Keskin et al, 2019)。在癌症中，新抗原产生于患者基因组的改变，这种改变被成功转录并最终翻译和加工成突变的肽序列;当这种肽出现在肿瘤细胞表面时，会被细胞毒性T淋巴细胞识别，从而触发目标肿瘤细胞的裂解。决定肿瘤相关新抗原的免疫原性有两个基本组成部分: 铁汉 15:32:03

突变肽被加工并与主要组织相容性复合体(MHC)结合的能力，也称为人类白细胞抗原(HLA)，用于呈递;
呈递的新抗原被t细胞受体识别的能力，用于细胞毒性免疫反应。

其中，利用计算方法从高通量测序数据集中预测推定的新抗原，对前一个成分进行了最广泛的探索和广泛的研究

完整的新抗原预测工作流程从用户提供的给定基因组变体列表开始，以预测算法提供的排名新抗原列表结束，现在可以作为完全自动化的软件包使用，可以轻松地应用于全外显子组测序数据集。华盛顿大学医学院的一个基因组学团队首次发布了一套广泛的新抗原发现综合工具，称为pVAC-Seq。目前，研究界也可以轻松访问来自多个其他中心的类似自动化软件包，并且可以使用这些资源的汇编列表。无论来源如何，新抗原发现的三个关键步骤在所有方案中保持一致，具体如下:

推断患者的HLA基因型:有两大类高度多态性的HLA等位基因:一类(HLA- a, HLA- b, HLA- c)结合8-10个氨基酸长度的肽，来源于细胞内蛋白，呈递给CD8+ T细胞;II类(HLA-DR, HLA-DP, HLA-DQ)结合长度为13-25个氨基酸的更长的肽，来源于内吞噬的细胞外蛋白，呈递给CD4+ T辅助细胞(Dimitrov, Garnev, Flower， & Doytchinova, 2010;Gowthaman & Agrewala, 2008)。直接从患者测序数据(WES和RNAseq)推断HLA I类等位基因的计算方法已经成熟，并且在其他地方可以获得这些工具的完整列表(Finotello, Rieder, Hackl， & Trajanoski, 2019)。Optitype和Polysolver是两种最常用的四位数HLA I类分型工具。与第一类不同，由于两个主要挑战，强大的HLA第二类预测工具的开发并不成功:(a)由于HLA II类具有开放的结合槽，因此可以与该复合物结合的肽的长度是高度可变的(13-25个氨基酸)和动态的(虽然肽中只有9个氨基酸实际上占据了结合位点，但结合核心侧面的氨基酸也影响肽-HLA结合);(b)缺乏足够的数据集来训练预测模型。因此，流行的工作流程集中于HLA I类限制新抗原预测(Dimitrov et al, 2010; Finotello, Rieder, et al, 2019; Gowthaman & Agrewala, 2008).
提取所有可能包含突变的肽:提取突变周围的核苷酸序列并翻译成相应的肽序列。步长为1个氨基酸，窗口大小为n个氨基酸(其中n通常为HLA I类的8-11个氨基酸)，生成包含改变氨基酸的所有可能的n-聚肽。一般来说，对于一个错义突变，提取所有可能的长度为n的突变肽所需的总核苷酸长度可以计算为(2n-1)*3。制备肽的一个重要考虑因素是保留突变基因的翻译开放阅读框(ORF)，除非突变引入了一个移码，破坏了规范的ORF，在这种情况下，具有新阅读框的肽被翻译，直到遇到下一个停止密码子。因为移码突变改变了ORF，仅仅一个移码突变——与点突变不同——就可以产生几种可能与自身更不相似的新肽(Turajlic等，2017)。另一方面，不同的体细胞或种系变体可能位于具有单倍型特异性连锁（同相）的感兴趣突变的紧密序列附近。因此，在不考虑这些近端变异的情况下预测的突变肽不会模拟肿瘤中实际翻译的肽，从而影响新抗原预测的准确性(Hundal等人，2019;Wood et al, 2019)。 Hundal等人检查了来自7种癌症类型的430个肿瘤中与感兴趣的错义突变共同发生的近端变异，并估计5.1%的错义突变具有同期近端变异(Hundal等人，2019)。他们还发现，忽略同期近端变异（in-phase proximal variants）导致新抗原总体假阳性预测率为6.9%，假阴性预测率为2.6% (Hundal et al, 2019)。
预测肽与HLA复合物的结合亲和力:一旦从步骤2中收集了所有可能的肽，使用任何现成的新抗原预测工具测试这些肽与推断的HLA I类复合物的结合亲和力。通常的做法是使用<500nM的结合亲和力(IC50)阈值来选择候选新抗原(IC50 <50nM的肽被认为是强结合物)。现有的新抗原预测工具基于以下算法之一:(1)人工神经网络(NetMHC、MHCflurry、EDGE)，(2)深度卷积网络(HLA-CNN、DeepSeqPan)，(3)位置特异性评分指标(PSSMHCpan、MixMHCpred)，以及(4)随机森林分类器(ForestMHC) (Finotello, Rieder等，2019)。在这些工具中，NetMHC (v4, v3或NetMHCpan)已被最广泛地用于新抗原预测。铁汉 15:32:28

2.3 新抗原的优先排序

单一的免疫原性新抗原能够在接受ICB治疗的患者中引起强烈的临床反应;最近的一个案例研究证明了这一点，该案例研究对PD1抗体有特殊反应，其中来自新基因融合的一种免疫原性新抗原导致了显著的肿瘤消退(参见第3.1节)(Yang et al, 2019)。预测的肿瘤相关新抗原数量与突变总数之间存在线性正相关，因此通过关联可以预测一个肿瘤样本的数百个候选新抗原。然而，实验测试表明，这些预测的新抗原中只有一小部分（<1%）能够引发免疫反应（McGranahan 等人，2016 年；van Rooij 等人，2013 年；Yadav 等人，2017 年；Yang 等人），2019）。

因此，在计算机上从大量预测的新抗原中识别单一的高免疫原性新抗原类似于大海捞针，有效的计算方法是有限的。

研究人员已经确定了新抗原的一些特征，这些特征可能是预测新抗原初步优先排序的有用参数，解释如下:

免疫原性新抗原的结合亲和力阈值:如2.2节所述，NetMHC是已发表研究中最常用的新抗原预测工具;netMHC通过人工神经网络进行训练，预测新抗原与患者MHC I类或II类等位基因的结合亲和力(IC50)。IC50阈值<500 nM已被确立为选择候选新抗原的金标准。这个阈值最初是在1994年关于病毒抗原的报道中提出的;研究人员在转基因小鼠和急性肝炎患者的pbmc中测试了HBV衍生病毒抗原对HLA-A*0201的免疫原性，发现结合亲和力<500 nM，最好<50nM的表位能够引发细胞毒性t细胞应答(Sette et al, 1994)。但该阈值在肿瘤模型系统中没有得到广泛的验证，而是广泛应用于癌症新抗原预测研究。预测为弱结合物的肿瘤来源新抗原，包括ic50远高于500nM临界值的肿瘤来源新抗原，已被证明可在体内引发可检测到的t细胞反应，这表明不需要严格遵守阈值以排除候选肽(Duan et al, 2014)。
免疫原性新抗原差异亲和性指数(Differential agretopicity index): 为了评估预测的新抗原与其未突变的野生型肽的差异程度，Duan等人引入了差异亲和性指数(DAI)。 DAI被定义为突变肽与其野生型对应肽的结合亲和力之差(Duan et al .， 2014)。Duan等人首先从BALB/c和MethA小鼠模型的RNA序列中发现的突变中预测了MHC I类限制性新抗原。根据预测的结合亲和力(来自NetMHC v3.0)或DAI选择排名靠前的新抗原;合成经该策略筛选的新抗原并注射到小鼠模型中，研究免疫1周后对肿瘤生长的影响。该小组发现，与仅根据结合亲和力选择的新抗原（0/18 肿瘤保护性新抗原）相比，基于 DAI 选择的新抗原显示出更高的肿瘤排斥率（10/48 肿瘤保护性新抗原）（Duan 等人，2014）。此外，Ghorani 等人还表明，每个肿瘤的平均 DAI 较高与 TCGA 晚期黑色素瘤和肺癌队列中 OS 的改善相关
预测新抗原的表达:为确保预测的新抗原在肿瘤细胞中转录和表达，应将新抗原相关基因的肿瘤特异性表达水平纳入预测工作流程，表达水平较高的新抗原可被赋予更高的优先级。与预测的新抗原对应的基因组位点上的拷贝数损失也可以用作新抗原去优先级的额外过滤器。
基于新抗原序列的考虑:序列与自身抗原相似的新抗原不太可能具有免疫原性，因为对自身有反应的t细胞会被中央耗尽或外周耐受。因此，与已知人类肽序列高度相似的预测新抗原很可能是非免疫原性的(Łuksza等人，2017;Snyder et al .， 2014;Wood et al, 2018)。相反，预测的与已知病毒表位序列高度相似的新抗原最有可能是免疫原性的;这种序列相似性可以很容易地通过针对已知病毒肽数据库(如国际表位数据库(IEDB))的新抗原序列的蛋白- blast发现(Bubie, Gonzalez-Kozlova, Akers, Villanueva， & Losic, 2019;Łuksza等人，2017;Snyder et al .， 2014;Wood et al, 2018)。突变氨基酸在新抗原内的位置也可能在其免疫原性中发挥重要作用，无论突变残基是位于影响新抗原- mhc结合的锚位点(2和9)，还是位于影响新抗原- t细胞结合的反应性t细胞可接近的溶剂暴露区域(3-7)(Wood等，2018;Yadav et al, 2017)
新抗原的克隆性:从测序肿瘤中鉴定出的突变可以是克隆的(存在于所有肿瘤细胞中)或亚克隆的(存在于肿瘤细胞的一个子集中)。基于肿瘤纯度和倍性的参数，可以使用计算方法(如ABSOLUTE, PyClone, CHAT, PhyloWGS)来确定肿瘤中鉴定的突变的克隆性(也指相关新抗原的克隆性)。同一肿瘤内具有不同基因组谱的克隆和亚克隆群体构成肿瘤内异质性(ITH, intra-tumor heterogeneity )。低 ITH 的肿瘤（即更同质的肿瘤）已被证明与改善的 OS、更高的免疫细胞溶解活性和更密集的 CD8 T 细胞浸润水平相关（Rosenthal 等，2019；Wolf 等，2019）。在 McGranahan 等人的一项回顾性研究中，按具有高克隆新抗原负荷（位于上四分位数）加上低 ITH (<1%) 的肿瘤划分的患者群体与肺癌 OS 改善、PD1 抗体治疗的晚期黑色素瘤 OS 改善相关，与仅通过高新抗原负荷隔离患者群体时相比，CTLA4 抗体治疗晚期黑色素瘤的 PFS 和 PFS (McGranahan 等人，2016)。在有限的实验测试中，研究小组发现，来自患者 PBMC 的扩增 CD8+ T 细胞仅识别克隆新抗原；尽管也有可能存在对亚克隆新抗原有反应的 T 细胞，但低于可检测水平 (McGranahan 等，2016)。这些发现以及关于高克隆新抗原负荷与改善的 ICB 反应之间相关性的其他报告表明，根据新抗原的克隆性确定优先顺序是一种合理的策略（Miao 等人，2018 年；Rosenthal 等人，2019 年）。
新抗原适应度模型:新抗原适应度模型最近被开发为基于其新抗原库的免疫原性评估肿瘤克隆整体适应度的指标(Balachandran等人，2017;Łuksza et al .， 2017)。该模型将新抗原质量定义为新抗原振幅(a)和t细胞识别潜能(R)的乘积。振幅A计算为新抗原与其配对的野生型肽的预测结合亲和力之间的折叠变化。根据新抗原与已知病毒表位的序列相似性计算识别电位R。较高比例的高质量新抗原(中位数为>)被证明与来自TCGA的胰腺癌患者的OS改善相关(Balachandran等，2017)。新抗原质量也用于确定肿瘤适应度为:阴性(最大(A*R))在克隆中迭代所有新抗原后。同一组还表明，在接受ICB治疗的黑色素瘤和肺癌患者中，高肿瘤适应度与较差的OS相关(Łuksza et al .， 2017)。然而，另一个研究小组的工作无法复制TCGA中更高质量的新抗原与黑色素瘤和肺癌患者OS改善之间的显著关联(Balachandran等人，2017)。我们假设新抗原质量和适应度模型仍然需要在更广泛的癌症数据集中独立验证。铁汉 15:32:45

三、转录组衍生的新抗原 Transcriptome derived neoantigens

癌症驱动的染色体重排(染色体内或染色体间)和异常剪接事件也可以产生肿瘤特异性新抗原。新抗原发现的基本步骤与2.2节和2.3节中描述的基因组改变相同。此外，下面描述的一些研究使用先前发表的质谱数据集，使用SEQUEST、MSGFPlus或SearchGUI等工具对新抗原肽进行了计算验证，以确定新抗原的优先级(Kahles等人，2018;Smart等人，2018;Wang, Wang, Alam, Hoeppner， & Yang, 2019)。这些方法验证了预测的新抗原是否被翻译和/或与给定的HLA复合物结合，但该新抗原的免疫刺激特性仍需要测试。虽然本节的重点是转录组衍生的新抗原，但必须指出的是，疾病特异性翻译后修饰(PTMs)在新抗原产生中的作用也正在研究中(Anderton, 2004;Cobbold et al .， 2013;Hosen等人，2017;Kumai et al .， 2014)。ptms -如磷酸化、乙酰化、脱酰胺化、糖基化-可以改变肽的免疫原性，即改变肽与MHC复合物或t细胞受体(TCR)的结合亲和力，或者可能改变细胞表面蛋白的构象，从而暴露先前被蛋白质天然确认所隐藏的表位(Anderton, 2004;Cobbold et al .， 2013;Gan, Burgess, Clayton， & Scott, 2012;Hosen等人，2017;Kumai et al .， 2014)。

3.1 来自基因融合的新抗原

基因融合是由染色体重排产生的杂交转录本;这些杂交转录物可以形成新的非自体肽，可能具有免疫原性。在Yang等人报告的一项案例研究中，一种与融合相关的新抗原非常有效，以至于它独立地驱动了头颈癌患者对PD1抗体的异常反应(Yang等人，2019)。这是特别有趣的，因为患者没有ICB反应性的典型肿瘤特征，即患者没有驱动突变，没有显着的拷贝数改变或结构变异，TMB低，免疫浸润差，PD-L1染色评分为阴性。然而，患者有一个驱动基因融合(DEK - AFF2)，通过RNA测序在原发肿瘤中发现，并通过荧光原位杂交(FISH)在肿瘤组织中证实。

为了研究该融合体的免疫原性，提取了从该基因融合体翻译的所有可能的九个氨基酸长肽以及其他DNA突变，并使用NetMHCpan v.4.0预测它们与HLA I类等位基因的结合亲和力。合成这些肽并在 ELISpot 测定中测试肽特异性 T 细胞反应性。在所有测试的肽中，只有融合相关新抗原（DKESEEEVS）被发现具有强烈的免疫刺激作用。

对该患者的 PBMC 进行的 TCR-Vβ 深度测序证实了该融合肽特异的 TCR 克隆富集，在治疗前未发现，但在治疗中检测到高水平（Yang 等人，2019）。这项详细的研究优雅地证明了融合相关新抗原在驱动反应中的作用

像移码突变一样，框外融合（out-of-frame fusions）也可能产生许多新的多肽，这些多肽可能与自身更不相似。

框内融合产生的新肽仅限于连接区域，而框外融合产生的新肽，由于连接处密码子的移动，可以延伸到第一个下游过早停止密码子。融合新抗原预测的第一步是从RNA序列中识别基因融合，目前已有几种工具可以做到这一点。

Yang等人在他们的研究中使用了FusionCatcher来鉴定高免疫原性基因融合(Yang et al, 2019)。Rathe et al adopted a more integrated approach to identify fusions in osteosarcoma; they selected a set of fusions that overlapped between fused transcripts identified from deFuse and denovo transcripts identified from Trinity (Rathe et al, 2019).。Gao等人开发了一种应用于泛癌的策略，系统地合并了三种融合工具(STAR-Fusion、EricScript和Breakfast)的融合结果(Gao et al, 2018)。遵循一系列规则来组合结果，包括:(a)保留2工具鉴定的融合(除了在STARfusion中因其高灵敏度而鉴定的融合)，(b)需要至少5个分裂读取来支持融合，(c)删除多种癌症中10样品中具有相同断点的融合，(d)删除也在TCGA正常样品，GTEx样品或非癌细胞中鉴定的融合，以及(e)删除与未表征基因，免疫球蛋白，线粒体基因相关的融合，以及同一基因或基因相似物中的融合。对于融合新抗原预测的实际步骤，也可以使用自动化管道，INTEGRATE-neo是最早发表的管道之一(Zhang, Mardis， & Maher, 2017)。INTEGRATE-neo的工作流程首先是使用一个名为INTEGRATE的内部工具来识别基因融合，该工具可以预测所有新的融合连接。50个基因融合伙伴的ORF被保留以翻译融合的转录物。新抗原预测的后续步骤原则上类似于 2.2 节中描述的步骤。

除了 INTEGRATE-neo、NeoepitopePred、pVACfuse 和抗原。Garnish还能够发现融合新抗原（Hundal 等人，2016；Wood 等人，2019）。

对融合衍生的新抗原的研究产生了一些有趣的观察结果。在泛癌症分析中，融合新抗原在免疫微环境缺失的肿瘤(即白细胞含量较低和CD8A表达较低)或HLA等位基因缺失(HLA- loh)的肿瘤中被发现的频率更高(Rathe等人，2019;Yang et al, 2019)。此外，含有驱动融合体的肿瘤也与较低的突变负担相关(Gao等人，2018)。总的来说，肿瘤中的免疫原性融合物是一类令人兴奋的临床相关新抗原。铁汉 15:32:46

3.2可选剪接事件产生的新抗原

异常剪接事件包括外显子或内含子的产生，内含子保留，外显子跳跃，或新的末端开始，和结束可能产生新的肽。

已经发表了几种从RNA序列中鉴定备选剪接相关新抗原的策略。Kahles等人报道了一种方法来识别选择性剪接事件，重点关注新的外显子-外显子连接，并将其应用于TCGA的所有癌症队列(Kahles等人，2018)。

简单地说，使用STAR比对器将测序的reads与人类基因组对齐(带有重新创建无注释连接索引的参数)，对齐的reads用于增加剪接图(来自SplAdder工具包)，其中包含支持每个备用连接的reads的数量。为了鉴定肿瘤特异性的新连接，在正常组织(来自TCGA和GTEx)中也鉴定了剪接变异体。发现交替剪接事件在肿瘤组织中的发生率远高于正常组织(Kahles等，2018)。

接下来，提取这些新的外显子-外显子剪接连接周围的核苷酸序列并翻译用于新抗原预测。

在另一项工作中，Smart等人发表了一项策略，用于识别接受ICB治疗的黑色素瘤患者体内内含子保留产生的新抗原(Smart等人，2018)。RNA测序reads与使用Kallisto构建的扩增hg19基因组(即同时包含外显子和内含子序列)进行比对，使用KMA (k-mer alignment)算法鉴定保留的内含子位点。对于每个保留的内含子位点，从UCSC Table Browser中获得核苷酸序列和ORF取向，并翻译成所有可能的9-10个氨基酸的长肽。去除与已知人类参考蛋白质组或正常皮肤组织蛋白质重叠的肽。剩余的肽被翻译用于新抗原预测。本研究中鉴定的内含子保留新抗原的数量与体细胞突变衍生的新抗原的数量没有显着相关性。此外，内含子新抗原负载既不与 ICB 的临床益处相关，也不与细胞溶解标记物 GZMA 或 PRF1 的表达相关。这些发现表明，必须研究可变剪接新抗原的质量而不是数量来了解其临床意义

在已知剪接位点附近的DNA突变可以破坏规范剪接位点，从而产生新的替代剪接位点。这种剪接产生突变(SCMs)正在形成一个新抗原发现的新领域。Jayasinghe等人介绍了一种名为MiSplice的方法(作为一套Perl程序可用)，该方法应用于癌症，用于识别可能由DNA突变(即scm， splice site-creating mutations)产生的RNA序列转录本中的新剪接位点(Jayasinghe等人，2018)。MiSplice首先识别突变20 nt内的所有剪接连接，过滤掉典型连接，然后通过MaxEntScan对剩余的新连接的剪接位点强度进行评分。通过比较病例(即具有该突变的样本)与对照(即没有该突变的样本)之间支持新连接的读取数，进一步过滤新连接。与最后一组新的剪接连接相对应的突变被鉴定为SCM，通过该分析，Jayasinghe等人报道，TCGA队列中26%和11%的SCM突变先前分别被错误标记为错义和沉默。通过计算新抗原预测方法，作者还报道了SCMs可以产生具有更高预测免疫原性的新抗原，从而为新抗原发现提供了一个新的领域

四、从转录组学估计免疫浸润

4.1 用于TME虚拟解剖的反卷积工具

免疫组织化学(IHC)、免疫荧光、流式细胞术和质量细胞术等实验技术传统上用于检测TME的组成。随着来自各种癌症类型的大量转录组学测序数据的可用性，通过计算方法对TME进行虚拟解剖现在成为可能。TME的反卷积构成了其独特的驻留或浸润细胞类型的识别和定量。与实验技术相比，计算方法提供了成本、时间和劳动力的有效优势，并且这些方法可以应用于来自大块肿瘤的新的和遗留的表达谱。已经发布了大约 47 种基于不同数学模型的不同反卷积方法（表 1），其中两个工具（EPIC 和 quanTIseq）是专门针对 RNA seq 数据集开发的。这些方法使用基因标记列表（寻找标记基因的富集）或表达谱（将大量组织谱解构为其组成细胞类型谱的线性加权和）。

虽然计算反卷积揭示了不同免疫细胞类型与患者反应之间的疾病特异性关联(Gentles等，2015;Şenbabaog × lu et al .， 2016)，用于反卷积的工具确实有一些局限性(Avila, Vandesompele, Mestdagh， & De Preter, 2018;Finotello & Trajanoski, 2018;Mohammadi, Zuckerman, Goldsmith， & Grama, 2017)。可能混淆细胞类型估计的一些因素包括多重共线性(即，分离具有相同谱系的密切相关的细胞类型)，由于细胞类型的mRNA组成变化而对某些细胞类型的偏倚，参考细胞类型的可用性有限或组织的肿瘤纯度高。参考签名的质量决定了反褶积的鲁棒性。通过对纯化的细胞类型表达谱进行差异基因表达分析，构建参考特征;选择具有最小组内变异和最大组间变异的基因。一些较新的方法还描述了从参考剖面中迭代选择最具信息量的反卷积标记(Jew等人，2019;Li et al, 2016)。虽然大多数反褶积方法的参考签名最初是为微阵列开发和验证的，但它们对RNA序列的系统验证是缺乏的。为了最大限度地减少大量组织和参考签名之间的不一致性，已经建立了quanTIseq工具，在实际反褶积之前，首先使用其标准协议重新处理大量RNA序列的原始测序读数(Finotello等人，2019)。

目前的趋势表明，使用单细胞剖面来构建反褶积的参考签名是一种转变(Frishberg等人，2019;Jew等人，2019;门登、马鲁夫、达尔米亚、休廷克和波恩，2019;Newman等人，2019;Wang, Park, Susztak, Zhang， & Li, 2019)(表1)。使用单细胞表达谱作为参考的方法包含规范化步骤以减少跨平台差异;这些步骤包括使用ComBat在大块组织和参考剖面之间进行批量校正，或将从参考剖面学到的线性变换应用于大块组织(Finotello & Trajanoski, 2018;Jew等人，2019;Johnson, Li， & Rabinovic, 2007;Li et al .， 2016;Newman et al, 2019)。

表1 铁汉 15:32:58

4.2 将肿瘤分类为广泛的免疫簇

基因表达谱已被用于将肿瘤分类为广泛的免疫类别，这可以用来理解免疫逃避的潜在机制，并可能解释对免疫疗法的耐药性。许多已发表的研究使用基于基因特征的聚类方法来识别癌症中的免疫和/或基质细胞簇，并研究它们与临床结果的关联(Charoentong等，2017;Danaher等，2017;Iglesia等，2016;Jiang等，2018;Prat et al, 2017;Şenbabaog × × lu等，2016)。无监督的NMF也被用于从胰腺癌和肝癌的表达谱中识别新生免疫和基质成分(Moffitt等人，2015;Sia et al .， 2017)。

所选择的方法描述如下

t细胞炎症与衰竭分类（T-cell inflamed versus depleted classification:）:Spranger等人使用聚类方法将转移性黑色素瘤肿瘤分为热(t细胞炎症)组或冷(t细胞衰竭)组(Spranger, Bao， & Gajewski, 2015)。将无监督分层聚类(K=12和欧几里得距离)应用于黑色素瘤表达谱，并选择具有已知t细胞标记基因的子簇进行共识聚类(“ConsensusClusterPlus”R包，2000次迭代，80%黑色素瘤肿瘤重采样，欧几里得距离)，从而鉴定出稳定的热肿瘤和冷肿瘤簇。对高温肿瘤和低温肿瘤差异表达基因的通路分析显示，低温肿瘤中β-catenin信号通路上调。利用具有活性β-catenin信号的小鼠黑色素瘤模型，研究人员证实，这一途径确实与t细胞浸润不良有关，通过抑制树突状细胞的机制驱动;小鼠模型中树突状细胞的重建逆转了对PD1和CTLA4抗体的抗性(Spranger et al, 2015)。类似的聚类方法也被用于对结直肠癌和尿路上皮癌的热/冷肿瘤进行分类和研究(Sweis等，2016;Xue et al, 2019)。
癌症中六种免疫亚型的识别（Identification of six immune subtypes in cancer:）：在一项泛癌 TCGA 研究中，Thorsson 等人应用监督聚类方法将 9126 个肿瘤分为 6 种免疫亚型（Thorsson 等人，2018）。首先，收集了 83 个已发表的已知与癌症免疫活性相关的表达特征，并将其用作计算所有 TCGA 肿瘤中特征特异性 ssGSEA 评分的参考。然后将 ssGSEA 分数转换为其 Spearman 相关性矩阵，并将加权基因相关网络分析 (WGCNA) 应用于该矩阵。然后使用基于模型的聚类方法(称为mclust)评估每个WGCNA模块中最具代表性的签名的预测强度，然后进行专家手动检查;这产生了最后一组5个健壮签名。其次，为了选择TCGA队列的最佳免疫群数(K)，将mclust迭代应用于21个随机肿瘤样本子集的归一化ssGSEA评分(重采样50%)。在每个聚类模型中选择最大贝叶斯信息标准(BIC)的最优K，并在6个聚类解决方案中确定平均K。最后，使用k¼6，将mclust模型拟合到256个随机重采样的TCGA肿瘤子集(重采样率为50%);对所有聚类结果进行共识聚类(“clue”R包)，得到最终的聚类分配。这导致将整个TCGA队列分为六种免疫亚型中的任何一种，他们称之为:伤口愈合，IFN-γ优势，炎症，淋巴细胞枯竭，免疫沉默和TGF-β优势。每种免疫亚型与不同的基因组图谱、调节网络和生存益处相关;相对于伤口愈合组，炎症组与显著改善的OS相关(Thorsson等，2018)。
免疫表型(Immune-phenotypes):在Tamborero等人的一项泛癌症研究中，计算了来自29种不同癌症类型的9174个实体瘤的16个免疫细胞的GSVA富集评分(Tamborero等人，2018)。等级聚集聚类(欧几里得距离，病房链接)应用于这些分数与更高的权重分配给细胞毒性细胞。这导致鉴定六个广泛的免疫簇与不同水平的细胞毒性含量;这些集群被称为免疫表型。每种免疫表型与独特的突变谱和细胞途径相关;在测试的3/29种癌症类型(子宫内膜癌、肾上腺癌和乳腺癌)中，与OS显著改善相关的免疫表型细胞毒性增加(Tamborero等人，2018)。铁汉 15:33:04

4.3 综合免疫评分和免疫治疗反应的预测因子

从肿瘤的大量基因表达谱中量化免疫内容并提供汇总分数的测量方法如下:

细胞溶解评分(CYT, Cytolytic score): Rooney, Shukla, Wu, Getz, and Hacohen(2015)首次将CYT定义为介导细胞溶解的基因(GZMA和PRF1)表达的几何平均值，用于量化18种癌症类型中肿瘤相关的细胞溶解活性;发现CYT与新抗原负荷以及抗原呈递机制基因突变呈正相关，这可能是肿瘤免疫逃避的内在机制(Rooney et al, 2015)。在晚期黑色素瘤中，对CTLA4抗体有反应的患者治疗前CYT水平明显高于对CTLA4抗体无反应的患者，但在对PD1抗体有反应的肿瘤中未发现类似的模式(Hugo等人，2016;Van Allen et al, 2015)。最近一项针对36种血液恶性肿瘤的免疫景观研究进一步扩大了CYT作为5个基因(GZMA、GZMH、GZMM、GNLY和PRF1)的几何平均值，这些基因捕获了CD8+细胞毒性T淋巴细胞和自然杀伤细胞的丰度(Dufva et al .， 2019)。
先天抗pd -1耐药(IPRES,Innate anti-PD-1 resistance ): Hugo等人描述了一种称为IPRES的转录特征，用于对PD1抗体反应性黑色素瘤患者进行分层(Hugo等人，2016)。首先，他们对各种现有的基因集进行取样，以选择与反应显著相关的基因集。为此，计算每个肿瘤样本中每个基因集的GSVA富集分数;选择应答者与无应答者GSVA评分绝对中位数差10% (FDR差25%)的基因集作为IPRES特征的核心基因集。其次，对每个基因集的所有样本的IPRES基因集的GSVA评分进行标准化(使用z-score)。对给定肿瘤的所有z分数取平均值，得出每个肿瘤一个IPRES富集分数。与IPRES富集的肿瘤相比，IPRES缺失的肿瘤显示出更高的生存率。
免疫评分:Charoentong等人开发了一种预测ICB反应的评分，称为免疫评分(Charoentong等人，2017)。使用TCGA表达队列，作者利用各种免疫相关特征训练了一个随机森林分类器，用于每种癌症类型的高和低细胞溶解活性。采用袋外交叉验证方法对最具预测性的特征进行排序和选择;最终的特征包括来自四个免疫类别的代表性基因:MHC基因(如HLA-A)、免疫调节剂(如PD1)、免疫效应器(如CD8+ t细胞)和免疫抑制因子(如Tregs)。获得每个预测特征的样本归一化表达值（z 分数）（对于细胞类型，计算定义细胞类型的元基因的平均 z 分数）。计算对应于四个免疫类别中的每一个的 z 得分的加权平均值，然后将这四个聚合的 z 得分相加并在 0 到 10 之间缩放以给出每个样本的免疫表型得分。研究发现，免疫表型评分与 TCGA 三分之一癌症类型的 OS 显着改善相关。据报道，与 CYT、突变负荷和检查点基因（PD1、PD-L1、CTLA4）表达相比，免疫表型评分是 ICB 反应（AUC=1）的更好预测因子，所有这些均经过独立测试（Charoentong 等，2017）。
免疫预测评分(IMPRES): Auslander等人开发了用于神经母细胞瘤的IMPRES，用于对肿瘤进行自发消退和进展分类;该模型后来被应用于265个已发表的用ICB治疗的转移性黑色素瘤样本(Auslander et al, 2018)。获得了28个选定免疫检查点基因的分位数归一化表达水平之间的两两二进制逻辑关系(即，如果基因i的表达<基因j，则1，否则0)。通过贪婪(爬坡)聚合特征选择(500次迭代，五次交叉验证)程序，从这些两两值中识别出大多数反应的预测特征;选出了15个得分一直很高的特征。利用这些特征，将每个肿瘤样本的1分总数(范围0-15)计算为IMPRES评分。在接受ICB治疗的转移性黑色素瘤患者中，高IMPRES评分(bb0队列中位数)与OS改善呈正相关。发现公开可用的ICB数据集的IMPRES预测精度(AUC)在0.77-0.96之间(Auslander et al, 2018)。
肿瘤免疫功能障碍和排斥（TIDE）评分：肿瘤可以采用导致免疫排斥的机制，从而使低水平的免疫细胞浸润 TME，或者使免疫细胞处于功能障碍状态。基于这一概念，Jiang 等人描述了 TIDE 框架，用于识别 (a) T 细胞功能障碍和 (b) T 细胞排斥的癌症特异性基因特征（Jiang 等人，2018）。对于 T 细胞功能障碍特征，细胞毒性 T 淋巴细胞 (CTL) 水平首先量化为 CD8A、CD8B、GZMA、GZMB 和 PRF1 的平均表达水平。然后应用乘法 Cox-PH 生存回归模型来识别个体基因表达水平与 CTL 水平之间的相互作用，以便选择能够显着降低高 CTL 与改善患者生存之间正相关的基因。然后将每个基因的TIDE功能障碍评分定义为生存模型的相互作用系数d除以其标准误差。对于t细胞排斥特征，作者从纯化的免疫抑制细胞类型(即癌症相关成纤维细胞、髓源性抑制细胞和肿瘤相关巨噬细胞M2)的基因表达(微阵列)谱中获得了这种特征。为了研究TIDE评分是否能预测ICB反应，作者将肿瘤分为高或低CTL水平(阈值¼平均CTL):(a)对于CTL高的肿瘤，计算肿瘤基因表达谱与t细胞功能障碍特征之间的Pearson相关性;(b)对于CTL低的肿瘤，计算肿瘤基因表达谱与t细胞排斥特征之间的Pearson相关性。缩放和合并这些Pearson相关性提供了TIDE预测分数。作者声称，与一些现有的反应预测标准(如PD-L1表达、突变负荷)相比，他们的TIDE预测分数对ICB治疗的黑色素瘤患者的反应给出了更好的预测准确性(AUC¼0.80)。然而，目前使用TIDE对免疫治疗的反应预测仅限于黑色素瘤和非小细胞肺癌。作者还要求将输入的肿瘤表达谱归一化为相关的正常组织谱或混合癌症表达谱
IFN-γ相关t细胞炎症评分:默克公司测试了一种18基因t细胞炎症标记作为PD1抗体反应的临床诊断(ayer等，2017;Rozeman et al, 2017)。弹性网惩罚回归模型在派embrolizumab应答数据集(KEYNOTE-012(膀胱癌、胃癌、HNSCC和三阴性乳腺癌)和KEYNOTE-028 (NCT02054806)(肛管癌、胆道癌、结直肠癌、食管癌和卵巢癌)上进行五倍交叉验证，以识别18个预测免疫基因的特征。为了计算特征得分，使用该模型的非零回归系数作为惩罚权重，计算特征中18个基因归一化表达的最终加权和(Ayers等，2017)。据报道，用于拟合模型的九种癌症类型的签名得分的平均AUC为0.75。在96个HNSCC肿瘤的独立验证队列中，特征评分显示，在预测派姆单抗的客观反应方面，IHC的PD-L1水平(AUC¼0.75)优于IHC (AUC¼0.65)。然而，根据本报告的发现，该特征的AUC可能不适合作为临床反应诊断，需要严格的验证。
t细胞克隆:ICB免疫治疗后TCR谱发生治疗特异性定性和定量变化(Hopkins等，2018;Khunger, Rytlewski, Fields, Yusko， & Tarhini, 2019;Page等人，2016;Riaz et al, 2017)。据报道，CTLA4抗体治疗后t细胞的高克隆扩增与黑色素瘤、乳腺癌和胰腺癌的临床反应改善有关(Hopkins等，2018;Khunger等人，2019;Page et al, 2016)。TCR丰度和多样性通过TCR克隆度(Shannon’s diversity index或Shannon’s entropy)等指标进行量化，其中包括TCR丰富度(唯一的TCR克隆型数量)和均匀度(TCR克隆型分布)。虽然大量RNA序列数据可以作为MiXCR等工具在TME中分析TCR谱的替代品(Bolotin等人，2015;Finotello, Rieder等人，2019)，与大量RNA测序相比，高通量TCR测序技术在表征t细胞克隆型方面提供了更高的分辨率和效率。铁汉 15:33:11

4.4 单细胞转录组学用于提高TME的分辨率分析

单细胞rna测序(scRNAseq)技术在单细胞实体水平上提供了前所未有的分辨率。在过去的几年里，该领域已经从低通量技术(例如，CEL-Seq)发展到高通量技术，每次运行在10分钟内捕获多达80,000个细胞(例如，10 Chromium)。因此，从scRNAseq技术获得的高维数据集呈指数级增长，推动了生物学研究，并为人类细胞图谱(Human Cell Atlas)等全球计划做出了贡献，该计划用于对人体单个细胞类型进行全面的分子分析(Regev et al, 2017)。正在开发大量工具来处理来自scRNAseq的原始数据，并提供了此类工具的详细列表(Davis等人，2018);最流行的工具是作为R包提供的Seurat (Stuart等人，2019)。scRNAseq能够以非常高的分辨率详细评估肿瘤异质性和亚群变异性，并促进临床相关发现(Clarke等人，2019;任，康，张，2018)。例如，对接受PD1抗体治疗的肺癌患者的肿瘤进行的scRNAseq分析显示，与治疗前相比，治疗后对治疗反应良好的患者的组织驻留记忆(TRM)细胞水平升高(Clarke et al, 2019)。

scRNAseq 创造了研究疾病相关动态细胞状态的机会，其中包括细胞和分支细胞谱系的发育转变。这是scRNAseq相对于整体RNAseq的一大优势，因为它允许对细胞轨迹进行推断。

细胞轨迹可以表示为循环的、线性的、分岔的或树状的拓扑结构，在连续的细胞状态中捕获TME;这种粒度级别是单独通过批量RNAseq无法实现的。已经开发了50多种不同的轨迹推断方法(Saelens, cannoodle, Todorov， & Saeys, 2019)。对比研究调查了众多现有的轨迹推断方法，结果显示Monocle2、Slingshot和tcan总体上优于其他评估方法(Saelens等人，2019;Soneson & Robinson, 2018)。scRNAseq表达谱也被越来越多地用于编制参考签名，用于从TME的大量表达谱中反卷积TME的方法(Frishberg等人，2019;Jew等人，2019;Menden等人，2019;Newman等人，2019;Wang, Park, Susztak等，2019)。

scRNAseq技术和相关数据分析方法的快速创新将继续改进处理与scRNAseq输出相关的高噪声的策略，并将实现反卷积细胞图的自动注释;这些新增的功能将扩大scRNAseq在肿瘤免疫学方面的应用。

五、基于表观遗传学的DNA甲基化免疫图谱

DNA甲基化是指DNA的遗传表观遗传修饰，其中甲基共价转移到CG二核苷酸(CpG)背景下的胞嘧啶(Jin, Li， & Robertson, 2011)。由于已知DNA甲基化模式具有谱系和细胞类型特异性(Jin等，2011;Teschendorff & Relton, 2018)，它们可用于将复杂组织反卷积为其组成细胞类型。在这方面，一个给定组织的DNA甲基化谱可以被视为其组成细胞类型特异性甲基化谱的线性加权和。利用从HumanMethylation27(270,000个CpG位点)到HumanMethylation450(485,000个CpG位点)以及现在的HumanMethylationEPIC阵列(860,000个CpG位点)和全基因组亚硫酸盐测序等平台，量化人类甲基组的技术能力的进步提供了可用于反卷积目的的大型基因组尺度数据库。

甲基化数据的反卷积方法最初是为了调整细胞类型异质性对表观基因组研究中感兴趣的表型的混淆效应而开发的(Teschendorff & Zheng, 2017;Jaffe & Irizarry, 2014)。

这些方法逐渐应用于将 TME 反卷积为其驻留细胞类型。可用于解卷积大量 DNA 甲基化谱的计算工具可大致分为两种主要类型：基于参考或无参考(Teschendorff & Relton, 2018;Teschendorff & Zheng, 2017);这些工具很容易作为R或python包实现(Teschendorff & Relton, 2018)。对这些方法的比较分析表明，没有一种算法能给出普遍最优的性能(Teschendorff & Zheng, 2017)。在反卷积之前，首先对原始DNA甲基化谱进行预处理和归一化(Koestler等人，2016;Wang, Wu， & Wang, 2018)。主成分分析(PCA)应用于beta值，以识别样本队列内的技术批次效应;识别出的批次效应可以通过应用ComBat来纠正，ComBat是一种常规使用的基于经验贝叶斯的方法(Johnson et al, 2007)。清理后的数据用于反褶积。

。。。。。

六、免疫空间环境的深度学习

。。。。

七、总结

高通量测序数据以及广泛的计算方法使肿瘤免疫相互作用在分子水平上的系统量化和研究成为可能。本章讨论了可用于分析TME的各种计算方法，特别是在其免疫原性潜力的背景下。将这些互补方法与临床变量相结合，将允许根据患者的整体免疫状态对患者进行分层，并研究这些亚组中免疫监视和逃避手术的机制，这对癌症精准医学具有重要意义。

参考资料

Computational methods in tumor immunology。 https://www.sciencedirect.com/science/article/abs/pii/S0076687920300239

药企，独角兽，苏州。团队长期招人，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn