【3.3.4】NetMHCIIpan-3.2

主要组织相容性复合物II类(MHC-II)分子在专职抗原呈递细胞的表面上表达,其中它们向T辅助细胞展示肽,其协调许多宿主免疫应答的发作和结果。因此,了解MHC-II分子将呈递哪些肽对于理解T辅助细胞的活化是重要的,并且可以用于鉴定T细胞表位(T-cell epitopes)。我们在这里提出了两种MHC-II-肽结合亲和力预测方法NetMHCII和NetMHCIIpan的更新版本。这些是使用从包含HLA-DR,HLA-DQ,HLA-DP和H-2小鼠分子的免疫表位数据库(Immune Epitope Database)获得的定量MHC-肽结合亲和力数据的扩展数据集构建的。我们表明,使用这种扩展数据集的训练改善了两种方法的肽结合预测的性能。两种方法均可在 www.cbs.dtu.dk/services/NetMHCII-2.3 和 www.cbs.dtu.dk/se rvices/NetMHCIIpan-3.2 上公开获取。

缩略语:

  • AUC, area under the receiver operating characteristics curve;
  • H-2, histocompatibility 2;
  • HLA, human leucocyte antigen;
  • IEDB, Immune Epitope Database;
  • LOMO, leave-one-molecule-out;
  • MHC-II, MHC class II;
  • MHC-I, MHC class I;
  • MHC, major histocompatibility complex;
  • PFR, peptide flanking regions;
  • UPGMA, unweighted pair group method with arithmetic mean

一、前言

主要组织相容性复合物II类(MHC-II)分子存在于抗原呈递细胞的表面,在那里它们将来自细胞外蛋白的肽呈递给T辅助细胞。许多肽-MHC复合物呈现在表面上抗原呈递细胞,但只有被T细胞受体识别的肽才会引发免疫反应,并被称为T细胞表位。鉴定T细胞表位对于细胞免疫和基于肽的诊断,治疗和疫苗的设计的一般理解是重要的。MHC-II分子是由a链和b链组成的异二聚体糖蛋白。在人类中,这两条链在人类白细胞抗原(HLA)基因复合物中编码,位于三个基因座之一,称为HLA-DR,-DP和-DQ。在小鼠中,MHC-II链编码为组织相容性(histocompatibility) 2(H-2)位点。每个基因座由许多不同的等位基因变体组成,这使得MHC-II分子具有高度多态性。由MHC-II分子呈递的肽结合由MHCα-和b-链残基形成的结合沟。肽结合沟的两端是开放的,因此可以使不同长度的肽结合。尽管MHC-II分子可以容纳可变长度的肽,但自然界中发现的最丰富的肽长度为13至25个残基。 主要与MHC结合沟相互作用的肽配体部分称为肽结合核心,通常为9个氨基酸长,在P1,P4,P6和P9位具有锚定残基。肽-MHC结合亲和力主要是由肽结合核心的氨基酸序列决定。然而,已经显示结合核心任一侧上的肽侧翼区(PFR)影响肽-MHC结合,从而最终也影响肽免疫原性。

因此,有许多因素使得难以预测肽结合对MHC-II分子的亲和力,包括:

  1. MHC-II分子的多态性,
  2. 肽长度的变化,
  3. PFR的影响
  4. 正确肽结合核的鉴定

所有这些因素使预测肽结合对MHC-II分子的亲和力的任务复杂化; 因此,与MHC I类(MHC-I)肽结合预测方法相比,大多数方法仍具有低性能。 早期的研究表明,NetMHCII和NetMHCIIpan的预测性能取决于肽结合数据的数量,因此,如果在扩展的肽结合数据集上进行再培训,可以预期这两种方法的性能会有所改善。 我们在这里调查是否确实如此。

由于潜在结合肽的多样性,识别T细胞表位是困难的。然而,由于肽-MHC结合是T细胞免疫原性的先决条件,多项研究表明,MHC肽结合强度和肽免疫原性之间存在很强的相关性。因此需要准确的和可靠的肽结合亲和力预测方法,可用于计算机筛选肽,目的是鉴定与给定宿主中的MHC-II分子匹配的T细胞表位。鉴于此,已经开发了许多不同的方法,包括NetMH-CII, NetMHCIIpan,TEPITOPE, TEPITOPEpan, PROPRED, RANKPEP和SVRMHC。 NetMHCII和NetMHCIIpan都被证明是预测结合对MHC-II分子的亲和力的最佳方法之一。使用NNAlign框架训练这两种方法,这些方法基于人工神经网络的集合,这些人工神经网络训练有关免疫表位数据库的定量肽结合亲和力数据( IEDB)。 NetMHCII和NetMHCIIpan之间的主要区别之一是NetMHCII是每个MHC分子的单个网络的集合,而NetMHCIIpan包含单个通用网络,可以预测已知蛋白质序列的所有MHC分子的肽结合亲和力。

参考资料

Jensen, K. K., Andreatta, M., Marcatili, P., Buus, S., Greenbaum, J. A., Yan, Z., … Nielsen, M. (2018). Improved methods for predicting peptide binding affinity to MHC class II molecules. Immunology, 154(3), 394–406. https://doi.org/10.1111/imm.12889

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学