【4.4.7】IEDB-AR
免疫表位数据库分析资源(Immune Epitope Database Analysis Resource)(IEDB-AR, http://tools.iedb.org/ )是IEDB的配套网站,它提供了专注于B细胞和T细胞表位预测和分析的计算工具。 所有工具均可通过公共网站免费获得,许多工具也可通过REST API和/或可下载的命令行工具获得。 整个站点的虚拟机映像也可以免费用于非商业用途,并且包含公共站点上的大多数工具。 在这里,我们描述IEDB-AR中可用的工具和功能,重点介绍自2012年NAR网络服务器版上次报告以来添加的10种新工具。 此外,2012年已在站点上托管的许多工具都已收到最新版本的更新,包括NetMHC,NetMHCpan,BepPred和DiscoTope。 总体而言,此IEDB-AR更新为表位的预测和分析提供了大量更新和新颖的功能。
一、介绍
脊椎动物的适应性免疫系统可以识别来自多种病原体的大量抗原。 B和T细胞受体负责重新识别这些多样化的抗原并触发免疫反应。 B和T细胞受体在这些抗原上识别的特定区域称为表位。因此,了解免疫受体:表位相互作用的机制对于开发针对传染性和自身免疫性疾病,癌症和过敏的诊断,治疗和疫苗很重要。
免疫表位数据库(IEDB)捕获的实验可识别和表征表位和表位特异性免疫受体,以及其他各种细节,例如宿主生物,免疫暴露和诱导的免疫反应(1)。伴随站点IEDB分析资源(IEDB-AR)托管各种B和T细胞表位预测工具,这些工具基于对IEDB数据进行训练和验证的算法以及表位分析工具。自上次更新以来,访问IEDB-AR的月度用户数量已从2012年的不足1,500增至2018年的4,500以上,增长了两倍多(补充图S1)。 IEDB-AR中定期添加了新的表位预测和分析工具,这些工具具有促进基于抗原决定簇的治疗和疫苗开发的功能(2)。例如,最近实施了一种减少治疗性蛋白质不良免疫原性的工具(3)。在这里,我们描述了新实施的工具(表1),对先前现有工具的更新以及自2012年NAR网络服务器版本(4)的上一份报告以来增加的新颖功能。
二、T细胞表观预测工具
在T细胞表位预测的类别中总共添加了6种新工具。 其中包括TepiTool,一种具有新的用户友好界面的T细胞肽:MHC结合亲和力预测工具,用于自然加工的I类和II类MHC配体的预测工具,对治疗性蛋白进行去免疫,以及在MHC结合后预测T细胞免疫原性 。 除了新添加的工具之外,随着更多数据的提供,许多先前已有的工具也已进行了重新培训和更新。 表2列出了T细胞表位预测工具中预测方法的最新版本。尽管提供了默认方法的最新版本,但许多工具允许用户选择可用的先前版本。 以下各节简要介绍了新添加的工具。
2.1 Tepi工具
TepiTool( http://tools.iedb.org/tepitool )(5)是IEDB T细胞表位预测的新界面,它被设计为结合MHC I类和II类预测方法的逐步向导。 该工具在每个步骤提供建议的默认值,以预测和选择给定应用的最佳肽组。 TepiTool还提供了绑定预测之外的其他功能。 例如,对输入序列中的肽段进行保守性分析,以及用于选择最能预测的肽段的不同选项。 完成预测任务后,将为用户提供一组简明的最高预测肽段和链接,以下载完整的预测结果和保守性估算值。 如果提供了电子邮件地址,则预测结果和链接也会通过电子邮件发送给用户。
2.2 对I类和II类MHC的天然加工配体的预测 Prediction of naturally processed ligands for MHC class I and class II
MHC-NP( http://tools.iedb.org/mhcnp )(6)是一种预测由I类MHC途径天然加工并与I类MHC分子结合的肽的工具。 该工具可以预测六个人类和两个小鼠MHC等位基因的MHC I配体。 同样,MHCII-NP( http://tools.iedb.org/mhciinp )(7)是预测天然加工的MHC II配体的工具。 这些工具是通过训练从MHC分子洗脱的天然加工肽而开发的
2.3 免疫原性 Immunogenicity
这种新工具( http://tools.iedb.org/immunogenicity )倾向于将与I类MHC(pMHC)结合的肽分为两类:表位和非表位(8)。 它基于对肽的非锚位置氨基酸组成的分析,在非锚位置,氨基酸的侧链可能与TCR接触。
2.4 CD4EpiScore
CD4EpiScore( http://tools.iedb.org/cd4episcore )是一种预测人类CD4限制性肽的免疫原性的新工具,它利用神经网络来识别与免疫原性相关的模式(9)。 已使用多种实验方法在文献中针对不同种族和多种抗原的一系列独立数据集上进行了验证。
2.5 解除免疫 Deimmunization
将“去免疫工具”(去免疫)添加到IEDB-AR中,以解决对治疗上重要的蛋白质不希望的免疫反应性的问题。在逐步向导中,该工具利用II类肽:MHC结合预测工具预测蛋白质序列中潜在的免疫原性区域,并建议氨基酸取代以降低其免疫原性(3)。作为概念验证,该工具已在重组因子VIIa(Vatreptacog alpha)上进行了实验验证,由于免疫原性问题,该研究已从临床试验中终止(10)。
三、 B细胞表观预测工具
IEDB-AR包含线性B细胞表位预测工具,例如BepiPred(11),各种基于氨基酸理化性质的量表( http://tools.iedb.org/bcell/ )和不连续的B细胞表位预测工具,例如DiscoTope( http://tools.iedb.org/discotope/ )(12)和ElliPro( http://tools.iedb.org/ellipro/ )(13)。自从IEDB-AR的上一次更新以来,推荐的B细胞表位预测方法BepiPred(14)和DiscoTope(15)已更新为其2.0版本。
3.1 莱拉 LYRA
添加了一种名为LYRA(淋巴细胞受体自动建模)的新工具来建模B细胞和T细胞受体的3D结构(16)。 LYRA工具( http://tools.iedb.org/lyra/ )通过其氨基酸序列预测B细胞和T细胞受体的结构。使用同源性建模,它选择最佳的框架模板,并在必要时根据每个环的预测规范结构(17)对互补决定区(CDR)进行建模,然后将其嫁接到框架模板上。结果页面显示了比对的序列和结构的可视化,可以快速检查序列和结构中的CDR。
四、分析工具
IEDB-AR的分析部分包含一些工具,这些工具在处理一组抗原决定簇或抗原决定簇候选时会自动执行常见任务。本节的更新内容包括表位聚类的修订版以及将表位映射到源蛋白的新工具,以及从HLA型受试者的免疫应答数据推断表位的全部限制的工具。
4.1 Cluster2.0
表位聚类工具( http://tools.iedb.org/cluster2 )已完全经过重新设计,可根据其序列相似性对肽表位进行分组。 除了提供三种不同的聚类方法外,该新版本还支持聚类的交互式图形可视化,以显示肽之间的连通性(18)。
4.2 免疫浏览器 ImmunomeBrowser
IEDB网站上的ImmunomeBrowser工具可将表位映射到其源抗原,并在所有受测蛋白质区域上可视化观察到的免疫反应。 在该工具的一个新的可自定义版本中( http://tools.iedb.org/immunomebrowser/ ),我们扩展了该应用程序,以对用户提供的表位和源抗原数据集执行类似的分析(19)。
4.3 表位限制子分析工具(RATE)Restrictor Analysis Tool for Epitopes (RATE)
RATE( http://tools.iedb.org/rate )(20)是一种自动化的方法,可以给定HLA型受试者的T细胞反应的大型数据集,通过计算来推断表位的HLA限制。该工具接受两个输入,即受试者表达的等位基因和受试者中肽的免疫反应。然后,计算每个特定等位基因作为特定肽的限制性等位基因的比值比,并使用Fisher精确检验来估计显着性。该工具的开发重点是II类等位基因,但也可以应用于I类等位基因。
五、IEDB-AR的新功能
除了实施新工具外,自2012年以来IEDB-AR的开发还针对改进目标,以解决用户希望如何与这些工具进行交互的问题。最容易理解和流行的两个新功能是能够提交要在后台处理的预测作业,以及在硬件和软件级别进行的体系结构更改,以提高稳定性并支持并行化。
4.1 后台批处理作业
随着IEDB-AR 2.17版的发布,2017年6月,用户可以在提交I类或II类肽结合预测工作后提供电子邮件地址。这项增强功能使用户可以运行比通过Web界面直接进行的更大的预测工作(就输入序列和预测的等位基因而言)。作业完成后,结果将作为电子邮件附件发送给用户。自最初实施以来,此功能已添加到TepiTool和Deimmunization工具中-两者都需要大量计算,并且可能会通过Web界面在大小合理的请求中超时。对于支持批处理的工具,可通过Web界面和API使用它。
4.3 硬件和软件架构更改,以提高稳定性并支持并行化
为了使前端与后端脱钩,提高稳定性并支持多种工具的并行化,对硬件和软件进行了几项体系结构更改。在硬件级别,创建了一个单独的作业处理集群以运行所有CPU密集型任务,例如绑定预测。这些机器与Web服务器在物理上是分开的,因此繁重的处理对网站性能几乎没有影响。为了利用重新设计的服务器体系结构,后端软件在Python和Django中进行了完全重新设计,并特别注意利用消息队列系统(RabbitMQ)和任务管理器(Celery)。有了这个集成系统,它就可以并行处理多个资源工具的作业,其加速比单线程版本高15倍。它还使人们能够有效利用资源,并根据其来源对工作进行优先排序。例如,与格里夫实验室合作配置了一个单独的资源队列,以支持其pVAC-Seq管道(21)的CPU密集型请求,同时保持IEDB系统对其他用户的请求做出响应。
五、工具的可用性
5.1 IEDB应用程序编程接口(IEDB-API)
除了主要的Web界面之外,IEDB-AR托管的一些工具还提供面向公众的API。这些工具包括MHC I类和II类结合和加工预测,MHC-NP和B细胞线性表位预测子。为了提供一致的体验,每个API都遵循相似的接口,并在可能的情况下在它们之间共享参数名称。所有API均通过HTTP POST请求工作,并以纯文本形式返回响应。 MHC I类和II类绑定预测API的使用非常广泛,每个月要进行300,000多个预测,并且IEDB-AR中有90%以上的工作。
5.2 软件分发包
尽管公共IEDB-AR服务器的目标是尽可能合理地容纳尽可能多的预测工作,但资源可能会限制非常大的请求。 IEDB-AR团队提供可下载的软件包以在用户硬件上本地运行预测的众多原因之一。当前,有8种不同的独立软件包可用,涵盖了使用最广泛的工具,并且根据用户需求和可用资源开发了新软件包。此外,通过许可协议,外部实体可以使用IEDB-AR的完整虚拟机图像。这两种分布模式涵盖了广泛的用例,使用户能够在自己的硬件上以完全私密的方式运行许多IEDB-AR工具。
参考资料
- W502–W506 Nucleic Acids Research, 2019, Vol. 47, Web Server issue Published online 22 May 2019 doi: 10.1093/nar/gkz452. IEDB-AR: immune epitope database––analysis resource in 2019
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn