【4.4.7】聚集和可视化参考蛋白中复杂和异质表位的工具--ImmunomeBrowser

August 17, 2020 antibody 阅读量：次

官网：http://tools.immuneepitope.org/immunomebrowser/

动机：来自不同研究的数据集（例如MHC配体洗脱（elution），MHC结合，B / T细胞表位筛选等）通常在实验方法，测试的肽大小（包括部分和/或嵌套的重叠肽）以及捐助者进行了测试。

结果：我们提供了免疫抗原决定簇数据库的ImmunomeBrowser工具的定制应用程序，可用于有效地汇总和可视化异类免疫数据。用户提供的肽组和相关的响应数据被映射到用户提供的蛋白质参考序列。输出由代表由响应频率得分和相关的估计置信区间表示的汇总数据的表格和图形组成。这允许用户可视化与主要响应及其边界关联的区域。结果既显示为基于用户交互式javascript的Web界面，又显示为选定参考序列中的表格格式。

可用性和实施： “ ImmunomeBrowser”是IEDB（ http://www.iedb.org ）的一项长期功能。本应用程序扩展了该工具的使用，以处理用户提供的数据集，而不是IEDB查询的输出。可以从 http://tools.iedb.org/immunomebrowser/ 免费访问ImmunomeBrowser的新服务器版本。

一、前言

来自不同研究的数据集（例如，MHC配体洗脱，MHC结合，B / T细胞表位筛选等； Li Pira等，2010）在所用实验方法，所测试的肽的大小以及所测试的供体的数量，等方面通常会有所不同。

为了简化对免疫抗原表位数据库（IEDB）中存在的汇总数据的可视化，我们在IEDB中实现了名为“ ImmunomeBrowser”的应用程序（Vita等，2015）。该工具可汇总与用户查询有关的所有数据，并允许其可视化对特定抗原的已知免疫反应，以及说明参考蛋白质中的知识缺口。它根据响应频率（RF）和测试/响应的受试者数和/或沿着参考蛋白的长度进行的独立测定的数目提供了免疫反应性。该工具最初是在IEDB的数据库部分的结果页面中实现的。为了将可用性进一步扩展到预测的表位和适当的表位或非IEDB数据，开发了本文所述的在线工具。

Kim等人证明了该方法的实用性。他对IEDB中的丙型肝炎病毒（HCV）数据进行了宏分析（meta-analysis），以呈现出该病毒参考蛋白序列的免疫反应性和知识缺口的更大图景（Kim等，2012）。

当前，Immunomebrowser仅可用于从IEDB查询派生的数据，而不能与用户数据集一起使用。为克服此问题，我们将ImmunomeBrowser实施为独立工具，以允许用户分析和可视化自己数据集中的免疫优势区域。

二、材料和方法

2.1 数据输入

用户以指定格式提供肽序列，每种肽的响应数据，目标蛋白序列及其所需的序列同一性阈值。肽响应可以以空格分隔的格式粘贴或上传为文件，带有三列，分别对应于肽序列，测试的受试者数和/或执行的测定数以及响应的受试者数和/或得到的测定数，三列得到积极回应。如果未提供测试或响应的受试者数量或进行的检测的数量，则程序将自动为测试或进行的检测对象的数量以及响应或进行检测的对象的数量自动填充“ 1”阳性测定。蛋白质序列必须以“ Fasta”格式提供，并且序列同一性是从一个下拉菜单中选择的，该下拉菜单的范围为10-100％，间隔为10％。

2.2 表位作图

根据提供的同一性阈值，将每个肽映射到用户提供的参考蛋白序列。根据肽在参考序列内的比对来计算同一性程度。仅选择序列同一性高于阈值的肽进行进一步计算。

2.3 RF和置信区间计算

给定肽和每个源蛋白位置的RF计算为对特定肽有反应的受试者总数和/或进行了阳性反应的独立测定（R）除以测试受试者总数并/或执行的测定次数（N）。

RF = R/N

计算置信区间（CI），以根据测试对象的数量对RF可靠性进行加权。使用二项式累积分布函数和Wilson得分计算CI。

对于大样本量（N> = 50），使用以下公式计算下限和上限。

2.4 来自不同重叠肽段的RF数据汇总

需要汇总数据以识别最常识别的表位，这可以反映识别包含给定残基的肽序列的总体频率。该方法对于识别参考序列中每个位置的RF很有用。为了计算聚集的RF数据，对于给定的源蛋白中的每个作图位置，将测试的受试者的数目和/或进行的测定的数目和响应的受试者的数目和/或导致阳性反应的测定的数目相加。 RF的CI使用上述公式计算。

2. 5结果显示

结果分两个步骤显示，第一步提供表位摘要和映射回参考蛋白序列的测定法（图1）。

对于每种蛋白质，一个表列出了所有表位，其定位位置，响应的受试者/阳性测定的数量，所测试的受试者的数量/进行的测定以及RF及其在95％CI处的上下限（图1A））。第二步提供了针对参考蛋白每个区域的定位RF的聚合图，在两个不同的图中分别代表了累积的RF（RF的上下限）和结果总数（正负）。选择的参考蛋白（图1B）。

三、应用

ImmunomeBrowser的定制应用程序可用于多种应用程序。如上所述，Kim等已对IEDB中提供的HCV数据进行了meta分析（Kim等，2012； Vita等，2015）。用户现在可以使用该工具来整理和执行在多个相关研究中生成的数据的meta分析。例如，ImmunomeBrowser可以应用于包含大量重叠肽段的天然配体洗脱数据，并在表达不同HLA分子的不同供体中进行了研究（Schellens等人，2015； Shastri等人，2002）。为此，需要将来自不同供体和每个HLA分子的响应频率的数据进行合并（Alvarez等人，2018）。在这种情况下，沃恩等对IEDB中精选的自然处理数据进行了分析，以表征已知处理数据的总体一般特征并强调现有知识差距（Vaughan等人，2017）。 Immunomebrowser也可用于分析治疗性蛋白质的免疫原性测试，其中测试来自治疗性蛋白质的重叠肽的免疫原性以评估有害的免疫反应（Asgari等人，2015; Dhanda等人，2018; Jawa等人（2013年； Salvat等人，2017年）。因此，即使在不同的供体中进行测试并来源于不同的临床研究，免疫浏览器也可以汇总跨越指定参考蛋白长度的不同肽和/或肽类似物的免疫应答数据。这使用户可以更有意义和更有用的方式轻松查看其数据

参考资料

Sandeep Kumar Dhanda, Randi Vita, Brendan Ha, Alba Grifoni, Bjoern Peters, Alessandro Sette (2018). ImmunomeBrowser: A tool to aggregate and visualize complex and heterogeneous epitopes in reference proteins. Bionformatics。 https://academic.oup.com/bioinformatics/article/34/22/3931/5034429

这里是一个广告位，，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn