【4.4.3.6】HLA distance trees和HLA pseudo sequence

HLA 距离树

HLA 距离树(HLA distance trees)源自预测的结合亲和力之间的相关性。对于每种抗原,使用 NetMHCpan 方法预测一组 10,000 个随机天然肽的结合亲和力。接下来,将任意两个等位基因之间的距离定义为 D = 1-Pcorr,其中 Pcorr是两组预测的结合亲和力之间的皮尔逊相关性。在这种测量中,具有相似结合特异性的两个分子的距离将接近 0,而具有不相关结合特异性的两个分子的距离将接近 1。

HLA 等位基因距离矩阵针对 390 个 HLA-A 等位基因进行了计算,对于711 HLA-B 等位基因,并使用 PHYLIP 包中的邻居算法,该算法实现 Saitou 和 Nei [48]的邻居加入算法来生成 HLA 等位基因距离树。为了估计 HLA 距离树的重要性,使用 bootstrap 方法生成了 100 个这样的距离树。使用专有软件以“贪婪”共识树的形式总结输入树集。贪婪共识树使用多数规则共识树,所有频率低于 50% 的兼容二分区已按频率降序添加到其中。

HLA伪序列 HLA pseudo sequence

HLA序列以由与肽接触的氨基酸残基组成的伪序列(HLA pseudo sequence)编码。接触残基被定义为在具有九聚肽的一组代表性HLA-A和-B结构中的肽的4.0 Å内。仅包括来自 A、B 和 C 等位基因的多态性残基,产生由 34 个氨基酸残基组成的伪序列。请注意,由于多种可能的构象,中心肽残基可以选择与结合槽中的不同残基子集相互作用。所有这些残基都包含在伪序列中。肽和HLA序列之间的相互作用图谱如图4所示。

图4

哇, 原来这就是pan的核心呀, 将5000多个HLA定义到关键的34个氨基酸,这样才能更清晰的聚类

参考资料

  • NetMHCpan, a Method for Quantitative Predictions of Peptide Binding to Any HLA-A and -B Locus Protein of Known Sequence
药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn