【4.4.3.6】HLA distance trees和HLA pseudo sequence

November 14, 2022 antibody 阅读量：次

HLA 距离树

HLA 距离树（HLA distance trees）源自预测的结合亲和力之间的相关性。对于每种抗原，使用 NetMHCpan 方法预测一组 10,000 个随机天然肽的结合亲和力。接下来，将任意两个等位基因之间的距离定义为 D = 1-Pcorr，其中 Pcorr是两组预测的结合亲和力之间的皮尔逊相关性。在这种测量中，具有相似结合特异性的两个分子的距离将接近 0，而具有不相关结合特异性的两个分子的距离将接近 1。

HLA 等位基因距离矩阵针对 390 个 HLA-A 等位基因进行了计算，对于711 HLA-B 等位基因，并使用 PHYLIP 包中的邻居算法，该算法实现 Saitou 和 Nei [48]的邻居加入算法来生成 HLA 等位基因距离树。为了估计 HLA 距离树的重要性，使用 bootstrap 方法生成了 100 个这样的距离树。使用专有软件以“贪婪”共识树的形式总结输入树集。贪婪共识树使用多数规则共识树，所有频率低于 50% 的兼容二分区已按频率降序添加到其中。

HLA伪序列 HLA pseudo sequence

HLA序列以由与肽接触的氨基酸残基组成的伪序列（HLA pseudo sequence）编码。接触残基被定义为在具有九聚肽的一组代表性HLA-A和-B结构中的肽的4.0 Å内。仅包括来自 A、B 和 C 等位基因的多态性残基，产生由 34 个氨基酸残基组成的伪序列。请注意，由于多种可能的构象，中心肽残基可以选择与结合槽中的不同残基子集相互作用。所有这些残基都包含在伪序列中。肽和HLA序列之间的相互作用图谱如图4所示。

图4

哇，原来这就是pan的核心呀，将5000多个HLA定义到关键的34个氨基酸，这样才能更清晰的聚类

参考资料

NetMHCpan, a Method for Quantitative Predictions of Peptide Binding to Any HLA-A and -B Locus Protein of Known Sequence

这里是一个广告位，，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn