【3.7.2】分析蛋白质-蛋白质界面的六种类型(interface)
非共价残基侧链相互作用发生在许多不同类型的蛋白质中,并促进了许多生物学功能。这些差异是否在界面的序列组成和/或残基-残基接触偏好中得到体现?先前的研究分析了小数据集并给出了矛盾的答案。在这里,我们介绍了一种新的数据挖掘方法,该方法产生了所分析的最大的高分辨率交互数据集。我们介绍了一种基于信息论的分析方法。根据序列特征,我们能够区分六种类型的蛋白质界面,每种类型对应于残基之间不同的功能或结构关联。特别是,我们发现氨基酸结构和残基-残基偏好之间存在显着差异,这些残基在相同结构域之间以及不同域之间,永久界面和瞬态界面之间,以及在同源寡聚体和杂合寡聚体之间的相互作用之间。六种类型之间的差异是如此之大,以至于仅使用氨基酸成分,我们就可以统计地预测出1000种残基池在六种类型的界面中,哪一种的准确度为63-100%。所有界面均与SWISS-PROT中所有残基的背景,表面残基组和不涉及非平凡相互作用的内部残基显着不同。总体而言,我们的结果表明,可以从序列中预测界面类型,并且界面类型特定的平均场电势可能适合某些应用。
一、前言
1.1 不同类型的相互作用是否使用不同的生化机制? Do different types of interactions use different biochemical mechanisms?
残基侧链之间的非共价接触是蛋白质折叠,蛋白质组装以及蛋白质与蛋白质相互作用的基础。这些接触发生在许多不同的条件下,并促进蛋白质内部和之间的各种相互作用和缔合。例如,残基与残基的接触通过残基侧链之间的无数相互作用来确定蛋白质的结构。侧链之间的非共价相互作用介导折叠链组装成多链蛋白。在这两种情况下,相互作用通常是在蛋白质的整个生命周期中持续存在,因此是永久性的。但是,非共价残基-残基相互作用可以是瞬时的,如受体-配体相互作用或信号转导。这些交互通常仅持续很短的时间。鉴于界面的广泛性,人们可能会假设不同类型的相互作用是由不同的生化机制促进的。
1.2 之前的学习 Previous studies
许多研究调查了接口(interactions)之间的特性是否在例如内部(在同一链内)和外部(在不同链之间)相互作用。尽管所有研究都分析了已知结构的蛋白质,但其结果是矛盾的。这些差异可能是理论,技术和计算问题。
- 为了从可用的结构数据中得出真实的结论,有必要分析尽可能多的蛋白质。但是,没有一项研究充分利用蛋白质数据库(PDB)中可用的大量数据; 大多数分析仅限于相对较小的手动选择的数据集。分析小型数据集的一个原因是,没有一种简单的方法可以自动区分(i)属于一个多链蛋白的两条链之间的接口,以及(ii)两种不同蛋白质之间的界面。
- 由于数据集较小,大多数研究无法区分同多聚体和异多聚体,还是永久性相互作用和瞬态相互作用。相反,他们必须专注于比较内部交互(一条链内)与外部交互(链间)。
- 大多数研究已经描述了通过表面斑块的外部相互作用。这样的表面补丁可能无法捕获蛋白质相互作用的所有方面。例如,可能会漏掉带有长侧链的略微掩埋的残基,尽管它们会参与界面。此外,对残基突变的分析表明,对结合自由能的贡献并非均匀分布在整个界面上。一些被识别为表面补丁一部分的残基可能形成重要的接触,而另一些则可能根本不形成接触。因此,表面补丁的分析可能无法捕获相互作用基础上的所有残基-残基接触。
二、结果
接触(Contacts):如果两个最接近的原子之间的间隔为≤6A˚,则将残基定义为接触。我们分离了以下六种类型的接口(interfaces)(有关详细信息,请参见方法)。
- 域内(Intra-domain):相同结构域中的残基之间的接触(根据PrISM的域定义)。
- 域-域(Domain–domain):同一链中不同结构域中的残基之间的接触。
- 均聚物(Homo-obligomers):在两条不同链上的残基之间的接触,这些残基具有相同的序列,并且在我们没有证据表明单体发生任何生物相互作用的意义上是永久的。
- 同质复合物(Homo-complexes):两条不同链上具有相同序列的残基之间的接触,并且在细胞中观察到该序列的另一条链作为功能单体的意义上是瞬时的。
- 杂多聚体(Hetero-obligomers):来自同一蛋白质的两条不同链之间的接触(瞬时)。
- 杂配合物(Hetero-complexes):来自两种不同蛋白质的两条不相同链之间的接触(永久)。
2.1 六种界面类型的氨基酸组成差异显着
2.2 所有界面的残基成分与背景和表面不同
2.3 Similarities and differences in and to the literature for contact preferences
…
三、方法
3.1 消除包装物 Elimination of packing complexes
解析PDB文件时,很难确定何时一对链仅是堆积多聚体( packing multimer),何时真正是具有生物学功能的多聚体。 尝试自动解析数百个PDB文件时,问题变得更加严重。 建议了两种方法来解决此问题。 一种是基于计算由于低聚(oligomerisation)而导致的溶剂可及性的降低,另一种是基于测量接触残留物的保守性。 我们使用了采用第一种方法的PQS服务器,以消除似乎是包装复合物而不是具有生物学功能的多聚体的PDB文件
。。。
参考资料
- Volume 325, Issue 2, 10 January 2003, Pages 377-387 Journal home page for Journal of Molecular Biology. Analysing Six Types of Protein–Protein Interfaces
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn