【2.5.1】蛋白质链柔性预测(Karplus Schulz Flexibility )

In this method, flexibility scale based on mobility of protein segments on the basis of the known temperature B factors of the a-carbons of 31 proteins of known structure was constructed. The calculation based on a flexibility scale is similar to classical calculation, except that the center is the first amino acid of the six amino acids window length, and there are three scales for describing flexibility instead of a single one.

一、工具

网页预测工具: http://tools.iedb.org/bcell/

预测结果示意图:

二、方法解读

如今,已对许多基因进行了测序,其中各个蛋白质仍然未知。这些蛋白可以通过使用针对寡肽的抗体进行鉴定,定位和纯化,所述寡肽对应于假设蛋白序列的片段[1、2]。在特殊情况下,此类寡肽甚至可能产生合成疫苗[3,4]。目前,从蛋白质序列中选择寡肽段是基于设计用于预测高抗原性[5],亲水性[6,7]或反向电位[8,9]的区段的方案。然而,最近已证明,节段柔性比上述选择标准更能指示抗原决定簇[10],而且它也更适合选择交叉反应肽[11]。因此,我们分析了31种精制的蛋白质结构,以开发一种从给定氨基酸序列预测柔性片段的方法。用于预测链柔韧性的数据库由31种已知三维结构的蛋白质(如图2所示)组成,该蛋白质存放在美国Brookhaven的蛋白质数据库中。所选的蛋白质结构已通过单个原子温度因子(即B值)进行了精炼;它们具有30个以上的残基,其分辨率优于或等于0.3 nm,并且其序列与所有其他包含的蛋白质的序列至少相差50%。

为了衡量链的柔性,我们选择了Cα原子的温度因子,即B-值。对实验数据的检查表明,B值的平均值和分布随蛋白质的不同而有很大差异,这大概反映了结构细化方法和阶段的差异大于自然差异。为了避免偏向具有极高平均值或价差的蛋白质,请按照以下公式对每个Cα原子的B值进行归一化

Bnorm= (B + Dp)/( Bp+ Dp),
  • Bp是蛋白P所有Cα原子B值的平均值(除去N端和C端各3个残基)
  • 蛋白质 Bnorm的均值应该为1
  • 当Bnorm值的均方根偏差为0.3时,Dp才会被给出来。在使用Dp进行调节之前,大多数31种蛋白质的均方根偏差在0.2到0.4之间。

已知蛋白质的链端具有较高的抗原性[12]。 为了确定这是否与灵活性相关,对所有链的第一个(1、2,… 20)和最后一个(m-19,m-18,… m)残基进行了统计。 残基1、2、3,m-1,m的平均Bnorm值分别为1.60、1.28、1.17、1.27、1.53,而其余35个位置的值在0.87至1.07之间波动。 因此,链条末端具有极大的灵活性。

接下来,我们建立了Bnorm值与氨基酸类型之间的平均关系(图1a)。为了进行灵活性预测,通过最近邻分析对这些单残基统计数据进行了优化。首先,将20种氨基酸类型分为“刚性”和“柔性”两类。刚性残基类型是平均Bnorm值小于1.0的残基类型(即A,L,H,V,Y,I,F,C,W,M)。然后,为没有刚性邻居的残基,具有一个刚性邻居的残基以及两个邻居均为刚性的残基确定单独的平均Bnorm值。在图2中的BNORM0,BNORM1和BNORM2的DATA语句中给出了所得的与邻居相关的Bnorm值。存在显着的最近邻居效应,例如,对于无刚性邻居,S的Bnrom从高于平均的16.9%变为2个刚性邻居的平均收入比平均值​​低7.7%。给定氨基酸序列在残基位置n的预测相对柔韧性被用作位置n-3,n-2,nl,n,n + 1, n + 2和n + 3处氨基酸的邻居相关Bnorm值,分别使用权重0.25、0.50、0.75、1.00、0.75、0.50和0.25的加权和。。图2中给出了用于该计算的Fortran程序。图3中可以看到该方法的质量,该图显示了溶菌酶的预测和观察到的柔韧性之间的明显对应关系。残基115到119被预测为柔性的,但是在天然结构中,它们被残基30和115之间的二硫键保持紧密。应该注意的是,预测谱的两个最高峰对应于溶菌酶的已知连续表位[14]。

我们的方案的单残基系数与用于反向转折的系数[8]和抗原性预测[5]的比较显示出显着差异(图1)。 结果,所提出的灵活性预测与当前使用的方法[5-9]明显不同,从而提供了新颖的信息。 与其他方法结合使用的方案应有助于将来选择适合诱导与天然蛋白质交叉反应的抗体的链段。

讨论

  1. 这个方法本质是用B-factor来预测链的柔性,但B-factor为啥可以反映柔性呢?

参考资料

  • Karplus & Schulz Flexibility Prediction: Karplus PA, Schulz GE. 1985. Prediction of chain flexibility in proteins. Naturwissenschaften 72:212-213.
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学