【5.1】蛋白质跨膜结构域预测
一 跨膜蛋白的定义
由双层脂类组成的生物膜结构是细胞的基本构成单元,然而,生物膜的大部分功能是由镶嵌在生物膜中的蛋白质来完成的,膜蛋白决定了生物膜的功能特性,因此,不同类型的生物膜,其蛋白构成比例有很大的差别,以质量来算,从25%到75%不等。另一个角度来说,生物体内的蛋白质中,20-30%都属于膜蛋白,因此膜蛋白在细胞的功能中占据重要地位是显而易见的。由于膜蛋白很难得到大量外源表达,纯化、结晶也非常困难,所以得到结晶X线衍射明确其结构的膜蛋白至今仍然很少,目前对于膜蛋白的结构研究,仍然处于起步阶 段。
膜蛋白包括:
- integral membrane protein
- peripheral membrane protein
在integral膜蛋白中,与细胞膜的结合也有几种不同的方式,其中主要方式是肽段直接跨过细胞膜,即transmembrane protein(跨膜蛋白),另外还有通过脂肪基与细胞膜发生共价结合,蛋白本身可以在细胞内侧,也可以在细胞膜外侧。跨膜蛋白一般以疏水的alpha- helix与膜脂肪发生非共价结合,在细胞中常执行信号传导或转运通道功能,因此是研究最集中的一类蛋白质。这里介绍的是膜蛋白二级结构中alpha- helix的预测和跨膜结构生化分析相关方法学。
跨膜(TM)蛋白跨过整个脂膜,通常被分为两类α-helical TM (AHTM) 和TM β-barrel (TMB) proteins。AHTM定位在细菌细胞膜的内膜和真核生物的细胞膜上。它们的跨膜区域有极性的环链接而成的α螺旋。对TMB蛋白的了解还不多,它们的跨膜域为反向平行的桶装β链通道[9]。
通过实验的方法(X-ray和NMR等)来决定TM蛋白的结构,相比较于球状蛋白,解析的TM蛋白3D结构非常有限。因此,人们开发了很多的方法用来预测蛋白质的跨膜结构域。这些方法中的大部分都只根据序列来识别跨膜结构。表五列举了常用的在线跨膜结构域预测工具。
二 跨膜蛋白的预测方法
有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋**Tmbase 数据库**,可通过匿名FTP获得,TMPRED基于对tmpred数据库的统计分析,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
三 预测工具
表五 在线跨膜结构域预测工具(更多工具参见http://www.bio-soft.net/prool.html)
工具 | 方法 | 预测的结构 | 网络链接 |
---|---|---|---|
DAS-TMfilter | DAS | AHTM | http://mendel.imp.ac.at/sat/DAS/DAS.html |
MINNOU | RSA/SS | AHTM and TMB | http://minnou.cchmc.org/ |
PRED-TMMB | HMM | TMB | http://bioinformatics.biol.uoa.gr/ PRED-TMBB/input.jsp |
PRED-TMR | Hydrophobicity profile | AHTM and TMB | http://athina.biol.uoa.gr/PRED-TMR/input.html |
SOSUI | Hydropathy scale | AHTM | http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html |
TMBETA-NET | Amino acid composition; NNs | TMB | http://psfs.cbrc.jp/tmbeta-net/ |
TMB-Hunt | k-NN algorithm | TMB | http://bmbpcu36.leeds.ac.uk/~andy/betaBarrel/AACompPred/aaTMB_Hunt.cgi |
TMMOD | HMM profile | AHTM | http://liao.cis.udel.edu/website/servers/TMMOD/scripts/frame.php?p=submit |
TSEG | Tandem clusters of membrane proteins | AHTM and TMB | http://www.genome.ad.jp/ |
-
TMpred:预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通过加权打分进行预测。
-
DAS 蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。
斯德哥尔摩大学理论化学蛋白预测服务器提供的膜蛋白拓扑学预测Topology prediction of membrane proteins在线工具
四 我选用的工具
TMHMM Server v. 2.0这个工具既有网页版,还有下载版,网页版有上传序列文件和粘贴序列两种方式 3种输出结果:
4.1 Extensive, with graphics
4.2 Extensive, no graphics
4.3One line per protein模式的结果:
108_1 len=721 ExpAA=128.17 First60=19.38 PredHel=6 Topology=o27-44i87-109o129-151i174-196o201-223i236-258o
##len代表输入序列的长度,ExpAA代表预测出来的跨膜区的aa个数,
First60序列前60个aa中有多少个是处于跨膜区,
<span style="color: #ff0000;">Total prob of N-in: 0.00103???</span>
topology中o代表膜外,i代表膜内,中间的数字代表跨膜区的碱基
# 108_1 Length: 721
# 108_1 Number of predicted TMHs: 6
# 108_1 Exp number of AAs in TMHs: 128.17376
# 108_1 Exp number, first 60 AAs: 19.38109
# 108_1 Total prob of N-in: 0.00103
参考资料
- 百度文库:http://wenku.baidu.com/view/ac77ea14e45c3b3567ec8b73.html
- http://bbs.jlu.edu.cn/cgi-bin/bbscon?board=DB&file=M.1068276668.A&num=1630
- http://emuch.net/bbs/viewthread.php?tid=1338175&fpage=1&target=blank
- http://www.bio-soft.net/prool.html (上面提到了很多预测工具)
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn