【1.2.2】Kozak序列

Kozak序列是位于真核生物mRNA 5’端帽子结构后面的一段核酸序列,通常是GCCACCAUGG,它可以与翻译起始因子结合而介导含有5’帽子结构的mRNA翻译起始。对应于原核生物的SD序列。存在于真核生物mRNA的一段序列,其在翻译的起始中有重要作用。

一、简介

与原核生物的核糖体结合位点(RBS)相对应,真核生物mRNA位于起始密码子AUG两侧的序列(通常为 ACCACCAUGG)通过与翻译起始因子的结合而介导含5’帽子结构的mRNA翻译起始,这段序列称为 Kozak序列。其中,AUG之后的第一位碱基G以及之前的第三位碱基A或G对翻译起始至关重要;此外,AUG上游的15个碱基中一般不含T [1] 。

kozak序列: Kozak consensus sequence,Kozak consensusor Kozak sequence,存在于真核生物mRNA的一段序列,其在翻译的起始中有重要作用。

核糖体能够识别mRNA上的这段序列,并把它作为翻译起始位点。注意这段序列并不是ribosomal binding site (RBS)核糖体结合位点,而是帽子结构。

真核生物基因中起始密码子上下游的最佳序列为,-3位为嘌呤碱基;+4位为G,起始密码子AUG中的A处于+1位。A/GCCAUGG被称为kozak序列或扫描序列。

KOZAK是一个女科学家,她研究过起始密码子AUG周边碱基定点突变后对转录和翻译所造成的影响,并总结出在真核生物中,起始密码子两端序列为:—— G/N-C/N-C/N-ANNAUGG——,如GCCACCAUGG、GCCAUGAUGG时,转录和翻译效率最高,特别是-3位的A对翻译效率非常重要。该序列被后人称为Kozak序列,并被应用于表达载体的构建中。

二、真核 Kozak序列和翻译起始的扫描模型

原核和真核生物mRNA翻译的重要组成元件是起始密码子AUG,但是mRNA的编码区也存在AUG。为什么第一个AUG能作为起始密码子而内部的AUG不能被起始翻译。其原因之一是第一个AUG的两侧翼序列是保守的序列,即AUG上游的-3位是A或G,下游+4位是G。

大多数原核mRNA是多顺反子,每个多顺反子有自己的起始密码子和核糖体结合位点;而真核mRNA则多为单顺反子。在起始翻译时,40S nRNA通常面临着一个任务,即发现靠近转录物5′端的起始密码子。 Marilyn Kozak于1978年首次提出了翻译起始的第一个AUG规则和扫描模型。她根据如下实验结果:①真核mRNA翻译起始并不利用编码区内部的AUC;②从mRNA5′端起,翻译并不在一个固定的位点起始

三、规则

所谓Kozak规则,即第一个AUG侧翼序列的碱基分布所满足的统计规律,若将第一个AUG中的碱基A,U,G分别标为1,2,3位,则Kozak规则可描述如下:

  1. 第4位的偏好碱基为G;
  2. AUG的5’端约15bp范围的侧翼序列内不含碱基T;
  3. 在-3,-6和-9位置,G是偏好碱基;
  4. 除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。

Kozak规则是基于已知数据的统计结果,不见得必须全部满足,一般来说,满足前两项即可 [3] 。

真核引物设计需在AUG前加上GCCACC。

不论全长还是部分,在做真核表达时,一般都要带上kozak序列,用部分cDNA时,还要加上AUG。多加一些上游序列是有利的,因为一些上游序列自带KOZAK序列;或其他促进表达的序列。有利于引物设计,因为从AUG开始设计引物,不是每个基因都可以的。引物扩增时头几个容易错,在上游序序列就没关系了。

加Kozak sequence(GCCACC)是用来增强真核基因的翻译效率的。是最优化的AUG环境,避免ribosome(核糖体)出现leaky scan。

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn