【1.2.2】Kozak序列

February 28, 2021 rna 阅读量：次

Kozak序列是位于真核生物mRNA 5’端帽子结构后面的一段核酸序列，通常是GCCACCAUGG，它可以与翻译起始因子结合而介导含有5’帽子结构的mRNA翻译起始。对应于原核生物的SD序列。存在于真核生物mRNA的一段序列，其在翻译的起始中有重要作用。

一、简介

与原核生物的核糖体结合位点(RBS)相对应，真核生物mRNA位于起始密码子AUG两侧的序列(通常为 ACCACCAUGG)通过与翻译起始因子的结合而介导含5’帽子结构的mRNA翻译起始，这段序列称为 Kozak序列。其中，AUG之后的第一位碱基G以及之前的第三位碱基A或G对翻译起始至关重要；此外，AUG上游的15个碱基中一般不含T [1] 。

kozak序列： Kozak consensus sequence，Kozak consensusor Kozak sequence，存在于真核生物mRNA的一段序列，其在翻译的起始中有重要作用。

核糖体能够识别mRNA上的这段序列，并把它作为翻译起始位点。注意这段序列并不是ribosomal binding site (RBS)核糖体结合位点，而是帽子结构。

真核生物基因中起始密码子上下游的最佳序列为，-3位为嘌呤碱基；+4位为G，起始密码子AUG中的A处于+1位。A/GCCAUGG被称为kozak序列或扫描序列。

KOZAK是一个女科学家，她研究过起始密码子AUG周边碱基定点突变后对转录和翻译所造成的影响，并总结出在真核生物中，起始密码子两端序列为：—— G/N-C/N-C/N-ANNAUGG——，如GCCACCAUGG、GCCAUGAUGG时，转录和翻译效率最高，特别是-3位的A对翻译效率非常重要。该序列被后人称为Kozak序列，并被应用于表达载体的构建中。

二、真核 Kozak序列和翻译起始的扫描模型

原核和真核生物mRNA翻译的重要组成元件是起始密码子AUG，但是mRNA的编码区也存在AUG。为什么第一个AUG能作为起始密码子而内部的AUG不能被起始翻译。其原因之一是第一个AUG的两侧翼序列是保守的序列，即AUG上游的-3位是A或G，下游+4位是G。

大多数原核mRNA是多顺反子，每个多顺反子有自己的起始密码子和核糖体结合位点；而真核mRNA则多为单顺反子。在起始翻译时，40S nRNA通常面临着一个任务，即发现靠近转录物5′端的起始密码子。 Marilyn Kozak于1978年首次提出了翻译起始的第一个AUG规则和扫描模型。她根据如下实验结果：①真核mRNA翻译起始并不利用编码区内部的AUC；②从mRNA5′端起，翻译并不在一个固定的位点起始

三、规则

所谓Kozak规则，即第一个AUG侧翼序列的碱基分布所满足的统计规律，若将第一个AUG中的碱基A，U，G分别标为1，2，3位，则Kozak规则可描述如下：

第4位的偏好碱基为G；
AUG的5’端约15bp范围的侧翼序列内不含碱基T；
在-3，-6和-9位置，G是偏好碱基；
除-3，-6和-9位，在整个侧翼序列区，C是偏好碱基。

Kozak规则是基于已知数据的统计结果，不见得必须全部满足，一般来说，满足前两项即可 [3] 。

真核引物设计需在AUG前加上GCCACC。

不论全长还是部分，在做真核表达时，一般都要带上kozak序列，用部分cDNA时，还要加上AUG。多加一些上游序列是有利的，因为一些上游序列自带KOZAK序列；或其他促进表达的序列。有利于引物设计，因为从AUG开始设计引物，不是每个基因都可以的。引物扩增时头几个容易错，在上游序序列就没关系了。

加Kozak sequence(GCCACC)是用来增强真核基因的翻译效率的。是最优化的AUG环境，避免ribosome（核糖体）出现leaky scan。

参考资料

https://baike.baidu.com/item/kozak%E5%BA%8F%E5%88%97/5573928?fr=aladdin

这里是一个广告位，，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn