【5.2.1.7】由遗传密码产生的 mRNA 二级结构的周期性模式

单链 mRNA 分子通过互补的自我相互作用形成二级结构。关于核苷酸序列、编码的氨基酸序列和mRNA二级结构之间的关系已经提出了几种假设。

  1. 在这里,我们报告了人类和小鼠 mRNA 的转录组规模计算机分析结果。
  2. 我们描述了哺乳动物蛋白质编码转录本的一般结构特性,并证明遗传密码的结构在 mRNA 编码区产生了特定的核苷酸碱基配对周期性模式。
  3. 我们表明简并密码子位点对于在蛋白质编码区维持更有序和稳定的 mRNA 二级结构很重要。
  4. 我们还证明了 mRNA 功能域(5'-UTR、CDS、3'-UTR)优先自我折叠,并且参与翻译起始和终止的区域的特征在于二级结构水平降低。

1972 年,怀特等人表明遗传密码中的冗余允许核苷酸序列的广泛变异,并允许满足蛋白质结构和RNA结构的要求。Ball ( 2 ) 提出了三种关于氨基酸序列和mRNA二级结构之间关系的假设。

  1. 首先,信息中密码子及其序列的选择可以独立于所得的 mRNA 二级结构。
  2. 其次,mRNA二级结构的优化可能只发生在编码氨基酸序列的范围内。
  3. 第三,特定 RNA 二级结构的选择压力会影响同义和非同义位置的核苷酸选择。

惠誉 ( 3) 检查了这些假设,并发现了使用遗传密码的简并性来优化 mRNA 分子中的碱基配对的证据。他讨论了第三个假设在生物学上是合理的。然而,他没有找到证据支持(或反对)RNA 结构和功能的需求必须与蛋白质结构和功能的需求相竞争的观点

  1. Seffens 和 Digby ( 13 ) 报道天然 mRNA 的计算折叠自由能低于随机序列
  2. 最近,Lavner 和 Kotlar ( 27 ) 报道了表达水平和人类基因最佳密码子频率之间的弱正相关。
  3. 在几项研究中没有发现人类蛋白质编码序列中密码子的使用与异接受 tRNA 的丰度之间存在对应关系 ( 22 – 26 )

一、方法

  1. 人类(19 317 个序列)和小鼠(20 892 个序列)mRNA 的非冗余数据集是从人类和小鼠基因组的 RefSeq 数据库(ftp://ftp.ncbi.nlm.nih.gov/genomes)中编译的。
  2. 本研究仅分析了具有 5'-和 3'-UTR(50 nt 或更长)的完整 CDS(400 nt 或更长)的注释 mRNA 序列。先前描述了 6919 个直系同源人 - 小鼠 mRNA 对的数据集,这些 mRNA 对具有注释的 5'-UTR 和 3'-UTR,以及本研究中使用的正确对齐的起始和终止密码子 ( 35 )。
  3. Vista 计算工具用于对齐可视化 ( 36 , 37 )。
  4. 使用 BLAST 程序鉴定了来自各自基因组的蛋白质之间的对称最佳匹配(http://www.ncbi.nlm.nih.gov/BLAST/).
  5. mfold v.3.2 和 RNAalifold 预测结构

二、结果

2.1 序列保守性和 mRNA 稳定性

  1. 在编码区观察到明确定义的周期性守恒模式。前两个密码子位点的核苷酸最保守,而第三位的核苷酸最不保守。
  2. 在 CDS 中,我们还发现了核苷酸碱基配对和 mRNA 二级结构稳定性的明显周期性模式。第一个、第二个和第三个密码子位点配对核苷酸的频率显着不同(分别为 0.62、0.608 和 0.631,P < 10 -5)。
  3. 值得注意的是,第三个富含 GC 的密码子位点的碱基配对及其对 mRNA 二级结构稳定性的贡献显着高于第一个富含 G 位点或第二个富含 AU 位点的贡献。
  4. 在小鼠 mRNA 中观察到相同的核苷酸碱基配对周期性模式(补充图 1)。

当考虑到单个核苷酸参与二级结构形成时,核苷酸碱基配对的周期性模式变得更加明显

2.2 由遗传密码创建的核苷酸碱基配对模式

第几位密码子与第几位密码子配对,分成3种类型

在人类 mRNA 的 CDS 中观察到第 3 阶段优先碱基配对的明显偏差(图 4和表格1)。优先实现配对阶段 3 的明显原因是相对于其他位点,

  1. 第三个密码子位点的 GC 含量升高和碱基配对核苷酸(A ≈ U,C ≈ G)的频率接近等效(补充表 1)。
  2. 另一个原因是密码子位点 [2,3,1] 的三核苷酸频率接近于相同位点相应互补三核苷酸的频率,这导致配对核苷酸的频率相似(补充表 4)。此外,从表格1,与阶段 1 和阶段 2 相比,阶段 3 允许更密集的核苷酸配对。所有这些都促进了配对阶段 3 中相对于其他配对阶段的优先 mRNA 自折叠。
  3. 在人和小鼠转录本中观察到的这种类型的 mRNA 折叠也可能优先在其他分类群的转录本中实现。例如,Carlini等人。( 42 ) 发现同义位点 3-3 和 3-1 之间的碱基配对在果蝇乙醇脱氢酶基因中最为常见。

CDS 中 mRNA 折叠的一个特征是 AT 和 GC 碱基配对的周期性交替,这对于减少蛋白质编码区的局部强二级结构可能很重要。这种交替主要是由于人类基因组中第二个密码子位点的 AT 和第三个密码子位点的 GC 频率相对较高

我们观察到丰富和稀有 mRNA 之间二核苷酸频率和密码子频率的显着差异

2.3 mRNA功能域的折叠和保守

  1. 总体而言,与 3'-UTR 相比,5'-UTR 富含二级结构,这可以通过 5'-UTR 的更高 GC 含量来解释。5'-UTR 和 3'-UTR 中配对核苷酸的频率分别为 0.64 和 0.60。
  2. 在 5'-UTR 中,最显着的保守性(超过 75% 的同一性)出现在紧邻起始密码子上游的九个位置(图 1A)。
  3. 起始密码子上游 30 nt 区域的核苷酸保守水平与 CDS 中同义的第三个位置的核苷酸保守水平相当。在 5'-UTR 的更上游,保守水平降低到 50% 同一性的高原(数据未显示),这接近人鼠比对中的中性保守水平 ( 46 , 47 )。
  4. 在 3'-UTR 中,保守水平在终止密码子下游的 30 nt 区域内最低,在 3'-UTR 中进一步稳定上升(图 1B)。在这个 30 nt 区域内配对核苷酸的频率最高,并且在下游 3'-UTR 区域中稳步下降(数据未显示)。小鼠 mRNA 获得了类似的结果(补充图 1)。
  5. 这些数据与终止密码子下游 30 nt 富含 GC 的区域可能参与终止后扫描和核糖体与 mRNA 的解离有关的观点一致 ( 35 )。3'-UTR 结合负责转录稳定性的 miRNA 和蛋白质的要求通常会导致结合位点周围的局部不稳定,这提供了另一个理由表明 mRNA 分子的热力学稳定性得到了优化,而不是最小化(48 - 50 )。

我们评估了 mRNA 功能域内和之间的二级结构形成水平。作为图 5如图所示,相同结构域内的碱基配对水平最高,而非相邻结构域(5'-UTR-3'-UTR)之间的碱基配对水平最低。此外,随着与相邻域的距离增加,与相邻域的碱基配对水平迅速降低。从图中可以看出,这些水平在起始密码子(5'-UTR-CDS 边界)和终止密码子(CDS-3'-UTR 边界)周围的 60 nt 区域内下降了 2 倍。这些观察结果强调了局部二级结构在 mRNA 折叠中的主要作用。我们的结果表明二级结构主要在同一功能域内形成,并且三个功能域优先折叠到自身上。

2.4 在翻译起始和终止位点避免二级结构

5'-UTR-CDS 和 CDS-3'-UTR 边界以保守的二级结构为特征。起始密码子周围的序列保守性和核苷酸碱基配对谱显示了 AUG 周围的一定程度的对称性(图 1, ​,22和​和4)。4)。显然,起始密码子上游的前 9 个核苷酸,以及直接跟在 AUG 之后的密码子的同义位置比 CDS 的其余部分和 5'-UTR 中的纯化选择要强。因此,在起始密码子周围似乎有一个独特的功能信号,延伸到 Kozak 序列之外的 5'-UTR 和 CDS。mRNA二级结构在起始密码子的前两个位置和起始密码子上游的-1位置往往不太稳定,而在起始密码子的最后一个位置和第二个密码子的第一个位置更稳定。起始密码子的第一个和第二个核苷酸以及三个上游核苷酸倾向于不配对,而起始密码子的第三个核苷酸和几个下游核苷酸优先与 5'-UTR 碱基配对。

这些数据表明大部分人和小鼠mRNA的起始密码子和终止密码子位于局部环结构中。这与 CAV1 和 WNT2 转录物的起始密码子包含在发夹状二级结构元件的进化保守环区域中的观察结果一致 ( 12 )。这种围绕起始密码子和终止密码子的二级结构在哺乳动物中可能很常见,并且对于翻译的有效起始和终止可能很重要。AUG 两侧的核苷酸环境的功能重要性在几项研究中得到证实,这些研究将遗传疾病追踪到起始密码子周围的点突变[综述见 ( 10 )]。这些突变中的每一个都被证明会导致翻译减少。

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn