【4.1.1】RNA 结构和功能之间相互作用

NA 采用特定的结构来执行其生物活性。RNA 的结构是基因表达调控的重要层,可以影响大量的细胞过程,从转录、RNA 加工和翻译开始,到 RNA 转换结束。

RNA分子具有许多重要功能。它们不仅作为 DNA 和蛋白质之间的中间体参与基因表达,而且还参与许多其他细胞过程。已经出现单链 RNA 可以折叠成的 RNA 结构 [ 1 ],增加了调节转录、转录后加工、翻译和蛋白质折叠、细胞定位、稳定性等机制所需的另一层信息

随着体内研究数量的增加,将细胞 RNA 结构视为“湿意大利面”的观点已被取代 [ 16 ]。越来越多的证据表明,RNA 结构会受到各种细胞因素的影响,但 RNA 仍然包含明确的结构基序,这些基序通常表现出重要的调节功能(图 1)

二、RNA 结构测定的方法

长期以来,我们对 RNA 二级结构的了解主要基于计算机计算方法,这些方法计算 RNA 的最热力学有利状态或预测多个同源 RNA 序列中保守的共有结构。

  1. 尽管计算预测仍在开发中,但它们通常对具有复杂结构基序的长 RNA 无效,
  2. 并且通常不考虑可能影响 RNA 折叠的生理条件和细胞因素 [ 21]。
  3. 然而,RNA 结构的酶学和化学探测技术的进步以及将基于实验的数据整合到折叠算法中,可以显着提高计算 RNA 结构预测的准确性 [ 22 , 23 , 24 ]。

如今,RNA 探测技术主要依赖于以碱基或糖特异性方式对 RNA 进行化学修饰,这些修饰由逆转录酶 (RT) 检测,该逆转录酶要么将合成的 cDNA 截短一个核苷酸,要么将突变插入位点。 将 RNA 化学探测与下一代测序和先进的生物信息学工具相结合,扩大了在体外和体内对 RNA 结构进行高通量有效研究的可用方案的数量(表1)[ 10,26,27,28,29 ]。

对于细胞 RNA 结构研究,化学物质穿透细胞膜的能力至关重要。迄今为止,可用于体内 RNA 二级结构测定的试剂很少 [ 30 ]]。其中,DMS(硫酸二甲酯)和为 SHAPE 方法(通过引物延伸分析选择性 2'-羟基酰化)开发的试剂在体内研究中应用最为广泛。DMS 修饰未配对的腺嘌呤和胞嘧啶,但尿嘧啶和鸟嘌呤仍然没有结构信息 [ 3 , 31 , 32 ]。SHAPE 试剂以独立于碱基的方式发挥作用,并提供所有四个核苷酸残基的结构数据 [ 25 , 33 , 34 ]。此外,将 SHAPE 和 DMS 探测数据整合到 RNA 结构预测算法中的方法已经确立

三、mRNA结构与翻译的相关性

除了它们的蛋白质编码功能外,mRNA 还包含具有特定二级结构的顺式作用序列,可以调节翻译效率 (TE,translation eciency)。翻译和RNA结构之间的相互作用构成了讨论的主题,RNA结构是否指导翻译或翻译是否指导细胞中的RNA结构仍然是一个悬而未决的问题(表2和图2)。

  1. 一般来说,稳定的 mRNA 结构元件倾向于降低 TE 的发生率,可能是通过阻碍核糖体结合或减慢其运动 [ 6 , 40 ];
  2. 然而,另一方面,核糖体具有解旋酶活性 [ 47],并已被提议作为细胞中 mRNA 结构的主要重塑剂 [ 39 , 43 ]。

3.1 5' 和 3' UTR

  1. 大量研究表明,5’UTR 和 mRNA 起始密码子附近的稳定结构可以抑制细菌和真核生物中翻译的有效起始 [ 54 , 55 ]。对大肠杆菌转录组的 RNA 结构(PARS;将体外 RNA 片段的消化与深度测序相结合)与核糖体分析相辅相成的首次平行分析表明,起始密码子上游的非结构化序列是一般的大肠杆菌基因的特征和该区域的二级结构与基因表达呈负相关[ 45 ]。

  2. 最近在活大肠杆菌中进行的 SHAPE-MaP 实验中发现了一致的发现细胞表明翻译效率受与核糖体结合位点 (RBS) 重叠的结构的展开动力学调节 [ 43 ]。根据 RBS 动力学展开模型,具有非结构化 RBS 的基因具有高 TE,而具有高度结构化 RBS 的基因则观察到低 TE。相比之下,大肠杆菌体内转录组的 DMS-seq 分析表明,TE 仅与局部 RBS 结构微弱相关,而是受整个编码序列 (CDS) [ 40 ] 的结构的调节(见下文)。

  3. 在使用 icSHAPE 进行的小鼠和人类 mRNA 研究中观察到细胞质 5' UTR 的高结构与 TE 之间存在负相关 [ 10 , 37 ]。在小鼠 mRNA 中,AUG 密码子前面有一个 5-nt 序列,在体外和体内均具有更高的可访问性,这表明翻译起始位点周围的结构是由 RNA 序列编程的 [ 10 ]。在拟南芥转录组的结构研究中报告了一致的发现[ 8]。通过应用结构序列协议,他们表明,起始密码子附近平均 mRNA 结构的减少有助于核糖体结合和翻译机制的启动。 5' UTR 折叠成的结构可以调节翻译的帽依赖性和帽非依赖性起始[ 54 ]。

  4. 帽区域中的各种高阶 RNA 结构,包括假结、发夹和 RNA G-四链体,往往会抑制翻译 [ 56 , 57 ]。然而,不依赖帽的调控 RNA 结构,包括 IRES(内部核糖体结合位点)或结合eIF3的茎环结构,可以通过促进将翻译机制加载到 mRNA 上来刺激翻译[ 58、59、60]。

  5. 3' UTR 中的结构元素对翻译的直接影响仍未完全被发现,这些结构通常在 RNA 稳定性的背景下进行探索(见下文)。然而,不可否认,RNA 稳定性和翻译效率是不可分割的,而且很多时候,包括控制转录稳定性和衰变的 3' UTR 结合蛋白在内的因素也参与了 TE 调节 [ 61 , 62 , 63 ]

3.2. 编码序列 (CDS)

  1. 一般来说,mRNAs 在细胞中的结构比体外低,但已发现不同物种之间的 RNA 结构模式不同。在大肠杆菌转录本中,尤其是 mRNA 的编码区在体内往往结构较少 [ 40 , 43 ]。在斑马鱼体内也观察到 CDS 的强烈不稳定 [ 39 ]。此外,与 UTR 相比,脱蛋白小鼠转录本的整体分析显示 CDS 中的结构程度较低 [ 46 ]。相比之下,在拟南芥和酵母中,CDS 的平均体内结构分别高于或无法与 UTR 区分开来 [ 8 , 9 ]。此外,在水稻(Oryza sativa ),CDS 区域的结构高于 3' UTR,但低于 5' UTR [ 39 , 42 ]。

  2. CDS 结构与核糖体密度之间的相关性在大肠杆菌体外转录组的 PARS 研究中未发现[ 45 ],但基于 DMS-seq 或 SHAPE-MaP 的体内转录组分析和大肠杆菌中的核糖体分析。大肠杆菌在 mRNA 结构和 TE 之间表现出很强的负相关性 [ 40 , 43]。在细胞中,高度翻译的 ORF 似乎具有较低的 RNA 结构,相反,那些翻译不佳的 ORF 表现出高水平的 RNA 结构。此外,这些研究表明,抑制翻译(通过春日霉素处理)导致 CDS 结构稳定,并且最大的结构差异往往恰好出现在高度翻译的基因中。因此,这些观察结果表明核糖体诱导的去折叠有助于细胞中 mRNA 结构的不稳定。穆斯托等人还发现 TE 与体内 CDS 结构之间的相关性远弱于 RBS 结构和 TE 之间的相关性,并提出 TE 不受下游 CDS 结构的影响(另见第 3.1 节)。

  3. 相比之下,Burkhardt 等人。研究指出了内在 CDS 结构在 TE 调谐中的关键作用,而其他特征,例如二级结构和 RBS 的强度,或密码子的使用,与 mRNA 可翻译性仅微弱相关 [ 40 ]。此外,ORF mRNAs 已被证明具有模块化结构,并且一个操纵子内相邻 ORFs 的结构和 TE 可能存在显着差异。 在母体向合子转变 (MZT) 期间斑马鱼胚胎的转录组范围的 DMS-seq 分析中也观察到 RNA 结构和 TE 之间的强相关性 [ 39]。已发现母体转录本的 TE 降低与 DMS 反应性降低有关,表明 RNA 结构增加,反之亦然;具有较高 TE 率的转录本结构较少。 铁汉 10:54:04

  4. 此外,在高度翻译的 mRNA 中,CDS 区域比 5' UTR 更容易接近。此外,在用翻译起始抑制剂 (pateamine A) 处理的胚胎中,TE 和 CDS 对 DMS 的可及性均显着降低。然而,在用翻译延伸抑制剂(放线菌酮)处理的胚胎中,没有观察到这种效果。这些发现表明,翻译的开始和核糖体进入对于将 mRNA 解旋成更不稳定、更开放的结构至关重要。38 ]。总之,现有数据表明,至少在某些情况下,核糖体对 RNA 结构有深远的影响,而编码区的固有结构似乎对翻译效率几乎没有影响。

  5. 与上述研究相反,酵母中早期的全基因组 DMS-seq RNA 结构分析表明 RNA 在体内的全局展开,这与翻译机制无关 [ 9]。在这项研究中,CDS 的平均体内 RNA 结构与 UTR 的结构没有差异,并且 RNA 结构的减少与核糖体占据无关,因此表明翻译和 RNA 结构在酵母中不相关。

  6. 基于在 ATP 耗尽条件下对 RNA 结构稳定性的观察,作者提出了能量依赖性因子,例如 ATP 依赖性解旋酶在酵母 mRNA 的展开中的重要贡献。然而,翻译是主要的能量消耗过程之一,而 ATP 消耗也可以抑制核糖体的作用 [ 64 , 65 ]。 此外,最近对跨亚细胞区室的哺乳动物 RNA 结构的研究表明,大多数转录物在从染色质转移到核质和细胞质时保留了它们的结构 [ 37 ]。这表明内在的 RNA 结构在连接转录、翻译和 RNA 降解方面起着核心作用。

  7. 尽管观察到总体趋势,即 TE 率较低的 RNA 往往更具结构化,但本研究挑战了 CDS 结构与翻译效率之间的联系,并强调了 RNA 结合蛋白和 RNA 转录后修饰对局部 RNA 结构变化的作用。相比之下,在拟南芥的全基因组分析中发现了核和细胞溶质 mRNA 之间的结构差异。转录组 [ 8 , 41 ]。 在包括小鼠、拟南芥和水稻 ( Oryza sativa )在内的多种生物体内检测到的编码区的一个有趣特征是mRNA 二级结构中的三核苷酸周期性 [ 8 , 10 , 42 , 66 ]。这些研究发现,这种周期性重复模式与体内核糖体密度显着相关,因此可以促进翻译。然而,在最近的大肠杆菌全转录组研究中没有观察到三核苷酸周期性[ 43 ]。

4. 与 RNA 稳定性和降解相关的 RNA 结构

细胞中 mRNA 分子的稳定性和命运受到严格控制,在其生命周期结束时,RNA 会经历精心调控的降解。5'-末端的帽和 3'-末端的 poly(A) 尾被认为是 mRNA 稳定性的主要决定因素,但它也可以受转录物的其他内在特征的调节,例如序列、长度,以及 UTR 的结构和 UTR 中的 RNA 修饰 [ 3 , 48 , 49 , 67 , 68 ]。体内全转录组研究提供了越来越多的证据表明 RNA 结构特征可以控制 RNA 寿命(表 2)。位于 UTR 中的序列构成多种反式作用细胞因子的结合位点,包括 RNA 结合蛋白 (RBP) 和 microRNA [ 69 , 70 ],UTR 结构的改变可能会影响它们的结合和 RNA 的稳定性。mRNA 的长度与其在细胞中的稳定性呈负相关,较长的转录本在许多物种中的半衰期较短 [ 48 , 73 ]。

在人类和酵母中,5' UTR 的结构与 mRNA 稳定性呈负相关,而 3' UTR 的二级结构与更长的半衰期和更高的 mRNA 丰度相关 [ 44 , 50 , 68 ]。 3' UTR 中的稳定结构元件可能会阻断主要导致真核生物中 RNA 降解的外泌体复合物 [ 74 ]。在人类细胞中,mRNA 3'-末端的展开程度往往低于其他 mRNA 区域,并且 3'-末端的特定结构可以通过并列 poly(A) 信号 (PAS) 和切割位点促进人类 mRNA 的切割和多聚腺苷酸化。否则相距太远 [ 50]。有趣的是,另一项研究发现人类和小鼠细胞中的 RNA 结构和 RNA 半衰期之间存在负相关:结构更复杂的 RNA 在细胞核和细胞质中的半衰期往往更短 [ 37 ]。他们还提出,RNA 降解不是 RNA 区域特异性的,因为在 5' UTR、CDS 和 3' UTR 中观察到了相同的趋势。

与人类 mRNA 相比,在酵母中,3' 端的 RNA 结构含量与其他 mRNA 区域相似 [ 9 ]。然而,对具有不同半衰期的酵母 mRNA 异构体簇的全局分析表明,3' 端的双链结构,包括或不涉及 poly(A) 尾,是酵母中 mRNA 稳定性的关键决定因素。 [ 48]。还发现稳定的 polyU-poly(A) 茎环的形成可以抑制 poly(A) 结合蛋白(例如 Pab1、Ski2 和 Xrn1)的结合并导致 mRNA 稳定性增加。在最近的酵母转录组研究中获得了类似的发现,证实了 3' 端结构与 mRNA 同种型稳定性之间的相关性,并表明即使是密切相关的 mRNA 同种型也可以在体内 3’UTR 中形成完全不同的结构,并且它们可能发生在远离聚(A)位点的地方。该研究还表明,靠近 3' 端的单链性、poly(A) 尾的双链性以及低 Pab1 结合与 mRNA 稳定性有关,并且在进化上是保守的 [ 49 ]。

在斑马鱼体内也观察到 3'-末端结构对 mRNA 稳定性的重要作用。斑马鱼 mRNA 的 3' UTR 在结构上是动态的,其结构的变化可以通过调节 miRNA 活性来调节 MZT 期间 mRNA 的稳定性 [ 39 ]。此外,斑马鱼 mRNA 的 3' UTR 富含控制 MZT 期间 mRNA 衰变的顺式作用调节元件,并已使用高通量 RNA 元件选择分析 (RESA) 进行了详细表征,该分析能够识别调节序列近核苷酸分辨率的 RNA 稳定性 [ 75 ]。对水稻中热调节 RNA 结构组的体内研究表明,mRNA 去折叠与 RNA 半衰期相关,并支持两种 UTR 对植物 mRNA 稳定性的重要性。52 ]。研究发现,UTR 中的热诱导结构变化比其他 RNA 区域更大,并且 5'- 和 3'- 末端的展开有助于进入 RNA 降解机制。 铁汉 10:54:05 此外,全基因组 RNA 衰变分析表明,密码子优化对于许多生物体中的 mRNA 稳定性也至关重要,包括大肠杆菌[ 76 ]、酵母 [ 77 ]、斑马鱼 [ 78 ]、黑腹果蝇[ 79 ] 和人类 [ 80 ]。稳定的 mRNA 富含最佳密码子,而不太稳定的 mRNA 主要包含非最佳密码子并具有较短的 poly(A) 尾。

五、RNA结构与蛋白质结合的关系

现代技术将高通量测序与体内 UV 交联和 RNA 免疫沉淀(例如 CLIP-seq、RIP-seq 和 RIP-Chip)相结合,以及新的计算方法,为 RNA 结合蛋白质组的前景提供了新的见解 [ 81 ]。迄今为止,已在人类 RNA 结合蛋白质组中鉴定出 1753 种蛋白质,包括 978 种与 poly(A) RNA 相互作用的蛋白质和 775 种与非 poly(A) RNA 结合的蛋白质,突出了体内 RNA-蛋白质相互作用的复杂性。。RNA 结合蛋白 (RBP) 协调所有必需的细胞过程,并且是 mRNA 和 ncRNA 的共转录和转录后调控中不可或缺的元素。各种 RBP 可以跨细胞区室和生命周期的不同步骤动态结合 RNA,包括 RNA 转录、转录后加工、翻译、稳定性和衰变 [ 70 , 83 ]。人类和酵母 RNA 结合蛋白质组的比较分析表明,体内 RNA 结合活性和许多 RBP 的结构特征在真核生物中是高度保守的 [ 84 ]。

许多RBP需要识别特定的 RNA 序列或结构以使其在细胞中发挥功能 [ 85、86、87 ] ,但其他蛋白质可以以非特异性方式结合 RNA,包括可以重塑 RNA 结构并促进与其他合作伙伴的相互作用,如体外研究所示 [ 88 , 89]。然而,细胞转录组和蛋白质组之间的调控网络才刚刚开始被理解,对靶 RNA 序列和体内 RBP 的结构偏好知之甚少。对体内 RNA 相互作用组中复杂相互作用的全基因组研究仍然具有挑战性,因为 RNA-蛋白质复合物在 RNA 寿命期间往往是动态的和变化的。先进的全球研究将 RNA 结合蛋白质组的大规模研究与来自体内转录组范围的 RNA 结构探测的结构信息联系起来。他们证实了 RBP 与 5' 和 3' UTR 中特定序列的结合,以及这些相互作用对翻译起始、RNA 加工及其在细胞中的稳定性的关键作用(表 2,见上文)。这些研究还表明,很大一部分 RNA 结合基序存在于编码区和内含子中 [ 90 , 91 ]。酿酒酵母转录本中单个 RNA 结构与其相互作用蛋白的关联表明,许多 RBP 识别 CDS 中进化上保守的 RNA 结构,可能由简并密码子形成 [ 90 ]。已经提出这些相互作用来调节转录后过程,例如 tRNA 结合和核糖体生物合成,或者这些 RBP 可以充当代谢酶或激酶。

最近对人类转录组的一项研究侧重于 RNA 结构与其促进蛋白质结合能力之间的相互作用,揭示了一种称为 RNA 结构驱动的蛋白质相互作用的关系,它具有重要的功能作用 [ 53]。根据这一理论,RNA 分子中的结构内容调节蛋白质结合的数量。RBP 与富含双链区域的高度结构化的 RNA 相互作用更多,而对于结构不良的转录本则发现了相反的趋势。此外,高度结构化的转录物优先结合多肽并编码参与大量细胞网络的调节蛋白。这些发现表明高度和结构差的 RNA 之间的功能差异,并表明存在一个新的、复杂的基因表达转录后调控层。虽然这种关系需要更深入地研究,91 ]。

相比之下,哺乳动物细胞中的其他全基因组研究指出 RBP 对 RNA 结构重排的贡献不同于核糖体或 ATP 解旋酶诱导的 RNA 解旋 [ 10 , 37 ]。由于 RBP 的不同子集可以结合特定细胞区室中的 RNA,因此有人提出它们可以解释在染色质、核质和细胞质之间观察到的局部 RNA 结构变化 [ 37 ]。例如,异质核核糖核蛋白 C (HNRNPC) 剪接因子,优先识别单链尿苷束 [ 92 ],直接参与其结合位点周围 RNA 结构的不稳定,与 m 6一起一种修饰有助于染色质 RNA 部分中的 HNRNPC 结合 [ 37 ]。相比之下,Staufen 同源物 I,它是一种双链结合 RBP,参与 mRNA 到不同亚细胞区室的运输和定位 [ 93 ],似乎在 RNA 从染色质释放后参与稳定 RNA 结构 [ 37 ] .

六、RNA 修饰对体内 RNA 结构的影响

由于 RNA 在其生命周期中经历了许多转录后修饰,因此向其碱基添加各种化学基团可以显着影响 RNA 的折叠、稳定性以及与细胞因子的相互作用[ 94、95、96 ]。RNA 修饰模式的异常与人类的各种疾病有关,例如癌症发生 [ 97 ]。在数百种可能的 RNA 化学修饰中,mRNA 中最丰富的是 N 6 -甲基腺苷 (m 6 A)。因此,m 6 A 修饰在研究中特别受关注也就不足为奇了。开发一个 m 6RNA 免疫沉淀方法和高通量测序 (MeRIP-seq) 允许以转录组范围的方式研究 m 6 A 修饰景观 [ 98 , 99 ]。这些研究在 7000 多个人类转录本中识别出超过 12,000 m 6 A 位点,主要是在序列 GGm 6 ACU 的背景下。m 6 A 修饰位点在人和小鼠之间高度保守,优先出现在内部长外显子、终止密码子周围和 3’UTR 中。然而,确切的功能,特别是对 RNA 折叠的影响仍未完全了解。m 6的调节功能mRNA 修饰已在转录、剪接、mRNA 输出和稳定性以及翻译中显示出来 [ 37 , 99 , 100 , 101 , 102 ]。它还可以影响各种生理过程,例如在斑马鱼 MZT [ 103 ]、哺乳动物皮质神经发生 [ 104 ] 期间清除母体 mRNA,并在人类癌症中发挥调节作用 [ 105 , 106 ]。

热力学研究表明,m 6 A 影响 RNA 结构,因为甲基氨基从顺构象到反构象的旋转具有更高的能量,从而使 RNA 双链体的稳定性降低 0.5-1.7 kcal/mol [ 51 ]。在 RNA 的单链区域观察到相反的效果,其中 m 6 A 可能有助于增加 RNA 分子的稳定性,可能是通过碱基堆积。人类转录组的离体研究证实了 m 6 A 修饰位点的结构 RNA 变化,具有展开 RNA 二级结构的强烈趋势 [ 51 ]。因此,m 6的出现RNA 中的 A 被提议用作 RNA 结构的“分子开关”[ 107 ]。斯皮塔莱等人。首先包括 m 6 A 修饰与未修饰转录物的体内 SHAPE 反应性,并表明在细胞 RNA 区域中,包括修饰的 A 残基周围和包括修饰的 A 残基,往往是不成对的 [ 10 ]。为了检查修饰位点碱基配对减少是否是由于 m 6 A 对 RNA 双链体的不稳定影响或修饰机制优先甲基化 RNA 单链位点的腺苷,他们进行了 N 6 -腺苷-甲基转移酶的基因敲除。 Mettl3 ) 在小鼠 ES 细胞中。Mettl3的消耗导致 m 6 A 修饰位点的 SHAPE 信号在转录组范围内减少,证实了 m 6 A 修饰在体内的 RNA 不稳定特性。

最近对哺乳动物细胞中三个不同细胞区室的全转录组研究进一步支持,转录本中的 m 6 A 富集区域的结构远不如相同但未甲基化的 RNA 位点,以及 m 6 A 诱导的结构不稳定模式在染色质、核质和细胞质中相似 [ 37 ]。然而,RNA 从染色质释放到核质后,RNA 结构更加开放,这与METTL3-METTL14复合物定位于特定核位点一致 [ 102 , 108]。此外,在所有分析的隔间中,RNA 修饰与结构变化位点和 RBP 结合都显着重叠,这表明许多 RBP 需要由 RNA 的 m 6 A 局部失稳诱导才能结合。例如,在染色质部分,m 6 A 修饰可以通过破坏靠近结合位点的局部 RNA 二级结构来促进 HNRNPC 的结合 [ 37 , 107 ]。此外,m 6 A 可以作为植物中的“RNA 分子开关”[ 42 ]。然而,结构变化与 m 6之间的显着相关性水稻中的 A 仅在 3' UTR 中观察到,而不在 CDS 或 5' UTR 区域中观察到。

7. 结论和未来展望

最近的全转录组研究显着增加了对细胞中 RNA 二级结构和 RNA 功能之间相互作用的认识。它们允许考虑各种细胞因素对体内 RNA 折叠的影响,反之亦然,以及 RNA 结构对关键生物过程的影响。然而,仍有许多未解决的问题和挑战。例如,尚不清楚 RNA 折叠模式是物种特异性还是观察到的差异是由应用各种 RNA 结构探测方法引起的。一个重要的进步领域是进一步开发方法,以更准确地研究共存的 RNA 构象异构体、RNA 共转录折叠以及分子内 RNA 相互作用和分子间 RNA-蛋白质或 RNA-RNA 结合的分化。

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn