跳转到内容

生物化学与分子生物学/RNA的空间结构与功能

维基教科书,自由的教学读本

核酸的结构与功能- 核酸的化学组成以及一级结构 - DNA的空间结构与功能 - RNA的空间结构与功能 - 核酸的理化性质
一般而言,RNA是DNA的转录产物。和DNA一样,RNA在生命活动中发挥着重要的作用。RNA可以分为编码RNA(coding RNA)和非编码RNA(non-coding RNA)。编码RNA是那些从基因组上转录而来、其核苷酸序列可以翻译成蛋白质的RNA,编码RNA仅有信使RNA(messenger RNA, mRNA)一种。非编码RNA不编码蛋白质。非编码RNA可以分为两类。一类是确保实现基本生物学功能的RNA, 包括转运RNA(transfer RNA, tRNA)、核糖体RNA(ribosomal RNA, rRNA)、端粒RNA、信号识别颗粒(signal recognition particle, SRP) RNA等,它们的丰度基本恒定,故称为组成性非编码RNA(constitutive non-coding RNA)。另一类是调控性非编码RNA(regulatory non-coding RNA), 它们的丰度随外界环境(应激条件等)和细胞性状(成熟度、代谢活跃度、健康状态等)而发生改变,在基因表达过程中发挥重要的调控作用。
RNA 通常以单链形式存在,较长的RNA可以通过链内的碱基互补配对形成局部的双螺旋二级结构以及复杂的高级结构。RNA的种类、丰度、大小和空间结构要比DNA复杂得多,这与它的功能多样性密切相关。

mRNA是蛋白质生物合成的模板

[编辑]

20世纪40年代,科学家发现细胞质内蛋白质的合成速度与RNA水平相关。1960年,F. Jacob和J. Monod等人用放射性核素示踪实验证实,一类大小不一的RNA才是细胞内合成蛋白质的真正模板。后来这类RNA被证明是在核内以DNA为模板的合成产物,然后转移至细胞质内。这类RNA被命名为信使RNA(mRNA)。
在生物体内,mRNA的丰度最小,仅占细胞RNA总重量的2%~5%。但是mRNA的种类最多,约有105个之多,而且它们的大小也各不相同。mRNA的平均寿命也相差甚大,从几分钟到几小时不等。在真核细胞中,细胞核内新生成的mRNA初级产物被称为核不均一RNA (heterogeneous nuclear RNA, hnRNA)。hnRNA在细胞核内合成后,经过一系列的转录后修饰,剪接成为成熟mRNA, 最后被转运到细胞质中。

  • 真核细胞mRNA的5'-端有帽结构

大部分真核细胞mRNA的5'-端都有一个反式7-甲基鸟嘌呤-三磷酸核苷(m7Gppp)的起始结构,被称为5'-帽结构(5'-cap structure)。5'-帽结构是鸟苷酸转移酶将鸟嘌呤三磷酸核苷加到转录后的mRNA的5'-端,形成了一个5'-5'三磷酸键,使mRNA的5'-端不再具有磷酸基团。5'-帽结构下游的第一个和第二个核苷酸中C-2'的羟基通常也会被甲基化成为甲氧基戊糖,由此产生数种不同的帽结构。原核生物mRNA没有这种特殊的5'-帽结构。
真核生物mRNA的5'-帽结构可以与一类称为帽结合蛋白(cap binding protein, CBP) 的分子结合形成复合体。这种复合体有助于维持mRNA的稳定性,协同mRNA从细胞核向细胞质的转运,以及在蛋白质生物合成中促进核糖体和翻译起始因子的结合。

  • 真核生物和有些原核生物mRNA的3'-端有多聚腺苷酸尾的结构

真核生物mRNA的3'-端是一段由80~250个腺苷酸连接而成的多聚腺苷酸结构,称为多聚腺苷酸尾或多聚(A)尾[poly(A)-tail]结构。多聚(A)尾结构是在mRNA转录完成以后加入的,催化这一反应的酶是多聚腺苷酸聚合酶。在细胞内,多聚(A)尾结构与poly(A)结合蛋白[ poly(A)-binding protein, PABP]结合,大约每20个腺苷酸结合一个PABP分子。目前认为,这种3'-多聚(A)尾结构和5'-帽结构共同负责mRNA从细胞核向细胞质的转运、维持mRNA的稳定性以及翻译起始的调控。去除3'-多聚(A)尾和5'帽结构可导致细胞内的mRNA的迅速被降解。有些原核生物mRNA的3'-端也有这种多聚(A)尾结构,虽然它的长度较短,但是同样具有重要的生物学功能。

  • 真核生物细胞核内的hnRNA经过一系列的修饰和剪接成为成熟的mRNA

比较hnRNA和成熟mRNA发现,前者的长度远远大于后者。细胞核内的初级转录产物hnRNA含有许多交替相隔的外显子(exon)和内含子(intron)。外显子是构成mRNA的序列片段,而内含子是非编码序列。在hnRNA向细胞质转移的过程中,内含子被剪切掉,外显子连接在一起。再经过加帽和加尾修饰后,hnRNA成为成熟mRNA。

  • mRNA的核苷酸序列决定蛋白质的氨基酸序列

一条成熟的真核mRNA包括5'-非翻译区、编码区和3'-非翻译区。从成熟mRNA的5'-帽结构到核苷酸序列中第一个AUG(即起始密码子)之间的核苷酸序列被定义为5'-非翻译区(5'-untranslated region, 5'-UTR)。从这个AUG开始 ,每三个连续的核苷酸组成一个遗传密码子( genetic codon), 每个密码子编码一个氨基酸,直到由三个核苷酸(UAA, 或UAG, 或UGA)组成的终止密码子。由起始密码子和终止密码子所限定的区域定义为mRNA的编码区,也称可读框(open reading frame, ORF)。该区域是编码蛋白质多肽链的核苷酸序列。从mRNA可读框的下游直到多聚A尾的区域称为3'-非翻译区(3'-untranslated region, 3'-UTR)。这些非翻译区通过与调控因子或非编码RNA的相互作用调控蛋白质生物合成 。

tRNA是蛋白质合成中氨基酸的载体

[编辑]

转运RNA(transfer RNA, tRNA)作为蛋白质合成的底物——氨基酸的载体参与蛋白质合成,为合成中的多肽链提供活化的氨基酸。tRNA占细胞RNA总重量的15%左右。已知的tRNA都是由74~95个核苷酸组成的。tRNA具有稳定的空间结构。

  • tRNA含有多种稀有碱基

稀有碱基(rarebase)是指除A、G、C和U外的一些碱基,包括双氢尿嘧啶(dihydrouracil, DHU)、假尿嘧啶核苷(pseudouridine, Ψ)和甲基化的嘌呤(m7G、m7A)等。正常的嘧啶核苷是杂环的N-1原子与戊糖的C-1'原子连接形成糖苷键,而假尿嘧啶核苷则是杂环的C-5原子与戊糖的C-1'原子相连。tRNA中的稀有碱基占所有碱基的10%~20%。tRNA分子中的稀有碱基均是转录后修饰而成的。

  • tRNA具有特定的空间结构

tRNA存在着一些核苷酸序列,能够通过碱基互补配对的原则,形成局部的链内的双螺旋结构。在这些局部的双螺旋结构之间的核苷酸序列不能形成互补的碱基对则膨出形成环状或襻状结构。这样的结构称为茎环(stem-loop)结构或发夹(hairpin)结构。由于这些茎环结构的存在,tRNA的二级结构呈现出酷似三叶草(cloverleaf)的形状。位于两侧的发夹结构含有稀有碱基,分别称为DHU环和TΨC环;位于上方的茎称为氨基酸臂(amino acid arm), 亦称接纳茎;位于下方的发夹结构则称为反密码子环(anticodon loop)。此外,在反密码子环与TΨC环之间还有一个可变臂。不同tRNA的可变臂的长短不一,从几个到十几个核苷酸数不等。除可变臂和DHU环外,其他部位的核苷酸数目和碱基对具有高度保守性。X射线晶体衍射图分析表明,所有的tRNA都具有相似的倒“L”形的空间结构。稳定tRNA的三级结构的力是某些碱基之间产生的特殊氢键和碱基堆积力。

  • tRNA的3'-端连接着氨基酸

所有tRNA的3'-端都是以CCA三个核苷酸结束的,氨酰-tRNA合成酶将氨基酸通过酯键连接在腺嘌呤A的C-3'原子上,生成了氨酰-tRNA, 从而使tRNA成为了氨基酸的载体。只有连接在tRNA的氨基酸才能参与蛋白质的生物合成。tRNA所携载的氨基酸种类是由tRNA的反密码子(anticodon)所决定的。有的氨基酸只有一种tRNA, 而有的氨基酸有几种tRNA作为载体,以适应mRNA上密码子简并性的需求。

  • tRNA的反密码子能够识别mRNA的密码子

tRNA的反密码子环由7~9个核苷酸组成,居中的3个核苷酸通过碱基互补配对的关系识别mRNA上的密码子,因此被称为反密码子。密码子与反密码子的结合使tRNA能够转运正确的氨基酸参与蛋白质多肽链的合成。例如,携带酪氨酸的tRNA反密码子是-GUA-, 可以与mRNA上编码酪氨酸的密码子-UAC-互补配对。在蛋白质合成中,氨酰-tRNA的反密码子依靠碱基互补的方式辨认mRNA的密码子,将其所携带的氨基酸正确地转递到合成中的多肤链上。

以rRNA为主要成分的核糖体是蛋白质合成的场所

[编辑]

核糖体RNA(ribosomal RNA, rRNA)是细胞中含量最多的RNA, 约占RNA总重量的80%以上。rRNA有确定的种类和保守的核苷酸序列。rRNA与核糖体蛋白(ribosomal protein)共同构成核糖体(ribosome), 它将蛋白质生物合成所需要的mRNA、tRNA以及多种蛋白质因子募集在一起,为蛋白质生物合成提供了必需的场所。
原核细胞有三种rRNA,依照分子量的大小分为5S、16S和23S(S是大分子物质在超速离心沉降中的沉降系数)。它们与不同的核糖体蛋白结合分别形成了核糖体的大亚基(large subunit)和小亚基(small subunit)。真核细胞的四种rRNA也利用相类似的方式构成了真核细胞核糖体的大亚基和小亚基。
人们已经完成了rRNA的核苷酸测序,并解析了它们的空间结构。rRNA的二级结构有许多茎环结构。这些茎环结构为核糖体蛋白结合和组装在rRNA上提供了结构基础。 原核细胞16S rRNA的二级结构也有众多相类似的茎环结构。
将纯化的核糖体蛋白和rRNA在试管内混合,它们就可以自动组装成具有活性的大亚基和小亚基。大亚基和小亚基进一步组装成核糖体。大小亚基的结合区域的沟槽是mRNA的结合部位。核糖体有三个重要的部位,它们分别是A位:结合氨酰-tRNA的氨酰位(aminoacyl site);P位:结合肽酰-tRNA的肽酰位(peptidyl site);和E位:释放已经卸载了氨基酸的tRNA的排出位(exit site)。

组成性非编码RNA是保障遗传信息传递的关键因子

[编辑]

除tRNA和rRNA外,真核细胞中还有其他类型的组成性非编码RNA。这些RNA作为关键因子参与了RNA的剪接和修饰、蛋白质的转运以及调控基因表达。

  • 催化小RNA 催化小RNA也称为核酶(ribozyme), 是细胞内具有催化功能的一类小分子RNA统称,具有催化特定RNA降解的活性,在RNA合成后的剪接修饰中具有重要作用。
  • 核仁小RNA (small nucleolar RNA, snoRNA) snoRNA定位于核仁,主要参与rRNA的加工。tRNA的核糖C-2'的甲基化过程和假尿嘧啶化修饰都需要snoRNA的参与。
  • 核小RNA (small nuclear RNA, snRNA) snRNA参与了真核细胞mRNA的成熟过程。一个snRNA与大约20种蛋白质组成了细胞的核小核糖核蛋白(small nuclear ribonucleoprotein, snRNP) 。由于它们富含尿嘧啶,故命名为U-snRNA。研究比较清楚的snRNA有U1、U2、U4、U5、U6和U7。它们的作用是识别hnRNA上的外显子和内含子的接点,切除内含子。这些snRNA的5'-端有一个与mRNA相类似的5'-帽结构。
  • 胞质小RNA(small cytoplasmic RNA, scRNA) scRNA存在细胞质中,与蛋白质结合形成复合体后发挥生物学功能。例如,SRP-RNA与六种蛋白质共同形成信号识别颗粒(signal recognition particle, SRP), 引导含有信号肽的蛋白质进入内质网进行合成。

调控性非编码RNA参与了基因表达调控

[编辑]

调控性非编码RNA按其大小分为非编码小RNA(small non-coding RNA, sncRNA)、长非编码RNA(long non-coding RNA, lncRNA)和环状RNA(circular RNA, circRNA)。虽然这一类RNA通常不编码蛋白质,但是它们仍然表现出了许多重要的生物学功能:转录调控、RNA剪切和修饰、mRNA的翻译、蛋白质的稳定和转运、染色体的形成和结构稳定等,因此,在胚胎发育、组织分化、信号转导、器官形成等基本的生命活动中以及在疾病(如肿瘤、神经性疾病等)的发生和发展进程中都有非编码RNA的参与。

非编码小RNA的特征和作用

[编辑]

通常认为,sncRNA的长度小千200nt。sncRNA包括微RNA(microRNA, miRNA)、干扰小RNA (small interfering RNA, siRNA)和piRNA。
微RNA是近年来研究较多的内源性sncRNA,它在真核生物中大量存在,长度在20~25nt之间。在细胞核中,编码miRNA的基因由RNA聚合酶Ⅱ转录生成长度约为几千个碱基的初级转录本pri-miRNA。在细胞核内,pri-miRNA在蛋白质复合体(400~500kD)的作用下经过了第一次的加工。这个蛋白质复合体由Drosha和Pasha两个蛋白质组成,它们分别是RNase Ⅲ蛋白和双链RNA结合蛋白。pri-miRNA在Drosha的作用下被加工成含有60~70nt具有发夹结构的miRNA前体 (pre-miRNA)。pre-miRNA在RanGTP/Exportin-5转运蛋白的协助下从核内转运到细胞质中。在细胞质中,pre-miRNA被RNase Ⅲ酶家族中的成员Dicer所识别,并通过对茎环结构的剪切和修饰,在细胞质内形成大约20个碱基对长的miRNA: miRNA*双链。 这种miRNA:miRNA*双链与Argonaute家族蛋白形成RNA诱导的沉默复合体,其中的miRNA*被降解,miRNA则被保留在miRISC 中,最终形成成熟的单链miRNA。
微 RNA 对基因表达的调控作用表现在转录后水平上,主要是通过两种机制下调靶基因的表达。这两种机制的选择主要取决于 miRNA 与靶基因 mRNA 序列的互补程度。 如果 miRNA 与靶基因mRNA 完全互补,miRNA 将与靶基因 mRNA 的可读框中的序列形成完全互补的 RNA 双链,miRISC 将双链中的 mRNA 降解,沉默基因转录后的表达。如果 miRNA 与靶基因 mRNA 不完全互补,则 miRNA将与靶基因 mRNA 的 3'-非翻译区的序列形成非完全互补的杂交双链,miRISC 紧紧地结合在杂交双链上,特异性地抑制基因表达。 miRNA 参与了细胞的生长、分化、衰老、凋亡、自噬、迁移、侵袭等多种过程。
siRNA 有内源性和外源性之分,内源性 siRNA 是由细胞自身产生的。外源性 siRNA 来源于外源入侵的基因表达的双链 RNA , 经 Dicer 切割所产生的具有特定长度 (21~23bp)和特定序列的小片段 RNA。这些 siRNA 可以与 AGO 蛋白结合,并诱导这些 mRNA 的降解。 siRNA 还有抑制转录的功能。利用这一机制发展起来的 RNA 干扰( RNA interference, RNAi) 技术是用来研究基因功能的有力工具。
piRNA 是从哺乳动物生殖细胞中分离得到的一类长度约为 30nt 的小 RNA。这类小 RNA 与 PIWI蛋白家族成员结合才能发挥其调控作用,故称为piRNA(piwi interacting RNA)。 piRNA 主要存在哺乳动物生殖细胞和干细胞中,通过与 PIWI 蛋白家族成员结合形成 piwi 复合物来调控基因沉默。

长非编码RNA的特征和作用

[编辑]

长非编码 RNA 是一类长度为 200~100 000 个核苷酸的 RNA 分子。它们不编码任何蛋白质。以前它们被认为是基因组转录过程中的“噪声”而被忽略掉,现在越来越多的证据表明它们是一类具有特殊功能的 RNA 。
lncRNA 由 RNA 聚合酶Ⅱ转录生成,经剪切加工后,形成具有类似于 mRNA 的结构。 lncRNA 有 poly(A) 尾巴和启动子,但序列中不存在可读框。 lncRNA 可以来源于蛋白质编码基因、假基因以及蛋白质编码基因之间的 DNA 序列。 lncRNA 定位于细胞核内和细胞质内。 lncRNA 具有强烈的组织特异性与时空特异性,不同组织之间的 lncRNA 表达量不同,同一组织或器官在不同生长阶段,lncRNA表达量也不同。
lncRNA 的作用机制有以下几种:

  • 结合在编码蛋白质的基因上游启动子区,干扰下游基因的表达;
  • 抑制 RNA 聚合酶Ⅱ或者介导染色质重构以及组蛋白修饰,影响下游基因的表达;
  • 与编码蛋白质基因的转录本形成互补双链,干扰 mRNA 的剪切,形成不同的剪切形式;
  • 与编码蛋白质基因的转录本形成互补双链,在 Dicer 酶的作用下产生内源性 siRNA;
  • 与特定蛋白质结合,lncRNA 转录本可调节相应蛋白质的活性;
  • 作为结构组分与蛋白质形成核酸蛋白质复合体;
  • 结合到特定蛋白质上,改变该蛋白质的细胞定位;
  • 作为小分子 RNA(如 miRNA、piRNA)的前体分子。

由此可见,lncRA 具有调控的多样性,可从染色质重塑、转录调控及转录后加工等多个层面上实现对基因表达进行调控。
长非编码 RNA 与人类疾病的发生密切相关,现已得知,包括癌症以及退行性神经疾病在内的多种严重危害人类健康的重大疾病都与长链非编码 RNA 的序列和空间结构的异常、表达水平的异常、与结合蛋白相互作用的异常等密切相关。

环状RNA的特征和作用

[编辑]

2012 年,美国科学家在研究人体细胞的基因表达时,首次发现了环形 RNA 分子。 截至目前,人们已经在哺乳动物转录组中发现了数以千计的环状 RNA,这似乎表明环状 RNA 而非线性 RNA 分子是更普遍的现象。环状RNA是一类特殊的RNA分子。与传统的线性RNA不同,circRNA分子呈封闭环状结构,没有5'-端和3'-端,因此不受RNA外切酶的影响,表达更稳定,不易降解。已知的circRNA分子或来自外显子,或兼有外显子和内含子的部分。circRNA几乎完全定位于细胞核中。circRNA具有序列的高度保守性,具有一定的组织、时序和疾病特异性。由于circRNA的首尾连接,没有尾巴,因此circRNA容易在传统的分离过程被丢弃掉。这是为什么以前circRNA一直没有被发现的主要原因。
小鼠、人类和斑马鱼的各个组织都可以表达circRNA分子,这些circRNA分子富含miRNA的结合位点,在细胞中起到 miRNA 海绵(miRNA sponge)的作用,通过结合miRNA,进而解除miRNA对其靶基因的抑制作用,升高靶基因的表达水平,产生相应的生物学效应,这一作用机制被称为竞争性内源 RNA (competing endogenous RNA, ceRNA)机制。通过与疾病关联的miRNA相互作用,circRNA在疾病中发挥着重要的调控作用。这说明circRNA很可能就是一类新的调控性内源竞争性RNA,从而使得环状RNA在作为新型临床诊断标记物的开发应用上具有明显优势。