跳转到内容

细胞生物学/基因表达的调控

维基教科书,自由的教学读本

细胞内遗传信息的传递及调控 - 基因及其结构 - 基因转录和转录后加工 - 蛋白质的生物合成 - 基因表达的调控 - 基因的信息传递与医学
遗传信息(基因信息)由DNA转录为RNA、再由RNA翻译为蛋白质,通常称为基因的表达。基因表达的实质是通过基因的转录和翻译,产生具有特异生物学功能的蛋白质分子,赋予细胞或个体一定的功能或形态表型。基因的表达受到严密和精确的调控,以适应环境、维持生长和发育的需要。遗传信息传递过程中任何环节的改变均会导致基因表达的变化,基因表达的涸控可发生在遗传信息传递的各个阶段。基因表达的调控一般表现为正性调控(pos山ve regulation)和负性调控(negative regulation),前者使基因表达量增加,后者则是使基因表达量减少。在介绍基因的表达调控之前,首先了解一下基因表达的特点。

基因表达的一般特点

[编辑]

同一个体所有细胞都具有相同的基因组,携带个体生存、发育、活动和繁殖所需要的全部遗传信息。但生物基因组的遗传信息(基因)不是同时全部都表达出来,即使是极其简单的生物(如最简单的病毒),其基因组所含的全部基因也不是以同样的强度同时表达。

基因表达具有时间性和空间性

[编辑]

基因表达具有严格的时间和空间特异性,这是由基因的启动子等调控序列与调节蛋白相互作用决定的。
例如,病原体侵入宿主后呈现一定的感染阶段,随感染阶段的发展、生长环境的变化,有些基因开启,有些基因关闭。按照功能需要,某一特定基因表达严格按照一定的时间顺序发生,这称为基因表达的时间特异性(temporal specificity)。多细胞生物从受精卵到组织、器官形成的各个不同发育阶段,都会有不同的基因严格按照自己特定的时间顺序开启或关闭,表现为分化、发育阶段一致的时间性,也称为阶段特异性(stage specificity)。
在个体某一发育、生长阶段,同一基因产物在不同的组织器官中表达多少是不一样的。一种基因产物在个体的不同组织或器官中表达,即在个体的不同空间出现,这就是基因表达的空间特异性(spatial specificity)。不同组织细胞中不仅表达的基因数量不相同,而且基因表达的强度和种类也各不相同,这就是基因表达的组织特异性(tissue specificity)。例如肝细胞中涉及编码鸟氨酸循环酶类的基因表达水平高于其他组织细胞,合成的某些酶(如精氨酸酶)为肝脏所特有。

基因表达有组成性表达和可诱导/阻遏表达两种方式

[编辑]
  1. 组成性表达 组成性表达(constitutive expression)是指不太受环境变动而变化的一类基因表达。其中某些基因表达产物是细胞或生物体整个生命过程中都持续需要且必不可少的,这类基因称为管家基因(housekeeping gene), 这些基因中大多是在生物个体的不同组织细胞、甚至在同一物种的细胞中都是持续表达的,可以看成是细胞基本的基因表达。组成性基因表达也不是一成不变的,其表达强弱是受一定机制调控的。
  2. 适应性表达 适应性表达(adaptive expression)指环境的变化容易使其表达水平变动的一类基因表达。应环境条件变化基因表达水平增高的现象称为诱导(induction), 这类基因被称为可诱导的基因(inducible gene) ; 相反,随环境条件变化而基因表达水平降低的现象称为阻遏(repression), 相应的基因被称为可阻遏的基因(repressible gene)。

改变基因表达的情况以适应环境,在原核生物、单细胞生物中尤其显得突出和重要,因为这些细胞的生存环境经常会有剧烈的变化。例如,周围有充足的葡萄糖,细菌就可以利用葡萄糖作为能源和碳源,不必更多去合成利用其他糖类的酶类;当外界没有葡萄糖时,细菌就要适应环境中存在的其他糖类(如乳糖、半乳糖、阿拉伯糖等),开放能利用这些糖的酶类基因,以满足生长的需要。即使是内环境保持稳定的高等哺乳类动物,也经常要变动基因的表达来适应环境。例如,与适宜温度下生活相比较,在冷或热环境下适应生活的动物,其肝脏合成的蛋白质图谱就有明显的不同;长期摄取不同的食物,体内合成代谢酶类的情况也会有所不同。

原核基因的表达调控

[编辑]

相对于真核细胞,原核细胞的基因表达调控机制比较简单,研究得较为深入。转录调控是原核生物基因表达调控的关键步骤。原核生物大多数基因表达调控是通过操纵子机制实现的。操纵子(operon)由结构基因和表达调控元件组成,是原核细胞中最常见的表达调控单位。操纵子机制在原核基因表达调控中具有普遍意义。
原核基因表达调控最典型的代表是大肠杆菌(E. coil)乳糖操纵子(lac operon)调控模式。在此,以乳糖操纵子为例说明原核基因的表达调控机制。
大肠杆菌乳糖代谢相关基因组成乳糖操纵子。大肠杆菌的乳糖操纵子含LacZLacYLacA 三个结构基因,分别编码β-半乳糖苷酶(β-galactosidase)、β-半乳糖苷通透酶(permease)和β-半乳糖苷乙酰转移酶(transacetylase), 此外还有一个操纵序列Olac、一个启动序列Plac及一个调节基因LaeI。LaeI编码一种阻遏蛋白(repressor), 后者与O1ac序列结合,使操纵子受阻遏而处于关闭状态。在启动子P1ac上游还有一个分解(代谢)物激活蛋白(catabolite activator protein, CAP)的结合位点,其主要作用是增强乳糖操纵子的转录活性。由Plac序列、Olac序列和CAP结合位点共同构成乳糖操纵子的调控区,三个酶的编码基因都由同一调控区调节,实现基因产物的协调表达。
大肠杆菌在没有乳糖的环境中生存时,乳糖操纵子处于阻遏状态。LacI在其自身的启动子控制下,表达产生阻遏蛋白,阻遏蛋白与操纵序列Olac结合,阻碍了RNA聚合酶与启动子plac的结合,阻止了基因的转录启动。当有乳糖存在时,乳糖受β-半乳糖苷酶的催化转变为半乳糖,半乳糖与阻遏蛋白结合,使其构象改变,失去与Olac的亲和力,与Olac解离,基因转录开放。该机制很好地解释了单纯乳糖存在时,细菌是如何利用乳糖作碳源的。然而细菌生长环境是复杂的,例如有葡萄糖或葡萄糖/乳糖共同存在时,细菌首先利用葡萄糖才是最节能的。这时,葡萄糖的存在使细菌内的cAMP浓度降低,阻碍cAMP与CAP结合,抑制乳糖操纵子转录(因为只有与cAMP结合的CAP才能结合到Plac上游的CAP结合位点),使细菌只能利用葡萄糖。

真核基因的表达调控

[编辑]

真核细胞的基因表达调控要比原核细胞复杂得多。由于核膜的存在,真核细胞基因的转录与蛋白质的翻译分别在细胞内不同的区域进行。真核细胞基因表达调控可以在转录水平、RNA加工水平、RNA转运水平、mRNA降解水平、翻译水平和蛋白质活性水平上进行。对大多数基因来说,转录水平是最重要的控制点。此外,在某些细胞中DNA水平的变化如染色质上基因拷贝数的变化、DNA重排、DNA甲基化等也会影响基因的表达。

转录水平调控是真核细胞基因表达的主要控制点

[编辑]

转录水平调控主要是对基因表达转录起始的调节。真核基因具有复杂的调控区,它包括启动子区和其他能调节基因表达的转录因子和基因调节蛋白结合位点。影响基因表达的各种因子通过与DNA调控区的结合而增强或抑制基因的表达。真核细胞中存在多种基因表达调节蛋白,它们能促进或抑制基因的转录,有些基因表达调节蛋白是特异性的DNA结合蛋白,它们能够和靶基因相邻的DNA序列结合;还有一些基因表达调节蛋白虽然不能直接与DNA结合,但它们可通过与其他基因表达调节蛋白的相互作用调控基因转录。通常将基因表达调节蛋白称做反式作用因子(trans-acting factor), 将它们所识别的DNA序列叫做顺式作用元件(cis-acting element)。具体地讲,顺式作用元件是对基因表达有调节活性的DNA序列,其活性只影响与其自身同处在一个DNA分子上的基因,这种DNA序列一般不编码蛋白质,多位于基因旁侧或内含子中。基因表达的调节是通过反式作用因子与顺式作用元件相互作用而实现的。
1、顺式作用元件是能够调控基因表达的特殊DNA序列 根据顺式作用元件在基因组中的位置、转录激活作用的性质及发挥作用的方式,可将真核基因的顺式作用元件分为启动子、增强子(enhancer)和沉默子(silencer)。
启动子是决定细胞基因转录起始、能被RNA聚合酶所识别并结合的特异性DNA序列,它是基因准确和有效地进行转录所必需的结构。
增强子是一种能增强真核细胞某些启动子功能的调节序列,不具有启动子的功能,但能增强或提高启动子的活性。增强子在DNA双链中没有5'与3'固定的方向性,作用不受序列方向性的限制。增强子在所调控基因的上游或下游均可发挥作用,但大多位于上游;下游内含子中,乃至下游最后一个外显子以外的序列也可含有增强子。增强子在距离启动子相对较远(距启动子数kb至数十kb)时也能发挥作用。增强子一般有组织或细胞特异性,但对启动子的影响无严格的专一性。基因重组实验证明,同一增强子可影响不同类型的启动子,真核生物增强子也可影响原核生物的启动子。
在顺式作用元件中还存在一种与增强子作用相反的沉默子。沉默子是基因表达的负性调控元件。当特异蛋白因子与其结合时,对基因转录起阻遏作用。沉默子最早在酵母中发现,后来在T淋巴细胞的T抗原受体基因的转录和重排中也证实了这种负调控顺式元件的存在。目前对这种在基因转录降低或关闭中起作用的序列研究还不多,但从已有的例子来看,沉默子的作用可不受序列方向的影响,能远距离发挥作用,并可对异源基因的表达起作用。
2、反式作用因子通过顺式作用元件调控基因的表达 真核基因表达的调节蛋白又称转录调节因子或转录因子。绝大多数真核转录调节因子由它的编码基因表达后,通过与特异的顺式作用元件的识别、结合(即DNA-蛋白质相互作用)反式激活另一基因的表达。RNA聚合酶和转录因子就是反式作用因子。能直接结合DNA序列的反式作用因子是少数,但不同的反式作用因子之间可以相互作用,因而目前认为多数转录因子是通过蛋白质-蛋白质间作用与DNA序列联系并影响转录效率的,转录因子之间或转录因子与DNA的结合都会引起DNA构象的变化,从而调节转录。
作为蛋白质的转录因子从功能上分析其结构,可包含有不同区域:①DNA结合域(DNA binding domain): 多由60~100个氨基酸残基构成的几个亚区组成。其他一些不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用千转录复合体而影响转录效率。②转录激活域(activating domain): 常由30~100个氨基酸残基组成,该结构域包含富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类。③连接区:即连接上两个结构域的部分。
与DNA结合的转录因子大多以二聚体形式起作用,其DNA结合域常见有以下几种:①锌指结构(zinc finger),是最常见的DNA结合域,它由约23个氨基酸残基组成,其中的半胱氨酸和组氨酸通过配位键与锌原子结合这样形成一个以锌原子为中心的“指”状结构,称为锌指结构。锌指结构的N-末端形成β-片层,C-末端形成α-螺旋,α-螺旋能够与DNA大沟相结合。一个转录因子中常常含有多个串联重复的锌指结构,如与GC盒结合的转录因子SP1中就含有3个重复的锌指结构,这些锌指结构中的3个α-螺旋恰好等于DNA大沟的一圈。②螺旋-转角-螺旋(helix-turn-helix, HTH),这类结构域通常由3个α-螺旋结构组成,其中一个螺旋与DNA大沟结合,另两个螺旋则位于其上面起稳固作用。例如,参与大肠杆菌乳糖操纵子调控的CAP蛋白以及真核细胞中的同源异形结构域(homeodomain)蛋白中就含有HTH结构域。③螺旋-环-螺旋(helix-loop-helix, HLH), 这类结构至少有两个α-螺旋,螺旋间由短肽段形成的环连接,两个具有HLH结构的转录因子以二聚体形式相连,两个较长的α-螺旋刚好能够嵌入DNA的大沟。例如,参与肌细胞生成的转录因子MyoD蛋白就含有HLH结构域。④亮氨酸拉链(leucine zipper), 该结构的特点是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果导致这些亮氨酸残基都在α-螺旋的同一个方向出现,两个这样的α-螺旋肽链单体就能通过亮氨酸残基以疏水键结合形成二聚体。该二聚体另一端的肽段形成"Y"形的结构(富含碱性氨基酸残基)与DNA大沟结合。在肝、小肠上皮、脂肪细胞和某些神经细胞中有称为C/EBP(CCAAT/enhancer-binding protein)家族成员的一类蛋白质能够与CAAT盒结合,其特征就是能形成具有亮氨酸拉链的二聚体结构。
总之,反式作用因子能够通过识别启动子、启动子附近和增强子等顺式作用元件中的特异靶序列并与之结合(即蛋白质-DNA相互作用),以及通过蛋白质-蛋白质的相互作用,最终影响RNA聚合酶活性,从而对基因表达发挥正调控或负调控作用。通常把发挥正调控作用的反式作用因子称为转录激活蛋白(activator)。
3、真核细胞的阻遏蛋白 真核细胞中除存在发挥正性调控作用的转录激活蛋白之外,还有一类阻遏蛋白(repressor, 也称抑制子)也参与了真核细胞基因表达的负性调控。与原核细胞中起同样作用的分子一样,真核阻遏蛋白通过与特定的DNA序列结合而抑制转录。其中,某些阻遏蛋白通过干扰其他转录因子与DNA的结合来发挥抑制作用,例如,在转录起始位点附近结合的阻遏蛋白可以阻止RNA聚合酶或通用转录因子与启动子的相互作用;另一些阻遏蛋白则通过与转录激活蛋白竞争结合DNA分子中的调控序列发挥作用,这些阻遏蛋白含有和激活蛋白相同的DNA结合域,但是阻遏蛋白没有转录激活域,无法激活转录。这类阻遏蛋白抑制基因转录的实质是:通过阻止激活蛋白与启动子或增强子的结合,抑制转录。
另一类阻遏蛋白,称为活性阻遏蛋白(active repressor), 与那些仅仅干扰激活蛋白结合的阻遏蛋白不同,它们虽然也有DNA结合域,但主要靠功能结构域通过蛋白质-蛋白质的相互作用来抑制转录,例如果蝇的Krüppel 基因,其表达的蛋白质即为活性阻遏蛋白。Krüppel蛋白中除了含有一个能够与DNA结合的锌指结构域之外,还存在一个独立的抑制结构域,Krüppel蛋白与DNA结合后,依赖其抑制结构域与特定的转录激活蛋白、中介蛋白或通用转录因子相互作用而抑制转录。
阻遏蛋白对基因转录的调控作用扩展了人们对真核细胞基因表达调控机制的认识。阻遏蛋白一个重要的功能可能是抑制组织特异性基因在不适当细胞中的表达。例如,免疫球蛋白基因的增强子中含有阻遏蛋白的结合位点,该位点与阻遏蛋白的结合有助于抑制非淋巴细胞中免疫球蛋白的表达,确保免疫球蛋白的组织特异性表达。
4、染色质通过结构重塑调控基因的转录 染色质是高度有序的紧密结构,限制了转录因子对DNA的接近和结合,控制着真核细胞基因的转录。基因表达激活首先需要将致密压缩的染色质/核小体舒展开来,该过程涉及具有酶活性的功能蛋白复合体参与,通过调整核小体结构,中和组蛋白碱性氨基酸残基上的正电荷来减弱组蛋白与DNA(携负电荷)间的结合,从而降低相邻核小体间的聚集,增加转录因子的进入,最终促进基因转录。这种染色质结构的动态变化过程通常称为染色质重塑(chromatin remolding)。染色质重塑是基因表达调控的主要方式之一。目前认为引起染色质重塑的方式主要有以下两种:
(1)依赖ATP的物理性修饰:即以ATP水解释放的能量,使组蛋白和DNA的构象发生局部改变。该过程主要通过依赖ATP的染色质重塑复合体或染色质重建子(remodeler)来完成,这些复合体是一种以ATP酶为催化中心的多种蛋白亚基复合体,如SWI/SNF复合体,能够被DNA结合的激动子(activator, 也称基因活化蛋白)或抑制子(repressor) 招募至启动子部位,借ATP水解的能量移动核小体的位置使DNA 序列暴露或被掩盖,而参与基因表达调控。
(2)组蛋白共价化学修饰:最初,染色质上的组蛋白被认为仅仅是维系染色质或染色体结构的组成成分,现在人们认识到,组蛋白的结构是动态变化的,这种变化影响了染色质结构的构型,从而调节基因的表达。组蛋白结构的改变源于组蛋白中被修饰的氨基酸。
核小体的核心组蛋白(H2A、H2B、H3和H4)是一类小分子量的强碱性蛋白,它们均由球状结构域(外周被146bp大小DNA包绕)和从核小体表面伸出的位于蛋白N-端的“组蛋白尾巴”组成。近些年研究表明,组蛋白特别是H3和H4尾部的氨基酸残基能够被化学修饰,包括组蛋白的乙酰化(acetylation)、甲基化(methylation)、磷酸化(phosphorylation)、泛素化(ubiquitination)、sumo 化(sumoylation)、多聚ADP核糖基化[poly(ADP-ribosyl)ation]等。组蛋白中被修饰氨基酸的种类、位置和修饰类型以及各种修饰在时间、空间上的组合与生物学功能的关系被称为组蛋白密码(histone code), 它决定了染色质转录活跃或沉默的状态。
组蛋白修饰导致基因转录或沉默的机制与其引起的染色质重塑密切相关。组蛋白N-端尾部的氨基酸修饰直接影响了核小体的结构,进而影响到转录起始复合体是否易于同启动子部位的DNA结合。在此以组蛋白常见的修饰方式——组蛋白乙酰化为例,说明组蛋白修饰影响基因转录的机制。组蛋白乙酰化多发生于H3和H4 氨基酸的赖氨酸残基。在组蛋白乙酰基转移酶(histone acetyltransferase, HAT, 也称乙酰化酶)作用下,于组蛋白N-端尾部的赖氨酸加上乙酰基,称为组蛋白乙酰化。组蛋白N端的赖氨酸残基乙酰化会移去正电荷,降低组蛋白和DNA之间的亲和力,使得RNA聚合酶和通用转录因子容易进入启动子区域。因此,在大多数情况下,组蛋白乙酰化有利于基因转录。低乙酰化的组蛋白通常位于非转录活性的常染色质区域或异染色质区域。一些组蛋白可以快速地乙酰化,然后又去乙酰化,使得组蛋白结合基因的表达受到精确地调控。组蛋白的去乙酰化由组蛋白去乙酰化酶(histone deacetylase, HDAC)催化完成,组蛋白去乙酰化则抑制转录。其具体机制是:基因激活因子结合于特定上游激活序列(UAS)并招募组蛋白乙酰化酶,催化附近的组蛋白乙酰化,促进基因激活;而结合于上游抑制序列(URS)的转录抑制因子则招募组蛋白去乙酰化酶,催化附近的组蛋白去乙酰化,抑制转录。
5、DNA甲基化修饰程度影响基因表达水平 真核DNA分子中的胞嘧啶碱基约有5%被甲基化修饰为5-甲基胞嘧啶。胞嘧啶碱基的甲基化修饰常发生在基因上游调控序列的CpG(岛)富含区。处于活性染色质区、呈现转录活性状态的基因的CpG序列一般总是低甲基化的;而不表达或处于低表达水平的基因的CpG序列则总是高甲基化的。实际上, DNA胞嘧啶的甲基化与去甲基化修饰是一个动态的过程,在真核基因的表达调控中发挥着重要作用。DNA甲基转移酶(DNA methyltransferase, DNMT)催化甲基与胞啼唗的共价结合,而去甲基化酶(demethylase)则负责去除5-甲基胞嘧啶上的甲基。
6、非编码RNA能够调节基因转录 近年来的研究显示,除了转录调节蛋白以外,一些非编码RNA分子,如miRNA等小RNA和长链非编码能调控基因的转录。相对于长链非编码RNA, 人们对小RNA(miRNA)的作用机制有较多的认识。在miRNA发挥转录抑制作用时,miRNA与另一种蛋白质复合体RITS(RNA-induced transcriptional silencing)复合体结合,解离后的一条miRNA链将RITS复合体引导至同源基因处(很可能是通过碱基配对结合于同RNA聚合酶Ⅱ结合的mRNA上),然后,RITS复合体通过募集组蛋白甲基转移酶,使组蛋白H3的赖氨酸-9发生甲基化,导致异染色质形成,最终抑制基因的转录。

RNA加工水平调控的主要途径是剪接

[编辑]

以外显子和内含子为单元的基因结构形式是真核细胞基因结构的特点,人类的大多数基因中都含有内含子。多数真核细胞的mRNA前体分子经剪接去除内含子后仅形成一种成熟的mRNA, 并经过翻译生成一条相应的多肽链,这种RNA剪接方式称为常规剪接(constitutive splicing)。但许多高等真核细胞的mRNA前体不止含有一个内含子,在特定条件下,剪接发生在两个内含子之间,即某个内含子的5'端与另一个内含子的3'端进行剪接时,就会删除这两个内含子及其中间的全部外显子或内含子,这称为RNA可变剪接(alternative splicing)。由此,一个基因的mRNA前体经过可变剪接可以产生多种不同的蛋白质,或形成一组相似的蛋白质家族。
mRNA前体的剪接由被称为剪接体的核酸-蛋白质复合物完成,该复合物主要包括snRNA及富含丝氨酸和精氨酸的相关蛋白。剪接首先是剪接体识别mRNA前体剪接位点,剪接位点的选择受许多顺式作用元件和反式作用因子的调控。反式作用因子可以通过识别正性或负性的顺式作用元件对不同的剪接位点进行选择。此外,剪接体中的剪接因子也参与了对选择性剪接的调控。

真核细胞基因表达的翻译水平调控与起始因子磷酸化密切相关

[编辑]

真核细胞翻译水平调节点主要在翻译起始阶段和延长阶段,尤其是起始阶段。如起始因子活性的调节、Met-tRNAMet与核糖体小亚基结合的调节、mRNA与小亚基结合的调节等。其中通过磷酸化作用改变起始因子活性这一点备受关注。蛋白质合成速率的快速变化很大程度上取决于起始水平,通过磷酸化调节起始因子活性对起始阶段有重要的控制作用。如eIF-2α亚单位的磷酸化可以阻碍eIF的正常运行,从而抑制蛋白质合成的起始。eIF-2α亚单位的磷酸化由特异蛋白激酶催化。在病毒感染的细胞中,细胞抗病毒机制之一即是通过双链RNA(double-stranded RNA, dsRNA)激活一种蛋白激酶,使eIF-2α磷酸化,从而抑制蛋白质合成的起始。
此外,mRNA的5'UTR(非翻译区)与3'UTR 在翻译过程中能够相互依赖、协同作用提高翻译效率。一些蛋白质能够识别mRNA的3'UTR , 通过干扰3'poly-A尾与5'端帽的联络而减少翻译的起动。