生物化學與分子生物學/基因表達調控的基本概念與特點
基因表達調控 -
基因表達調控的基本概念與特點 -
原核基因表達調控 -
真核基因表達調控
原核生物體系和真核生物體系在基因組結構以及細胞結構上的差異使得它們的基因表達方式有所不同。原核細胞沒有細胞核,遺傳信息的轉錄和翻譯發生在同一空間,並以偶聯的方式進行。真核細胞具有細胞核,使得轉錄和翻譯不僅具有空間分布的特徵,而且還有時間特異性。儘管如此,原核生物體系和真核生物體系的基因表達調控遵循一些共同的基本規律。
基因表達產生有功能的蛋白質和RNA
[編輯]基因表達(gene expression)就是基因轉錄及翻譯的過程,也是基因所攜帶的遺傳信息表現為表型 的過程,包括基因轉錄成互補的RNA序列,對於蛋白質編碼基因,mRNA繼而翻譯成多肽鏈,並裝配加工成最終的蛋白質產物。在一定調節機制控制下,基因表達通常經歷轉錄和翻譯過程,產生具有特異生物學功能的蛋白質分子,賦予細胞或個體一定的功能或形態表型。但並非所有基因表達過程都產生蛋白質。rRNA、tRNA編碼基因轉錄產生RNA的過程也屬於基因表達。
不同生物的基因組含有不同數量的基因。細菌的基因組一般約含4000個基因;多細胞生物的基 因達數萬個,人類基因組含約2萬個蛋白質編碼基因。在某一特定時期或生長階段,基因組中只有小部分基因處於表達狀態。例如,大腸桿菌通常只有約5%的基因處於高水平轉錄活性狀態,其餘大多數基因不表達或表達水平極低,即生成很少的RNA或蛋白質。基因表達水平的高低不是固定不變的。例如,平時與細菌蛋白質生物合成有關的延長因子編碼基因表達十分活躍,而參與DNA損傷修復有關的酶分子編碼基因卻極少表達;當有紫外線照射引起DNA損傷時,這些修復酶編碼基因的表達就變得異常活躍。可見,生物體中具有某種功能的基因產物在細胞中的數量會隨時間、環境而變化。
基因表達具有時間特異性和空間特異性
[編輯]所有生物的基因表達都具有嚴格的規律性,即表現為時間特異性和空間特異性。生物物種愈高級基因表達規律愈複雜愈精細,這是生物進化的需要。基因表達的時間、空間特異性由特異的基因啟動子(序列)和(或)調節序列與調節蛋白相互作用決定。
時間特異性是指基因表達按一定的時間順序發生
[編輯]按功能需要,某一特定基因的表達嚴格按一定的時間順序發生,這就是基因表達的時間特異性(temporal specificity)。如噬菌體病毒或細菌侵入宿主後,呈現一定的感染階段。隨感染階段發展、生長環境變化,這些病原體以及宿主的基因表達都有可能發生改變。有些基因開啟,有些基因關閉。例如,霍亂弧菌在感染宿主後,44種基因的表達上調,193種基因的表達受到抑制,而相伴隨的是這些細菌呈現出高傳染狀態。編碼甲胎蛋白(α-fetoprotein, α-AFP)的基因在胎兒肝細胞中活躍表達,因此合成大量的甲胎蛋白;在成年後這一基因的表達水平很低,故幾乎檢測不到AFP。但是,當肝細胞發 生轉化形成肝癌細胞時,編碼 AFP 的基因又重新被激活,大量的AFP被合成。因此,血漿中AFP的水平可以作為肝癌早期診斷的一個重要指標。
多細胞生物從受精卵發育成為一個成熟個體,經歷很多不同的發育階段。在每個不同的發育階 段,都會有不同的基因嚴格按照自己特定的時間順序開啟或關閉,表現為與分化、發育階段一致的時間性。因此多細胞生物基因表達的時間特異性又稱階段特異性(stage specificity)。
空間特異性是指多細胞生物個體在特定生長發育階段,同—基因在不同的組織器官表達不同
[編輯]在多細胞生物個體某一發育、生長階段,同一基因產物在不同的組織器官表達水平也可能不同。在個體生長、發育過程中,一種基因產物在個體的不同組織或器官表達,即在個體的不同空間出現,這就是基因表達的空間特異性(spatial specificity)。如編碼胰島素的基因只在胰島的β細胞中表達,從而指導生成胰島素;編碼胰蛋白酶的基因在胰島細胞中幾乎不表達,而在胰腺腺泡細胞中有高水平的表達。基因表達伴隨時間或階段順序所表現出的這種空間分布差異,實際上是由細胞在器官的分布所決定的,因此基因表達的空間特異性又稱細胞特異性(cell specificity)或組織特異性(tissue specificity)。
同一個體內不同器官、組織、細胞的差異性的基礎是特異的基因表達或稱為差異基因表達(differential gene expression)。細胞的基因表達譜(gene expression profile), 即基因表達的種類和強度決定了細胞的分化狀態和功能。換言之,在個體內決定細胞類型的不是基因本身,而是基因表達模式(gene expression pattern)。
基因表達的方式存在多樣性
[編輯]不同種類的生物遺傳背景不同,同種生物不同個體生活環境不完全相同,不同的基因功能和性質也不相同。因此,不同的基因對生物體內、外環境信號刺激的反應性不同。有些基因在生命全過程中持續表達,有些基因的表達則受環境影響。基因表達調控 (regulation of gene expression)就是指細胞或生物體在接受內、外環境信號刺激時或適應環境變化的過程中在基因表達水平上作出應答的分子機制,即位於基因組內的基因如何被表達成為有功能的蛋白質(或 RNA),在什麼組織表達,什麼時候表達,表達多少等。按照對刺激的反應性,基因表達的方式或調節類型存在很大差異。
有些基因幾乎在所有細胞中持續表達
[編輯]有些基因產物對生命全過程都是必需的或必不可少的。這類基因在一個生物個體的幾乎所有細胞中待續表達,不易受環境條件的影響,或稱基本表達。這些基因通常被稱為管家基因 (house-keeping gene)。例如,三羧酸循環是一中樞性代謝途徑,催化該途徑各階段反應的酶的編碼基因就屬這類基因。管家基因的表達水平受環境因素影響較小,而是在生物體各個生長階段的大多數或幾乎全部組織中持續表達,或變化很小。我們將這類基因表達稱為基本(或組成性)基因表達(constitutive gene expression)。基本基因表達只受啟動子和 RNA 聚合酶等因素的影響,而基本不受其他機制調節。但實際上,基本基因表達水平並非絕對「一成不變」 ,所謂「 不變」是相對的。
有些基因的表達受到環境變化的誘導和阻遏
[編輯]與管家基因不同,另有一些基因表達很容易受環境變化的影響。隨外環境信號變化,這類基因的表達水平可以出現升高或降低的現象。
在特定環境信號剌激下,相應的基因被激活,基因表達產物增加,即這種基因表達是可誘導的。可誘導基因(inducible gene) 在一定的環境中表達增強的過程稱為誘導 (induction)。例如,在有 DNA損傷時,修復酶基因就會在細菌體內被激活,導致修復酶反應性地增加。
相反,如果基因對環境信號應答時被抑制,這種基因稱為可阻遏基因(repressible gene) 。可阻遏基因表達產物水平降低的過程稱為阻遏(repression)。例如,當培養基中色氨酸供應充分時,細菌體內與色氨酸合成有關的酶編碼基因表達就會被抑制。這類基因的調控序列通常含有針對特異刺激的反應元件。
誘導和阻遏是同一事物的兩種表現形式,在生物界普遍存在,也是生物體適應環境的基本途徑。乳糖操縱子機制是認識誘導和阻遏表達的經典模型。
生物體內不同基因的表達受到協調調節
[編輯]在生物體內,一個代謝途徑通常是由一系列化學反應組成,需要多種酶參與;此外,還需要很多其他蛋白質參與作用物在細胞內、外區間的轉運。這些酶及轉運蛋白等的編碼基因被統一調節,使參與同一代謝途徑的所有蛋白質(包括酶)分子比例適當,以確保代謝途徑有條不紊地進行。在一定機制控制下,功能上相關的一組基因,無論其為何種表達方式,均需協調一致、共同表達,即為協同表達 (coordinate expression) 。這種調節稱為協同調節(coordinate regulation)。基因的協調表達體現在生物體的生長發育全過程。
生物體通過協調調節不同基因的表達以適應環境、維持生長和增殖。生物體所處的內、外環境是在不斷變化的。所有生物的所有活細胞都必須對內、外環境的變化作出適當反應,以使生物體能更好地適應變化著的環境狀態。生物體這種適應環境的能力總是與某種或某些蛋白質分子的功能有關。細胞內某種功能蛋白質分子的有或無、多或少的變化則由編碼這些蛋白質分子的基因表達與否、表達水平高低等狀況決定。通過一定的程序調控基因的表達,可使生物體表達出合適的蛋白質分子,以便更好地適應環境,維持其生長。
原核生物、單細胞生物調節基因的表達就是為適應環境、維持生長和細胞分裂。例如,當葡萄糖供應充足時,細菌中與葡萄糖代謝有關的酶編碼基因表達增強,其他糖類代謝有關的酶基因關閉;當葡萄糖耗盡而有乳糖存在時,與乳糖代謝有關的酶編碼基因則表達,此時細菌可利用乳糖作為碳源,維持生長和增殖。高等生物也普遍存在適應性表達方式。經常飲酒者體內醇氧化酶活性較高即與相應基因表達水平升高有關。
在多細胞生物,基因表達調控的意義還在於維待細胞分化與個體發育。在多細胞個體生長、發育的不同階段,細胞中的蛋白質分子種類和含量變化很大;即使在同一生長發育階段,不同組織器官內 蛋白質分子分布也存在很大差異,這些差異是調節細胞表型的關鍵。例如,果蠅幼蟲(蛹)最早期只有一組「母本效應基因(maternal effect gene)」表達,使受精卵發生頭尾軸和背腹軸固定,以後有三組「分節基因」順序表達,控制蛹的「分節」發育過程,最後這些「節」分別發育為成蟲的頭、胸、翅膀、肢 體、腹及尾等。高等哺乳類動物的細胞分化,各種組織、器官的發育都是由一些特定基因控制的。當某種基因缺陷或表達異常時,則會出現相應組織或器官的發育異常。
基因表達受調控序列和調節分子共同調節
[編輯]一個生物體的基因組中既有攜帶遺傳信息的基因編碼序列,也有能夠影響基因表達的調控序列(regulatory sequence)。一般說來,調控序列與被調控的編碼序列位於同一條 DNA 鏈上,也被稱為順式作用元件 (cis-acting element) 或順式調節元件 (cis-regulator element, CRE)。還有一些調控基因遠離被調控的編碼序列,實際上是其他分子的編碼基因,只能通過其表達產物來發揮作用。這類調控基因 產物稱為調節蛋白(regulatory protein) 。調節蛋白不僅能對處於同一條 DNA 鏈上的結構基因的表達進行調控,而且還能對不在一條 DNA鏈上的結構基因的表達起到同樣的作用。因此,這些蛋白質分子又被稱為反式作用因子(trans-acting factor)。這些反式作用因子以特定的方式識別和結合在順式作用元件上,實施精確的基因表達調控。還有一類調控基因的產物為調節 RNA,這些 RNA分子以不同的作用方式對基因表達進行精細調節。
作為反式作用因子的調節蛋白具有特定的空間結構,通過特異性地識別某些DNA序列與順式作用元件發生相互作用。例如,DNA雙螺旋結構的大溝是調節蛋白最容易與DNA序列發生相互作用的部位。真核生物基因組結構比較複雜,使得有些調節蛋白不能直接與DNA相互作用,而是首先形成蛋白質-蛋白質的複合物,然後再與DNA結合參與基因表達的調控。蛋白質-DNA以及蛋白質-蛋白質的相互作用是基因表達調控的分子基礎。
基因表達調控呈現多層次和複雜性
[編輯]無論是原核生物還是真核生物,基因表達調控體現在基因表達的全過程中,即在RNA轉錄合成和蛋白質翻譯兩個階段都有控制其表達的機制。因此基因表達的調控是多層次的複雜過程,改變其中任何環節均會導致基因表達的變化。
首先,遺傳信息以基因的形式貯存於 DNA 分子中,基因拷貝數越多,其表達產物也會越多,因此基因組 DNA的部分擴增(amplification) 可影響基因表達。在多細胞生物,某一特定類型細胞的選擇性擴增可能就是通過這種機制使某種或某些蛋白質分子高表達的結果。為適應某種特定需要而進行的 DNA重排(DNA rearrangement), 以及 DNA 甲基化(DNA methylation) 等均可在遺傳信息水平上影響基因表達。
其次,遺傳信息經轉錄由 DNA 傳遞給 RNA 的過程,是基因表達調控最重要、最複雜的一個層次。在真核細胞,初始轉錄產物需經轉錄後加工修飾才能成為有功能的成熟 RNA,並由細胞核轉運至細胞質,對這些轉錄後加工修飾以及轉運過程的控制也是調節某些基因表達的重要方式,例如:對mRNA 的選擇性剪接、RNA 編輯等。近年來,以 miRNA為代表的非編碼 RNA對基因表達調控的作用也日益受到重視,使我們可以在一個新的層面上理解基因表達調控。
蛋白質生物合成即翻譯是基因表達的最後一步,影響蛋白質合成的因素同樣也能調節基因表達。並且,翻譯與翻譯後加工可直接、快速地改變蛋白質的結構與功能,因而對此過程的調控是細胞對外環境變化或某些特異刺激應答時的快速反應機制。 總之,在遺傳信息傳遞的各個水平上均可進行基因表達調控。
儘管基因表達調控可發生在遺傳信息傳遞過程的任何環節,但發生在轉錄水平,尤其是轉錄起始水平的調節,對基因表達起著至關重要的作用,即轉錄起始是基因表達的基本控制點。