細胞生物學/細胞分化的分子基礎
細胞分化 -
細胞分化的基本概念 -
細胞分化的分子基礎 -
細胞分化的影響因素 -
細胞分化與醫學
基因組的活動模式
[編輯]基因的選擇性表達是細胞分化的普遍規律
[編輯]細胞分化的實質是細胞的特化,即分化的細胞表達特異性蛋白(保持特化特徵)。人們在認識細胞分化機制中,曾根據少數分化細胞的染色體丟失現象而錯誤地認為細胞分化的本質是源於遺傳信息的丟失或突變。後來大量的實驗證明,細胞分化過程中一般並不伴有基因組的改變。比較著名的實驗,如體細胞核移植實驗,即將動物體細胞的核移植到去核的卵細胞或受精卵的細胞質中,然後觀察重組的卵細胞(有新的細胞核)是否能夠發育成為成體,如此相繼克隆出爪蟾、多莉羊等動物,證明了細胞分化並不是由於基因丟失或永久性地失去活性造成的,維持發育所需要的基因並沒有發生不可逆的改變,當體細胞核暴露於卵細胞質中之後,它的作用就如同一個受精卵的細胞核基因一樣。此外,細胞轉分化現象的發現,以及細胞融合實驗等也表明細胞分化過程中一般不發生基因組的改變。
大量研究表明,多細胞生物個體發育與細胞分化過程中,其基因組DNA並不全部表達,而呈現選擇性表達,即它們按照一定的時空順序,在不同細胞和同一細胞的不同發育階段發生差異表達(differential expression)。這就導致了所謂的奢侈蛋白(luxury protein)即細胞特異性蛋白質的產生,如紅細胞中的血紅蛋白、皮膚表皮細胞中的角蛋白、肌細胞的肌動蛋白和肌球蛋白等。編碼奢侈蛋白的基因稱奢侈基因(luxury gene) , 又稱「組織特異性基因(tissue-specific gene)」,是特定類型細胞中為其執行特定功能蛋白質編碼的基因。不同奢侈基因的選擇性表達賦予了分化細胞的不同特徵。當然,一個分化細胞的基因表達產物不僅僅是奢侈蛋白,也包含由持家基因表達的持家蛋白。持家基因(house-keeping gene), 也被稱為管家基因,是生物體各類細胞中都表達,為維持細胞存活和生長所必需的蛋白質編碼的基因,如細胞骨架蛋白、染色質的組蛋白、核糖體蛋白、以及參與能矗代謝的糖酵解酶類的編碼基因等。一些簡單的實驗便可證明細胞分化的本質。例如,雞的輸卵管細胞合成卵清蛋白,胰島細胞合成胰島素,成紅細胞合成β-珠蛋白,這些細胞都是在個體發育過程中逐漸產生的。用相應的基因製作探針,對三種細胞總的DNA的限制性酶切片段進行Southern雜交實驗。結果顯示,上述三種細胞的基因組DNA中均存在卵清蛋白基因、胰島素基因和β-珠蛋白基因。然而用同樣的三種基因片段作探針,對這三種細胞中提取的總RNA進行Northern雜交實驗,結果表明,輸卵管細胞中只有卵清蛋白mRNA,胰島素細胞只有胰島素mRNA,成紅細胞只有β-珠蛋白mRNA。因此,細胞分化的本質是基因的選擇性表達,一些基因處於活化狀態,同時另一些基因被抑制而不活化。
基因組改變是細胞分化的特例
[編輯]早期的研究顯示,一些分化的細胞例如果蠅的卵巢濾泡細胞,在其分化過程中基因組發生了量的變化,表現為特定基因的選擇性擴增;在果蠅的其他一些細胞,像卵巢滋養細胞、唾液腺細胞和馬爾皮基氏管細胞的發育過程中,還呈現出基因組擴增現象,染色體( DNA)多次複製,形成多倍體(polyploid)和多線體(polyteny)。
與上述情況相反,一些細胞在分化過程中則發生遺傳物質(染色質或染色體)的丟失。典型的例子是來源於對馬蛔蟲(Ascaris equorum )發育過程的研究。在馬蛔蟲個體發育中,只有生殖細胞得到了完整染色體,而體細胞中的染色體只是部分染色體片段,其餘的染色體丟失了。在其他的一些例子中,還可觀察到完整的染色體或完整的核丟失。例如在搖蚊發育中,許多體細胞丟失了最初40條染色體中的38條;而哺乳動物(除駱駝外)的紅細胞以及皮膚、羽毛和毛髮的角化細胞則丟失了完整的核。
在脊椎動物和人類免疫細胞發育研究中發現,執行抗體分泌功能的B淋巴細胞分化的本質是由於編碼抗體分子的基因發生了重排。在B淋巴細胞分化期間,胚細胞DNA通過體重組(somatic recombination), 使DNA序列中不同部位的部分基因片段連接在一起,組成產生抗體mRNA的DNA序列,從而產生多種多樣的抗體分子。
基於以上事例,人們對細胞分化的機制曾提出過一些假說,如基因擴增、DNA 重排和染色體丟失等。但這些現象並不是細胞分化的普遍規律。
胞質中的細胞分化決定因子與傳遞方式
[編輯]母體效應基因產物的極性分布決定了細胞分化與發育的初始命運
[編輯]一些研究提示,成熟的卵細胞中儲存有20000~50000種RNA,其中大部分為mRNA。這些mRNA直到受精後才被翻譯為蛋白質。其中部分mRNA在卵質中的分布不均,如爪蟾未受精卵中,有些mRNA特異地分布於動物極,有些則分布在植物極,它們在細胞初始發育命運的決定中起重要作用。通常將這些在卵質中呈極性分布、在受精後被翻譯為在胚胎發育中起重要作用的轉錄因子和翻譯調節蛋白的mRNA分子稱為母體因子。編碼母體因子的基因謂之母體效應基因(maternal effect gene),也稱「母體基因(maternal gene), 即在卵子發生過程中表達,表達產物(母體因子)存留於卵子中,受精後通過這些母體因子影響胚胎發育的基因。
在果蠅中,母體效應基因得到了比較深入的研究。果蠅和一般的脊椎動物有所不同,其母體效應基因預先決定了子代未來的相互垂直的前-後軸和背-腹軸。例如果蠅bicoid 基因的mRNA,在未受精時,它定位於卵母細胞的一端,即將來發育為胚胎的前端。受精後bicoid mRNA被翻譯為蛋白質,因有限的擴散,建立了BICOID蛋白梯度:BICOID蛋白沿胚胎前-後軸呈濃度梯度分布,越靠近胚胎的前端,其濃度越高。BICOID蛋白含有一個螺旋-轉角-螺旋結構域(helix-turn-helix domain), 它與卵前部區域的胚胎細胞核染色質DNA結合(果蠅的早期胚胎為多個細胞核共存於一個細胞質中的合胞體),高濃度的BICOID蛋白啟動了頭部發育的特異性基因的表達,而低濃度的BICOID蛋白則與形成胸部的特異性基因表達有關。
胚胎細胞分裂時胞質的不均等分配影響細胞的分化命運
[編輯]在胚胎早期發育過程中,細胞質成分是不均質的,胞質中某些成分的分布有區域性。當細胞分裂時,細胞質成分被不均等地分配到子細胞中,這種不均一性胞質成分可以調控細胞核基因的表達,在一定程度上決定細胞的早期分化。例如在果蠅感覺器官的發育過程中,細胞命運的決定物之一是numb基因編碼的轉錄因子。該轉錄因子蛋白在感覺性母細胞的胞質中呈非對稱分布,以致細胞在第一次分裂時只有一個子細胞中含有numb蛋白,這個子細胞在第二次分裂時產生了神經元及鞘層細胞,而缺乏numb蛋白的細胞則分化為支持細胞。numb蛋白對神經元及鞘層細胞的形成是必需的。在缺乏numb蛋白的胚胎中,那些本應該發育成神經元和鞘層細胞的細胞卻發育成為外層的支持細胞。
基因選擇性表達的轉錄水平調控
[編輯]在多細胞生物個體發育過程中,基因的表達具有嚴格的時間和空間(或組織)特異性。在不同分化類型的細胞中,基因的表達差異很大。某個基因在一類細胞中激活而在另一種細胞中卻相反。那麼,是什麼因素決定了分化細胞中的特異性基因表達呢?研究表明,細胞分化的基因表達調控主要發生在轉錄水平。調節基因轉錄的因素有很多,這裡主要介紹在細胞分化過程中基因表達調控的特點。
基因的時序性表達
[編輯]某一特定基因表達嚴格按照一定的時間順序發生,這稱為基因表達的時間特異性(temporal specificity)。從受精卵到組織、器官形成的各個不同發育階段,都會有不同的基因嚴格按照自己特定的時間順序開啟或關閉,表現為分化、發育階段一致的時間性,也稱為階段特異性(stage specificity)。關於基因時序性表達的機制,人們在血紅蛋白的表達和形成過程中得到了較深入的研究。
表達血紅蛋白是紅細胞分化的主要特徵。脊椎動物的血紅蛋白由2條α-珠蛋白鏈和2條β-珠蛋白鏈組成。α-珠蛋白和β-珠蛋白基因分別定位於不同染色體上,它們都由一個基因簇(基因家族)構成。在哺乳動物,每個家族的不同成員都在發育的各個時期被表達,這樣,在胚胎、胎兒和成體中分別生成不同的血紅蛋白。人β-珠蛋白基因簇包括五個基因——ε、Cγ、Aγ、δ和β,這些基因在發育的不同時期表達:ε在早期胚胎的卵黃囊中表達;Cγ和Aγ在胎兒肝臟中表達;δ和B基因在成人骨髓紅細胞前體細胞中表達。所有這些基因的蛋白質產物都與由α-珠蛋白基因編碼的α-珠蛋白結合,從而在發育的三個時期中分別形成有不同生理特性的血紅蛋白。
在個體發育過程中依次有不同的β-珠蛋白基因的打開和關閉,這與β-珠蛋白基因簇上游的基因座控制區(locus control region, LCR)有關。LCR最初是應用DNase Ⅰ消化實驗鑑定的。在成體,只有紅細胞(前體細胞)中的LCR對DNase I敏感。對DNase I如此敏感意味着在該區域的染色質沒有被緊密包裹,轉錄因子易於接近DNA。β-珠蛋白基因簇中每個基因的有效表達,除受到每個基因5'端上游的啟動子和調控位點及基因下游(3'端)的增強子控制之外,還將受到遠離β-珠蛋白基因簇上游的LCR的嚴格制約。LCR距離ε基因的5'末端約10OOObp以上。研究發現,LCR可使任何與它相連的β-家族基因呈高水平表達,即使β-珠蛋白基因本身距離它約50OOObp, LCR也能指導轉基因小鼠中整個β-珠蛋白基因簇的順序表達。有研究者認為,LCR區和珠蛋白基因啟動子之間的DNA呈袢環狀,這樣,結合到LCR的蛋白能夠比較容易地與結合到珠蛋白基因啟動子上的蛋白發生相互作用。例如,在胚胎的卵黃囊細胞中,LCR將與c基因的啟動子相互作用,在胎肝中則與兩個γ基因啟動子相互作用,最後在骨髓來源的紅細胞中,與β基因啟動子相互作用。
在LCR區域中含有分別為300bp左右的4個「核心」控制區,其中的每個區都有與少數幾個特異性轉錄因子的結合位點,如轉錄因子NF-E2和在紅細胞中高水平表達的GATA-1。
基因的組織細胞特異性表達
[編輯]在個體發育過程中,同一基因產物在不同的組織器官中表達多少是不一樣的。一種基因產物在個體的不同組織或器官中表達,即在個體的不同空間出現,這就是基因表達的空間特異性(spatial specificity)。不同組織細胞中不僅表達的基因數量不相同,而且基因表達的強度和種類也各不相同,這就是基因表達的組織特異性。一般地,發育中基因的轉錄要求激活因子結合於基因的調控區(control region, 啟動子區和其他能調節基因表達的DNA位點)。與基因表達調控區相結合的轉錄因子可區分為通用轉錄因子和組織細胞特異性轉錄因子兩大類,前者是指為大量基因轉錄所需要並在許多細胞類型中都存在的因子;後者則是為特定基因或一系列組織特異性基因表達所需要,並在一個或很少的幾種細胞類型中存在的因子。
通過替換組織特異性(表達)基因的調控區實驗就可證明組織特異性轉錄因子的存在。例如,在小鼠中彈性蛋白酶僅在胰腺中表達,而生長激素只在腦垂體中形成,將人生長激素基因的蛋白編碼區連接於小鼠彈性蛋白酶基因的調控區之後,再將此重組的DNA 注射到小鼠受精卵中,使其整合到基因組中,在由此發育而來的轉基因小鼠的胰腺組織中可檢測到人生長激素,表明胰腺組織中的特異轉錄因子通過作用於彈性蛋白酶基因調控區,啟動了胰腺細胞表達人生長激素。
迄今已鑑定出一些組織特異性轉錄因子,如在紅細胞中表達的血紅蛋白的EFI因子、在胰島中表達的胰島素的Isl-Ⅰ因子、在骨骼肌中表達的肌球蛋白的MyoD Ⅰ因子等。通常情況下,細胞特異性的基因表達是由於僅存於那種類型細胞中的組織細胞特異性轉錄因子與基因的調控區相互作用的結果。
應該指出的是,在個體發育或細胞分化期間被激活的基因通常有複雜的調控區。一個轉錄因子是否影響特定基因的活動取決於許多因素,除了基因的調控區是否含有該轉錄因子的結合位點之外,轉錄因子的轉錄活性還受到轉錄因子調節蛋白的嚴格制約。在調控區上不同轉錄調節因子(轉錄因子和轉錄因子調節蛋白)的相互作用決定了基因是否被激活。
細胞分化過程中基因表達調控的複雜性
[編輯]動物受精卵第一次卵裂後的裂球,在個體發育中通過細胞分裂產生大量多代各種成體細胞,祖細胞與分化細胞的先後連續的宗系關係被稱為細胞譜系(cell lineage)。在特定譜系細胞形成過程中,轉錄因子(或轉錄調節蛋白)比較普遍的作用方式是:①一個表達的轉錄因子能同時調控幾個基因的表達,表現為同時發生的某些基因的激活和某些基因的關閉;②組合調控(combinatory control), 即轉錄起始受一個基因調節蛋白的組合而不是單個基因調節蛋白調控的現象。這兩種轉錄水平的調控方式在細胞分化過程中起重要作用。
1、一個關鍵基因調節蛋白的表達能夠啟動特定譜系細胞的分化 在個體發育過程中,一個關鍵基因調節蛋白的表達能夠引發一整串下游基因的表達。這種調控方式表現為某些基因的永久性關閉和一些基因的持續性激活,同時作為轉錄因子的基因產物本身起正反饋調節蛋白作用。這樣一來,維持一系列細胞分化基因的活動只需要激活基因表達的起始事件,即特異地參與某一特定發育途徑的起始基因。該基因一旦打開,它就維持在活化狀態,表現為能充分的誘導細胞沿着某一分化途徑進行,從而導致特定譜系細胞的發育。具有這種正反饋作用的起始基因通常稱為細胞分化主導(或主控)基因(master control gene)。例如,在哺乳動物的成肌細胞向肌細胞分化過程中,myoD 基因起重要作用。myoD在肌前體細胞和肌細胞中表達,它的表達將引起某一級聯反應,包括MRF4、myogenin基因的順序活化,導致肌細胞分化。myoD、MRF4和myogenin都編碼一個含有鹼性螺旋-環-螺旋(bHLH)的DNA結合域的轉錄因子。一般將myoD基因視為肌細胞分化的主導基因。有趣的是,經myoD基因轉染的成纖維細胞以及其他一些類型的細胞也能夠轉分化為肌細胞。研究資料也表明myf-5 具有myoD 的類似功能。在正常情況下,myoD 的表達對myf-5 的表達有抑制效應,Myf-5蛋白能補償MyoD功能的缺失。
單個基因調節蛋白不僅在特定譜系細胞的分化過程中起重要作用,而且還能觸發整個器官的形成。這種結果來自於對果蠅、小鼠和人類眼器官發育的研究。在眼發育過程中,有一個基因調節蛋白(在果蠅中稱為Ey, 在脊椎動物中稱為Pax-6)很關鍵,如果在適當的情況下表達,Ey能觸發形成的不只是一種類型細胞,而是由不同類型細胞組成的在三維空間中正確組織起來的整個器官(眼)。
2、一些基因調節蛋白的組合能產生許多類型的細胞 組合調控的一個條件是許多基因調節蛋白必須能共同作用來影響最終的基因轉錄速率。不僅每個基因擁有許多基因調節蛋白來調控它,而且每個基因調節蛋白也參與調控多個基因。雖然有些基因調節蛋白對單個細胞類型特異(如myoD ),但大多數基因調節蛋白存在於多種類型細胞,在體內多個部位和發育期間多次打開。
3、同源異形框基因的時空表達確定了機體前-後軸結構的分化與發育藍圖 1983年,瑞士Gehring實驗室的工作人員在研究繪製果蠅觸角足複合體(Antennapedia complex, Antp, 昆蟲中對胸部和頭部體節的發育具有調節作用的基因群)基因外顯子圖譜過程中發現,Antp cDNA不僅與Antp基因編碼區雜交,也與同一染色體上相鄰的fiz(fushitarazu, fiz)基因雜交,提示在Antp和如基因中都含有一個共同的DNA片段。隨後利用這個DNA片段為探針,相繼發現在果蠅的許多同源異形基因(homeotic gene) 中都含有這個相同的DNA片段。序列分析顯示這個共同的DNA片段為180bp, 具有相同的開放讀碼框架,編碼高度同源的由60個胺基酸組成的結構單元。後來,這一DNA序列又相繼在小鼠、人類、甚至酵母的若干基因中被發現。這個共同的180bpDNA片段被稱為同源異形框(homeobox),含有同源異形框的基因謂之同源異形框基因(homeobox gene)。迄今為止,已發現的同源異形框基因有300多種,它們廣泛分布於從酵母到人類的各種真核生物中,如果蠅的HOM基因,動物和人類的Hox基因。由同源異形框基因編碼的蛋白稱為同源異形域蛋白(homeodomain protein)。同源異形域蛋白含有同源異形域(homeodomain)和特異結構域(specific domain), 特異結構域通常位於同源異形結構域的上游,靠近蛋白的N端,而同源異形結構域則靠近蛋白的C端,這兩個結構域在其蛋白作為轉錄因子發揮作用時均起決定性的作用。研究發現,由高度保守的60個胺基酸組成的同源異形結構域,表現為一種拐彎的螺旋-回折-螺旋(HLH)立體結構,其中的9個胺基酸片段(第42~50位)與DNA的大溝相吻合,即它能識別其所控制的基因啟動子中的特異序列(應答元件),從而引起特定基因表達的激活或阻抑。
目前認為,HOM或Hox基因產物是一類非常重要的轉錄調節因子,其功能是將胚胎細胞沿前-後軸分為不同的區域,並決定各主要區域器官的形態建成。例如,果蠅HOM基因的功能是決定一組細胞發育途徑的一致性,確保體節或肢芽的典型特點。當HOM基因突變時,可發生同源異形轉變(homeosis),即由於與發育有關的某一基因錯誤表達,導致一種器官生長在錯誤部位的現象。例如果蠅的第三胸節轉變為第二胸節,形成像第二胸節一樣的翅膀(雙翅膀果蠅)。
果蠅的HOM基因位於3號染色體上,由兩個獨立的複合體組成,即觸角足複合體和雙胸複合體(bithorax complex), 含有這兩個複合體的染色體區域通常稱為同源異形複合體(homeotic complex, HOM-C)。由於進化,果蠅HOM基因在哺乳動物中出現了4次:Hox-A, Hox-B, Hox-C, Hox-D, 分別定位於人的7,17,12和2號染色體;在小鼠則分別定位於6,11,15和2號染色體上。HOM或Hox基因在染色體上的排列順序與其在體內的不同時空表達模式相對應,即:這些基因激活的時間順序表現為越靠近前部的基因表達越早,而靠近後部的基因表達較遲;這些基因表達的空間順序表現為頭區的最前葉只表達該基因簇的第一個基因,而身體最後部則表達基因簇的最後一個基因。
染色質成分的化學修飾在轉錄水平上調控細胞的特化
[編輯]基因表達的激活,首先需要將緻密壓縮的染色質或核小體舒展開來,該過程涉及染色質成分的化學修飾, 以及具有酶活性的蛋白複合體參與。染色質成分的化學修飾,包括DNA甲基化和組蛋白修飾等, 都會引起染色質結構和基因轉錄活性的變化。染色質成分(DNA和組蛋白)的修飾性標記在細胞分裂過程中能夠被繼承並共同作用決定細胞表型, 因此被稱為表觀遺傳(epigenetics, DNA序列變化以外的可遺傳的基因表達改變)。
1、DNA甲基化在轉錄水平上調控細胞分化的基因表達 在甲基轉移酶催化下,DNA分子中的胞嘧啶可轉變成5-甲基胞嘧啶,這稱為DNA甲基化。甲基化常見於富含CG二核苷酸的CpG島。甲基化是脊椎動物基因組的重要特徵之一,它可以通過DNA複製直接遺傳給子代DNA。哺乳動物基因組中約70%~80% 的CpG位點是甲基化的。甲基化主要集中於異染色質區,其餘則散在於基因組中。
DNA甲基化對基因活性的影響之一是啟動子區域的甲基化。研究表明,甲基化程度越高,DNA轉錄活性越低,而絕大多數管家基因持續表達,它們多處於非甲基化狀態。DNA甲基化參與轉錄調控的直接證據,來自對基因的活化與胞啼唗甲基化程度的直接觀察。例如,在人類紅細胞發育中,與珠蛋白合成有關的DNA幾乎無甲基化,而在其他不合成珠蛋白的細胞中, 相應的DNA部位則高度甲基化。在胚胎期卵黃囊,ε-珠蛋白基因的啟動子未甲基化,而γ-珠蛋白基因的啟動子則甲基化, 因此在胚胎期ε-珠蛋白基因開放,γ-珠蛋白基因關閉;至胎兒期,在胎兒肝細胞中與合成胎兒血紅蛋白有關的基因,如γ-珠蛋白基因沒有甲基化,但在成體肝細胞中相應的基因則被甲基化。這說明在發育過程中,當某些基因的功能完成之後,甲基化可能有助於這些基因的關閉。
DNA甲基化導致基因失活(或沉默)的可能機制是:①甲基化直接干擾轉錄因子與啟動子中特定的結合位點的結合。②甲基化導致的基因沉默可能是由特異的轉錄抑制因子直接與甲基化DNA結合引起的。人們利用隨機甲基化DNA序列作探針進行凝膠阻滯實驗,在哺乳動物細胞中找到了與甲基化DNA結合的多個蛋白,如MeCP-1(methyl cytosine binding protein 1)、MeCP-2。③甲基化導致的基因沉默是由染色質結構的改變引起的。研究表明,DNA甲基化只有在染色質濃縮形成緻密結構以後才能對基因的轉錄產生抑制作用。
甲基化作用也與基因組印記(genomic imprinting)有關。哺乳動物細胞是二倍體,含有一套來自父方的基因和一套來自母方的基因。在某些情況下,一個基因的表達與其來源有關,即只允許表達其中之一,這種現象稱為基因組印記,與之相關的基因謂之印記基因(imprinted gene)。印記基因在哺乳動物的發育過程中普遍存在。多數情況下來源於父方和母方的等位基因都同時表達,但印記基因僅在特定的發育階段和特定的組織中表達等位基因中的一個,即在某種組織細胞中, 有些僅從父源染色體上表達, 有些僅從母源染色體上表達。例如編碼胰島素樣生長因子2的基因(Igf2 )即是印記基因,來自母本的Igf2 基因拷貝是沉默的。研究資料顯示,在小鼠配子生成和胚胎發育早期,印記基因是選擇表達還是關閉,其可能機制是在特定發育時期對印記基因的甲基化。
此外,在哺乳動物(雌性)和人類女性的兩條X染色體中,其中一條滅活(鈍化)的X染色體就與DNA的甲基化有關,去甲基化可以使鈍化的X染色體基因重新活化。
2、組蛋白的化學修飾影響基因的轉錄與細胞分化 在第九章我們討論了組蛋白的共價化學修飾,如組蛋白的胺基酸殘基能夠被乙醯化、甲基化、磷酸化、泛素化、sumo化(sumoylation)及糖基化。這些修飾將引起染色質結構改變(即染色質重塑),而導致基因轉錄或沉默。近年研究表明,組蛋白的化學修飾所引起的染色質結構的動態變化能夠影響細胞的分化狀態的轉變(transition)。例如,在ES細胞向神經元分化過程中,組蛋白的甲基化和乙醯化狀態,特別是一些與神經元分化相關的因子(如Mashl、Pax6)的啟動子區域組蛋白的修飾狀態呈現出明顯差異。在果蠅研究中發現,scrawny基因(因突變的成熟果蠅的外觀而得名)的編碼產物為泛素蛋白酶(ubiquitin protease) , 其功能是通過抑制組蛋白H2B的泛素化而沉默細胞分化關鍵基因,使果蠅的多個幹細胞(生殖幹細胞、皮膚上皮和腸道的組織幹細胞)維持於未分化狀態。在scrawny功能缺失的果蠅突變體,其生殖組織、皮膚和腸道組織中過早失去了它們的幹細胞。
3、染色質成分的共價修飾具有時空性 已如上述,基因表達的激活,首先需要將緻密壓縮的染色質/核小體舒展開來,該過程涉及組蛋白的化學修飾、DNA甲基化,以及具有酶活性的功能蛋白複合體參與。影響染色質結構變化的因素,除組蛋白修飾和DNA甲基化之外,還包括組蛋白組分的改變、染色質重建子(remodeler)和非編碼RNA等。這些因素或染色質上的這些標記在細胞分裂過程中能夠被繼承並共同作用決定細胞的表型,即表觀遺傳。表觀遺傳是近些年形成的研究領域,從分子或機制上可將其定義為「在同一基因組上建立的能將不同基因轉錄和基因沉默模式傳遞下去的染色質模板變化的總和」。在由單個受精卵發育為多細胞個體(如脊椎動物)過程中,從一個受表觀遺傳調控的單基因組逐漸演變為存在於200多種不同類型細胞中的多種表觀基因組。這種程序性的變化被視為組成了一種「表觀遺傳密碼」,從而使經典遺傳密碼中所隱藏的信息得到了擴展。可以認為,染色質的共價化學修飾和非共價機制(如組蛋白組分改變、染色質重建子和非編碼RNA作用)相互結合促使形成一種染色質狀態,使其在細胞的分化和發育過程中能夠作為模板。
非編碼RNA在染色質重塑中的作用已得到初步闡釋。例如,miRNA通過調控染色質狀態而發揮轉錄抑制的機制是,miRNA與蛋白質複合體——RITS(RNA-induced transcriptional silencing)結合,解離後的一條miRNA鏈將RITS複合體引導至miRNA同源基因處,通過募集組蛋白甲基轉移酶,使組蛋白H3的賴氨酸-9發生甲基化,導致異染色質形成,最終抑制基因的轉錄。
染色質的共價修飾在細胞分化與發育中的作用是目前研究的前沿領域,涉及的機制才剛剛被人們加以闡釋。人們在哺乳動物的發育過程中了解到:在生殖細胞發育後期將發生DNA甲基化,包括親本特異性的基因印記。受精後,雄原核基因組迅速去甲基化,而雌原核基因組則維持不變。受精卵中的雄原核被包裝上組蛋白,但其組蛋白上缺乏H3K9me2和H3K27me3,而此時雌原核則具有這些標記。合子細胞基因組後續的去甲基化發生於前着床發育期,直至毅胚期。在囊胚期,內細胞團開始出現DNA甲基化,組蛋白H3K9me2和H3K27me3水平上升;而由滋養外胚層(trophectoderm)發育而來的胎盤則表現出相對較低的甲基化水平。
新近研究發現,增強子在細胞特化中的作用還表現為多個增強子叢(cluster)組合在一起形成超級增強子(super-enhancers)而發揮功能。超級增強子是具有轉錄活性增強子的一個大簇,富集高密度的關鍵轉錄因子(master transcription factors)、輔因子(cofactor)和增強子表觀修飾標記(histone modification marks)。在功能上超級增強子能夠驅動控制細胞身份(cell identity)基因的表達,可以用來解釋細胞類型特異的表達模式。目前已經在哺乳動物細胞中鑑別出超過一百萬個控制基因表達的增強子,這些增強子控制着數以萬計的基因表達,其中只有數百個超級增強子控制賦予每個細胞特性和功能的大多數關鍵基因的表達。現有研究資料提示,在發育過程中超級增強子的活性被不斷地打開或關閉,舊的超級增強子失活、新的超級增強子活化,驅動了細胞身份的變化。超級增強子對細胞分化的轉錄調控是一個新興領域,可以認為,本領域研究的不斷深入,將有助於闡明基因表達盤的改變或基因表達水平的臨界值與細胞表型特化的關係, 同時也將促進對既往研究中鑑定的基因座控制區(locus control region)、DNase Ⅰ超高敏位點(DNase Ⅰ super-hypersensitive sites)等在調控細胞分化中所起作用的認識。
基因選擇性表達的轉錄後調控
[編輯]生物體發育和細胞分化的過程,實質上也是特異蛋白質不斷合成的過程。在真核生物,基因的表達,也即基因向蛋白質的信息流向,在轉錄之後,還存在RNA加工、RNA 轉運、mRNA降解、蛋白質翻譯及蛋白質活性修飾等調控過程,它們均涉及生物體發育和細胞分化。在此僅從RNA剪接和mRNA降解兩個方面闡述基因選擇性表達的轉錄後調控在細胞分化中的作用。
1、RNA剪接與細胞分化 RNA剪接對細胞分化的一種調控方式為可變剪接(alternative splicing, 也稱選擇性剪接),即在同一基因中,其剪接位點和拼接方式可以改變,從而導致一個基因能產生多個具有明顯差異的相關蛋白產物。例如,RNA可變剪接能使β-原肌球蛋白(β-tropmyosin)基因編碼出骨骼肌細胞和成纖維細胞兩種形式的蛋白。β-原肌球蛋白的前體核RNA含有11個外顯子,其中外顯子1~5、8和9是表達這一基因的所有mRNA共有的,外顯子7和10被用於骨骼肌的β-原肌球蛋白合成中,而外顯子6和11則被用在成纖維細胞和平滑肌細胞中。
2、非編碼RNA與細胞分化 非編碼RNA(non-coding RNA)在細胞分化中的作用是近些年被揭示的。哺乳動物基因組中近98%不與蛋白質編碼基因相對應。在入類,雖然基因組組成多達約32億個鹼基,但編碼蛋白質的基因僅約2萬~3萬個,其餘絕大部分為非編碼序列。這些非編碼序列是產生微小RNA(microRNA, miRNA)、內源性siRNA(稱endo-siRNA)、piRNA(Piwi-interacting RNA)等非編碼小RNA, 以及長鏈非編碼RNA(long non-coding RNA, lncRNA)的基礎。
非編碼小RNA主要在轉錄後水平調控細胞的分化。小RNA通過與靶基因mRNA 3'端UTR互補結合,抑制靶基因的蛋白質合成或促使靶基因的mRNA降解,從而參與細胞分化與發育的基因表達調控。小RNA在生物體發育中的調控作用,起初是在研究秀麗隱杆線蟲(C. elegan )細胞命運的時間控制過程中被發現的:高濃度的轉錄因子LIN-14可特異性地促進早期幼蟲器官的蛋白質合成,但在後續的發育中,儘管體內一直存在lin-14mRNA卻檢測不到LIN-14蛋白。後來發現在線蟲的第一、二齡幼蟲期存在一個22nt的miRNA, 即lin-4RNA。Lin-4RNA通過與lin-14mRNA 3'端UTR互補結合,短暫下調LIN-14蛋白水平,促進線蟲從第一齡幼蟲期向第二齡幼蟲期發育。如果lin-4基因突變而失去功能,那麼線蟲幼蟲體內可持續合成LIN1- 4蛋白,使線蟲長期停滯在幼蟲的早期發育階段。隨後在線蟲體內又發現了另一個miRNA——let-7RNA。let-7RNA長為21nt, 存在於線蟲的第三、四齡幼蟲期及成蟲期,其功能是決定線蟲從幼蟲向成蟲的形態轉變。後續研究發現,let-7RNA不僅存在於線蟲,也存在於脊椎動物和人類。越來越多的研究資料表明,小RNA廣泛地存在於哺乳動物,具有高度的保守性。目前在各種生物中已發現數千中miRNA, 大部分miRNA的產生機制和功能尚有待闡明。迄今已鑑定了系列與細胞分化有關的miRNA,如miR-143和miR-145參與調控平滑肌細胞的分化;miR-126特異性表達於內皮細胞,調控血管形成。piRNA與PIWI蛋白家族成員的結合在調節精子成熟發育中起重要作用。非編碼小RNA與細胞分化和發育的關係也是目前生物學研究中的熱點領域,有待探索的問題很多。
長鏈非編碼RNA與細胞的分化和發育密切相關。細胞中lncRNA的來源極其複雜,有資料顯示,哺乳動物基因組序列中4%~9%的序列產生的轉錄本是lncRNA。lncRNA可通過多種方式調控基因表達,如通過在蛋白編碼基因上游啟動子區發生轉錄,干擾下游基因的表達;通過抑制RNA聚合酶Ⅱ或者介導染色質重建,影響下游基因表達;通過與蛋白編碼基因的轉錄本形成互補雙鏈而干擾mRNA的剪接;通過結合到特定蛋白質上,調節相應蛋白的活性。已有研究表明,在細胞分化與發育過程中lncRNA能調控基因組印記和X染色體失活;許多lncRNA在Hox基因座的選擇性表達中發揮重要調控作用,它們決定這些基因座染色質結構域中組蛋白甲基化修飾是否會發生、染色質結構是否允許RNA聚合酶轉錄等。