生物化學與分子生物學/蛋白質的分子結構

維基教科書,自由的教學讀本

蛋白質的結構與功能- 蛋白質的分子組成 - 蛋白質的分子結構 - 蛋白質結構與功能的關係 - 蛋白質的理化性質
蛋白質分子是由許多胺基酸通過肽鍵相連形成的生物大分子。人體內具有生理功能的蛋白質大都是有序結構,每種蛋白質都有其一定的胺基酸種類、組成百分比、胺基酸排列順序以及肽鏈空間的特定排布位置。因此由胺基酸排列順序及膚鏈的空間排布等所構成的蛋白質分子結構,才真正體現蛋白質的個性,是每種蛋白質具有獨特生理功能的結構基礎。由於參與蛋白質生物合成的胺基酸有20種,且蛋白質的分子量均較大,因此蛋白質的胺基酸排列順序和空間位置幾乎是無窮盡的,足以為人體多達數以萬計的蛋白質提供各異的胺基酸序列和特定的空間結構,使蛋白質完成生命所賦予的數以千萬計的生理功能。
1952年丹麥科學家L.Linderstrom建議將蛋白質複雜的分子結構分成4個層次,即一級、二級、三級、四級結構,後三者統稱為高級結構或空間構象(conformation)。蛋白質的空間構象涵蓋了蛋白質分子中的每一原子在三維空間的相對位置,它們是蛋白質特有性質和功能的結構基礎。但並非所有的蛋白質都有四級結構,由一條肽鏈形成的蛋白質只有一級、二級和三級結構,由2條或2條以上肽鏈形成的蛋白質才有四級結構。

胺基酸的排列順序決定蛋白質的一級結構[編輯]

在蛋白質分子中,從N-端到C-端的胺基酸排列順序稱為蛋白質的一級結構。化學鍵包括肽鍵和二硫鍵。
研究蛋白質一級結構的意義:

  • 一級結構是蛋白質構象的基礎,包含了形成特定的構象所需的全部信息。
  • 一級結構是蛋白質生物活性的分子基礎。
  • 眾多遺傳病的分子基礎是基因突變,導致其所表達的蛋白質的一級結構發生改變。
  • 研究蛋白質的一級結構可以闡明生物進化史,不同物種之間的同源蛋白質之間的一級結構越相似,物種之間的進化關係就越近。

牛胰島素是第一個被測定一級結構的蛋白質分子,由英國化學家F.Sanger於1953年完成,因此他於1958年獲得諾貝爾化學獎。胰島素有A和B二條多肽鏈,A鏈有21個胺基酸殘基,B鏈有30個胺基酸殘基。如果把胺基酸序列(amino acid sequence)標上數碼,應以氨基末端為1號,依次向羧基末端排列。牛胰島素分子中有3個二硫鍵,1個位於A鏈內,稱為鏈內二硫鍵,由A鏈的第6位和第11位半胱氨酸的琉基脫氫而形成,另2個二硫鍵位於A、B 兩鏈間, 稱為鏈間二硫鍵。
體內種類繁多的蛋白質,其一級結構各不相同,一級結構是蛋白質空間構象和特異生物學功能的基礎。然而,隨着對蛋白質結構研究的深入,已認識到蛋白質一級結構並不是決定蛋白質空間構象的唯一因素。
目前已知一級結構的蛋白質數量已相當可觀,並且還以更快的速度增加。國際互聯網有若干重要的蛋白質數據庫(updated protein database), 例如EMBL(European Molecular Biology Laboratory Data Library)、Genbank(Genetic Sequence Databank)和PIR(Protein Identification Resource Sequence Database)等,收集了大量最新的蛋白質一級結構及其他資料,為蛋白質結構與功能的深入研究提供了便利。

多肽鏈的局部有規則重複的主鏈構象為蛋白質二級結構[編輯]

蛋白質的二級結構(protein secondary structure)是指蛋白質分子中某一段肽鏈的局部空間結構,也就是該段肽鏈主鏈骨架原子的相對空間位置,並不涉及胺基酸殘基側鏈的構象。肽鏈主鏈骨架原子即N(氨基氮原子)、Cα(α-碳原子)和 C(羰基碳原子)3個原子依次重複排列。蛋白質的二級結構主要包括α-螺旋、β-摺疊、β-轉角、Ω環和無規則捲曲。由於蛋白質的分子量碩大,因此,一個蛋白質分子可含有多種二級結構或多個同種二級結構,而且在蛋白質分子內空間上相鄰的2個以上的二級結構還可協同完成特定的功能。

參與肽鍵形成的6個原子在同一平面上[編輯]

20世紀30年代末,L.Pauling和R.B.Corey 應用X-射線衍射技術研究胺基酸和寡肽的晶體結構,其目的是要獲得一組標準鍵長和鍵角,以推導肽的構象,最終提出了肽單元(peptide unit) 概念。
參與肽鍵的6個原子Cα1、C 、0、N、H、Cα2位於同一平面,Cα1和Cα2在平面上所處的位置為反式(trans)構型,此同一平面上的6個原子構成了所謂的肽單元。
其中肽鍵(C—N)的鍵長為0.132nm, 該鍵長介於C-N的單鍵長(0.149nm)和雙鍵長(0.127nm)之間,所以有一定程度雙鍵性能,不能自由旋轉。而Cα分別與N和C(羰基碳)相連的鍵都是典型的單鍵,可以自由旋轉,N與Cα的鍵角以Φ表示,Cα與C的鍵旋轉角度以ψ表示。也正由於肽單元上Cα原子所連的兩個單鍵的自由旋轉角度,決定了兩個相鄰的肽單元平面的相對空間位置。

α-螺旋結構是常見的蛋白質二級結構[編輯]

Pauling和Corey根據實驗數據提出了兩種肽鏈局部主鏈原子的空間構象的分子模型,稱為α-螺旋(α-helix)和B摺疊(β-pleated sheet), 它們是蛋白質二級結構的主要形式。在α-螺旋結構中,多肽鏈的主鏈圍繞中心軸作有規律的螺旋式上升,螺旋的走向為順時針方向,即所謂右手螺旋,其ψ為-47°,φ為-57°,胺基酸側鏈伸向螺旋外側。每3.6個胺基酸殘基螺旋上升一圈(即旋轉360°),螺距為0.54nm。α-螺旋的每個肽鍵的N—H和第四個肽鍵的羰基氧形成氫鍵,氫鍵的方向與螺旋長軸基本平行。
一般而言,20種胺基酸均可參與組成α-螺旋結構,但是Ala、Glu、Leu和Met比Gly、Pro、Ser及Tyr更常見。在蛋白質表面存在的α-螺旋,常具有兩性特點,即由3至4個疏水胺基酸殘基組成的肽段與由3~4個親水胺基酸殘基組成的肽段交替出現,致使α-螺旋的一側為疏水性胺基酸,另一側為親水性胺基酸,使之能在極性或非極性環境中存在。這種兩性α-螺旋可見於血漿脂蛋白、多肽激素和鈣調蛋白激酶等。肌紅蛋白和血紅蛋白分子中有許多肽鏈段落呈α-螺旋結構。毛髮的角蛋白、肌組織的肌球蛋白以及血凝塊中的纖維蛋白,它們的多肽鏈幾乎全長都捲曲成α-螺旋。數條α-螺旋狀的多肽鏈可纏繞起來,形成纜索,從而增強其機械強度,並具有可伸縮性(彈性)。

β-摺疊使多肽鏈形成片層結構[編輯]

β摺疊與α螺旋的形狀截然不同,呈摺紙狀。在β-摺疊結構中多肽鏈充分伸展,每個肽單元以Cα為旋轉點,依次摺疊成鋸齒狀結構,胺基酸殘基側鏈交替地位於鋸齒狀結構的上下方。所形成的鋸齒狀結構一般比較短,只含5~8個胺基酸殘基。一條肽鏈內的若干肽段的鋸齒狀結構可平行排列,分子內相距較遠的兩個肽段可通過摺疊而形成相同走向,也可通過回折而形成相反走向。走向相反時,兩個反平行肽段的間距為 0.70nm, 並通過肽鏈間的肽鍵羰基氧和亞氨基氫形成氫鍵,來穩固β-摺疊結構,蠶絲蛋白幾乎都是β-摺疊結構,許多蛋白質既有α-螺旋又有β-摺疊結構。

β-轉角和Ω環存在於球狀蛋白質中[編輯]

β-轉角
β-轉角

β-轉角(β-turn)常發生於肽鏈進行180°回折時的轉角上,呈U形倒轉。β-轉角通常由4個胺基酸殘基組成,其第一個殘基的羰基氧(O)與第四個殘基的氨基氫(H)可形成氫鍵。β-轉角的結構較特殊,第二個殘基常為脯氨酸,其他常見殘基有甘氨酸、天冬氨酸、天冬醯胺和色氨酸。有2種類型的β-轉角,分別是轉角Ⅰ和轉角Ⅱ。Ⅰ型β轉角和Ⅱ型β轉角非常相似,只是其中肽鍵的二面角ψ和φ角有所不同。Ⅱ型β轉角的第3個殘基往往是甘氨酸。
Ω環是存在於球狀蛋白質中的一種二級結構。這類肽段形狀象希臘字母Ω,所以稱Ω環。Ω環這種結構總是出現在蛋白質分子的表面,而且以親水殘基為主,在分子識別中可能起重要作用。

胺基酸殘基的側鏈影響二級結構的形成[編輯]

蛋白質二級結構是以一級結構為基礎的。一段肽鏈其胺基酸殘基的側鏈適合形成α-螺旋或β-摺疊,它就會出現相應的二級結構。例如一段肽鏈有多個穀氨酸或天冬氨酸殘基相鄰,則在pH7.0時這些殘基的游離羧基都帶負電荷,彼此相斥,妨礙α-螺旋的形成。同樣,多個鹼性胺基酸殘基在一肽段內,由於正電荷相斥,也妨礙α-螺旋的形成。此外天冬醯胺、亮氨酸的側鏈很大,也會影響α-螺旋形成。脯氨酸的N原子在剛性的五元環中,其形成的肽鍵N原子上沒有H, 所以不能形成氫鍵,結果肽鏈走向轉折,不形成α-螺旋。形成β-摺疊的肽段,胺基酸殘基的側鏈要比較小,能容許兩條肽段彼此靠近。

多肽鏈進一步摺疊成蛋白質三級結構[編輯]

三級結構是指整條肽鏈中全部胺基酸殘基的相對空間位置[編輯]

蛋白質三級結構(protein tertiary structure)是指整條肽鏈中全部胺基酸殘基的相對空間位置,也就是整條肽鏈所有原子在三維空間的排布位置。
已知球狀蛋白質的三級結構有某些共同特徵,如摺疊成緊密的球狀或橢球狀;含有多種二級結構並具有明顯的摺疊層次,即一級結構上相鄰的二級結構常在三級結構中彼此靠近並形成超二級結構,進一步摺疊成相對獨立的三維空間結構;以及疏水側鏈常分布在分子內部等。
肌紅蛋白是由153個胺基酸殘基構成的單一肽鏈蛋白質,含有 1 個血紅素輔基。肌紅蛋白分子中α-螺旋占75%, 構成A至H8個螺旋區,兩個螺旋區之間有一段柔性連接肽,脯氨酸位於轉角處。由於側鏈R基團的相互作用,多肽鏈纏繞,形成一個球狀分子(4.5nm×3.5nm×2.5nm), 球表面主要有親水側鏈,疏水側鏈位於分子內部。 蛋白質三級結構的形成和穩定主要靠次級鍵如疏水鍵、鹽鍵、氫鍵和范德華力(van der Waals force)等。

結構模體可由2個或2個以上二級結構肽段組成[編輯]

結構模體(structural motif)是蛋白質分子中具有特定空間構象和特定功能的結構成分。一個模體總有其特徵性的胺基酸序列,並發揮特殊的功能。
一般而言,常見的結構模體可以有以下幾種形式:

  • α-螺旋-β-轉角(或環)-α-螺旋模體(見於多種DNA結合蛋白);
  • 鏈-β-轉角-鏈(見於反平行β-摺疊的蛋白質);
  • 鏈-β-轉角-α-螺旋-β-轉角-鏈模體(見於多種α-螺旋/β-摺疊蛋白質)。
亮氨酸拉鏈
亮氨酸拉鏈

在這些結構模體中,β-轉角常為含3~4個胺基酸殘基的片段;而環(loop)為較大的片段,常連接非規則的二級結構。
在許多蛋白質分子中,可由2個或2個以上具有二級結構的肽段在空間上相互接近,形成一個有規則的二級結構組合,稱為超二級結構,此概念由M.G.Rossman於1973年提出。目前已知的二級結構組合有αα、βαβ、ββ等幾種形式。研究發現,α-螺旋之間、β-摺疊之間以及α-螺旋與β-摺疊之間的相互作用,主要是由非極性胺基酸殘基參與的。
亮氨酸拉鏈(leucine zipper)是出現在DNA結合蛋白和其他蛋白質中的一種結構模體。當來自同一個或不同多肽鏈的兩個兩用性的α-螺旋的疏水面(常含有亮氨酸殘基)相互作用形成一個圈對圈的二聚體結構,亮氨酸有規律地每隔6個胺基酸就出現一次,亮氨酸拉鏈常出現在真核生物DNA結合蛋白的C-端,往往與癌基因表達調控功能有關。
在許多鈣結合蛋白分子中通常有一個結合鈣離子的模體,它由螺旋-環-螺旋(helix-loop-helix)三個肽段組成,在環中有幾個恆定的親水側鏈,側鏈末端的氧原子通過氫鍵而結合鈣離子。近年發現的鋅指(zinc finger)結構也是一個常見的模體例子,它由1個α-螺旋和2個反平行的β-摺疊三個肽段組成,具有結合鋅離子功能。該模體的N-端有1對半胱氨酸殘基,C-端有1對組氨酸殘基,此4個殘基在空間上形成一個洞穴,恰好容納1個Zn2+。由於Zn2+可穩固模體中的α-螺旋結構,使此α-螺旋能鑲嵌於DNA的大溝中,因此含鋅指結構的蛋白質都能與DNA或RNA結合。可見結構模體的特徵性空間構象是其特殊功能的結構基礎。

結構域是三級結構層次上具有獨立結構與功能的區域[編輯]

分子量較大的蛋白質常可摺疊成多個結構較為緊密且穩定的區域,並各行其功能,稱為結構域(domain)。大多數結構域含有序列上連續的100~200個胺基酸殘基,若用限制性蛋白酶水解,含多個結構域的蛋白質常分解出獨立的結構域,而各結構域的構象可以基本不改變,並保持其功能。超二級結構則不具備這種特點。因此,結構域也可看作是球狀蛋白質的獨立摺疊單位,有較為獨立的三維空間結構。
例如,由2個亞基構成的3-磷酸甘油醛脫氫酶,每個亞基由2個結構域組成,N-端第1~146個胺基酸殘基形成的第一個結構域能與NAD+結合,第二個結構域(第147~333胺基酸殘基)與底物3-磷酸甘油醛結合。有些蛋白質各結構域之間接觸較緊密,從結構上很難劃分,因此,並非所有蛋白質的結構域都明顯可分。

蛋白質的多肽鏈須摺疊成正確的空間構象[編輯]

理論上講,如果蛋白質的多肽鏈隨機摺疊,可能產生成於上萬種可能的空間構象。而實際上,蛋白質合成後,在一定的條件下,可能只形成一種正確的空間構象。除一級結構為決定因素外,還需要在一類稱為分子伴侶(molecular chaperone)的蛋白質輔助下,合成中的蛋白質才能摺疊成正確的空間構象。只有形成正確的空間構象的蛋白質才具有生物學功能。

含有兩條以上多肽鏈的蛋白質可具有四級結構[編輯]

血紅蛋白三維結構

體內許多功能性蛋白質含有兩條或兩條以上多肽鏈。每一條多肽鏈都有其完整的三級結構,稱為亞基(subunit),亞基與亞基之間呈特定的三維空間排布,並以非共價鍵相連接。蛋白質分子中各個亞基的空間排布及亞基接觸部位的布局和相互作用,稱為蛋白質四級結構(protein quaternary structure)。
在四級結構中,各亞基間的結合力主要是氫鍵和離子鍵。在2個亞基組成的四級結構蛋白質中,若亞基結構相同,稱之為同二聚體(homodimer),若亞基分子不同,則稱之為異二聚體(heterodimer), 多個亞基可以此類推。對於2個以上亞基構成的蛋白質,單一亞基一般沒有生物學功能,完整的四級結構是其發揮生物學功能的保證。
成人血紅蛋白的α亞基和β亞基分別含有141個和146個胺基酸。兩種亞基的三級結構頗為相似,且每個亞基都可結合l個血紅素(heme)輔基。4個亞基通過8個離子鍵相連,形成血紅蛋白四聚體,具有運輸O2和CO2的功能。但每一個亞基單獨存在時,雖可結合氧且與氧親和力增強,但在體內組織中難於釋放氧,失去了血紅蛋白原有的運輸氧的作用。

蛋白質可依其組成結構或功能進行分類[編輯]

除胺基酸外,某些蛋白質還含有其他非胺基酸組分。因此根據蛋白質組成成分可分成單純蛋白質和結合蛋白質,前者只含胺基酸,而後者除蛋白質部分外,還含有非蛋白質部分,為蛋白質的生物學活性或代謝所依賴。結合蛋白質中的非蛋白質部分被稱為輔基,絕大部分輔基是通過共價鍵方式與蛋白質部分相連。構成蛋白質輔基的種類也很廣,常見的有色素化合物、寡糖、脂質、磷酸、金屬離子甚至分子量較大的核酸。細胞色素c(cytochrome c, Cyt c)是含有色素的結合蛋白質,其鐵卟啉環上的乙烯基側鏈與蛋白質部分的半胱氨酸殘基以硫醚鍵相連,鐵卟啉中的鐵離子是細胞色素c的重要功能位點。免疫球蛋白是一類糖蛋白,作為輔基的數支寡糖鏈通過共價鍵與蛋白質部分連接。
蛋白質還可根據其形狀分為纖維狀蛋白質和球狀蛋白質兩大類。一般來說,纖維狀蛋白質形似纖維,其分子長軸的長度比短軸長10倍以上。纖維狀蛋白質多數為結構蛋白質,較難溶於水,作為細胞堅實的支架或連接各細胞、組織和器官的細胞外成分,如膠原蛋白、彈性蛋白、角蛋白等。大量存在於結締組織中的膠原蛋白就是典型的纖維狀蛋白質,其長軸為300nm, 而短軸僅為1.5nm。球狀蛋白質的形狀近似於球形或橢球形,多數可溶於水,許多具有生理學功能的蛋白質如酶、轉運蛋白、蛋白質類激素、代謝調節蛋白、基因表達調節蛋白及免疫球蛋白等都屬於球狀蛋白質。
隨着蛋白質結構與功能研究的不斷深入,發現體內胺基酸序列相似而且空間結構與功能也十分相近的蛋白質有若干,即產生了「蛋白質家族(protein family)」這一概念。屬於同一蛋白質家族的成員,稱為同源蛋白質(homologous protein)。人們通過對蛋白質家族成員的比較,可得到許多物種進化的重要證據。在體內還發現,2個或2個以上的蛋白質家族之間,其胺基酸序列的相似性並不高,但含有發揮相似作用的同一模體結構,通常將這些蛋白質家族歸類為超家族(superfamily)。這些超家族成員是由共同祖先進化而來的一大類蛋白質。