郭曉強
組蛋白跟核酸一樣是染色體的組成成分,有關組蛋白修飾的研究加深了對遺傳物質(zhì)表達的認識。一系列科學家的工作解明了組蛋白的多種翻譯后修飾,如乙?;?、甲基化、泛素化等,有助于生命科學從傳統(tǒng)的線性和靜態(tài)的研究轉型為非線性和動態(tài)的研究,也給疾病治療提供了新思路。
1953年,沃森(J.D.Watson)和克里克(F.Crick)提出“DNA雙螺旋模型”,標志著分子生物學的誕生;1958年,克里克進一步提出“中心法則”,確立了DNA的“中心”地位。DNA攜帶遺傳信息,借助RNA分子作為中介,最終指導蛋白質(zhì)的合成。自此開始,DNA研究在生命科學和基礎醫(yī)學領域占據(jù)了核心地位,并且引領著科學發(fā)展潮流。但是,原核生物DNA處于一種近乎“裸露”的狀態(tài),而真核生物DNA則與組蛋白等成分以染色體形式被壓縮在狹小的細胞核內(nèi),這樣就產(chǎn)生了一個科學上的問題:對真核生物來說,比原核生物多出的組蛋白有何種價值?它是一個可有可無的“角色”,還是一個至關重要的“成員”?
組蛋白與染色體
組蛋白研究可追溯至19世紀末。1884年,德國有機化學家科賽爾(A.Kossel)首次從細胞核中鑒定出一種攜帶正電荷呈顯堿性的物質(zhì),將其命名為組蛋白(histone)。同時期的另外兩大發(fā)現(xiàn)對組蛋白而言也有重大意義。1869年,瑞士外科醫(yī)生米歇爾(F.Miescher)首次從白細胞細胞核中分離得到一種富含磷酸的物質(zhì),命名為核素(nuclein),后更名為核酸;1882年,德國解剖學家弗萊明(w.Flemming)首次在細胞核內(nèi)觀察到一種高度濃縮致密的結構,由于該結構對染料具有高度親和力而將其命名為染色質(zhì)(chromatin)。至此,構成染色質(zhì)的兩大基本物質(zhì)——核酸和組蛋白均被發(fā)現(xiàn)。然而,科賽爾隨后把研究焦點放在了核酸組成上,最終“由于闡明了構成核酸的生物堿基結構”而榮獲1910年的諾貝爾生理學或醫(yī)學獎。這是第一次頒發(fā)給與醫(yī)學無直接關聯(lián)的獎項,當時委員會沒有想到,幾十年后正是核酸(確切地說是DNA)開啟了生命科學的新時代。限于技術方面的原因,即氨基酸研究的難度較大,科賽爾對組蛋白并未深入探索,僅停留于性質(zhì)描述的層面。
20世紀前50年,生命科學領域主要以傳染性疾病、免疫學、營養(yǎng)學和代謝等研究為主,從諾貝爾獲獎項目就能基本熟悉這一趨勢。遺傳學則以經(jīng)典遺傳學為主,主要用果蠅、玉米等為材料,闡述遺傳基本規(guī)律。兩次諾貝爾獎均頒給以果蠅為材料取得成果的摩爾根學派科學家。此時,已初步將遺傳物質(zhì)鎖定在染色體,而構成染色體的兩種物質(zhì)——核酸與組蛋白均有可能是遺傳物質(zhì),但鑒于果蠅本身的復雜性,很難確定是其中的哪一種。
限于研究的手段,染色體一直是遺傳學研究的中心內(nèi)容;組蛋白卻被塵封了幾十年,鮮有研究。直到1947年,美國遺傳學家米爾斯基(A.Mirsky)才在冷泉港會議上首次提出,真核生物染色體由DNA、組蛋白、RNA和非組蛋白4部分構成。1944年,美國微生物學家艾弗里(o.Avery)以肺炎雙球菌為材料,證明DNA是遺傳物質(zhì),隨后萊德伯格(J.Lederberg)開創(chuàng)了細菌遺傳學的時代,使DNA成為重點研究內(nèi)容。
組蛋白修飾
組蛋白研究一直在緩慢進行中。1950年代的生命科學界存在一個長期困擾科學家的難題:一個受精卵可以最終發(fā)育出多種類型的細胞,而這些細胞的遺傳物質(zhì)(DNA)卻完全相同,造成此現(xiàn)象的原因何在?
科學家在借助紙層析技術分析組蛋白的氨基酸組成時,發(fā)現(xiàn)存在著兩類組蛋白,分別稱為主要組蛋白(main histone)和附屬組蛋白(subsidiary histone),前者富含精氨酸,后者富含賴氨酸?;谶@一現(xiàn)象提出了“差異組蛋白表型決定”假說,認為不同的細胞存在不同的組蛋白,它們造成基因表達的差異,最終引起細胞功能的分化。盡管后來證實這一分類存在問題,但基于此發(fā)現(xiàn)提出了“組蛋白生理功能之一是抑制基因表達”,這有一定的合理性。
1960年代,在組蛋白中鑒定出大量修飾氨基酸。1963年,菲利普(D.M.P.Phillips)首次發(fā)現(xiàn)組蛋白中存在乙?;被?;翌年,墨菲(K.Murray)在小牛胸腺組蛋白中鑒定出甲基化賴氨酸。這些發(fā)現(xiàn)凸顯了組蛋白的結構多樣性,也暗示了組蛋白可能具有重要的生物學作用。
1964年,洛克菲勒大學教授阿爾弗雷(v.Allfrey)決定研究組蛋白修飾的生物學意義。盡管當時科學的主流是研究DNA,但阿爾弗雷堅信組蛋白也具有重大研究價值。他首先應用蛋白質(zhì)合成抑制劑嘌呤霉素(puromycin,PM)處理體外翻譯體系,而不影響組蛋白乙?;图谆f明組蛋白修飾過程在翻譯后完成。隨后他又利用c標記醋酸鈉(形成的乙?;揎椢锞哂蟹派湫裕┖托∨P叵偌毎诉M行共孵育,再利用層析技術分離各種組蛋白,并借助放射強度檢測確定組蛋白的乙?;揎棾潭龋Y果顯示組蛋白H3和H4存在廣泛的乙?;0柛ダ渍J為,由于乙酰化具有中和正電荷的能力,因此造成組蛋白攜帶正電荷的數(shù)量減少,從而與帶負電的DNA結合能力減弱,使染色體結構松散,有利于基因激活與轉錄。在此基礎上他進一步提出,不同細胞內(nèi)的組蛋白乙?;揎棽煌瑥亩餜NA轉錄程度的差異,這種差異造成細胞表型差異,即細胞分化。
阿爾弗雷憑借此項工作奠定了在組蛋白修飾領域的先驅(qū)地位。遺憾的是,這一工作主要為體外實驗,且主要借助邏輯推理確定組蛋白乙酰化與轉錄的關聯(lián),沒有體內(nèi)證據(jù)的支持,故而未引起太大關注。
核小體結構
隨著分子生物學的迅猛進步和蛋白質(zhì)化學的快速發(fā)展,對組蛋白結構與功能的研究重新回到科學家視野。1960年代末,完成了低等真核生物組蛋白H4的氨基酸測序。不久后發(fā)現(xiàn),主要存在5類組蛋白,即HI、H2A、H2B、H3和H4。
1973年,奧林斯(A.L.Olins)首先借助顯微鏡觀察到染色體中存在一系列“串珠結構”(beads-on-a-string),預示其由一系列重復單元構成。進一步通過核酸酶消化染色體,獲得約200bp(堿基對)的DNA重復單元。再利用生物化學方法,分離得到組蛋白八聚體。
上述發(fā)現(xiàn)促使科恩伯格(A.Kornberg)提出核小體(nucleosome)模型:大約146bp的DNA與1個組蛋白異八聚體(組蛋白H2A、H2B、H3和H4各2個)形成基本的重復單位,稱為核小體,而組蛋白HI發(fā)揮連接作用。此模型說明,染色體是一個有規(guī)則的重復結構,而基因表達處于高度可控狀態(tài),意味著組蛋白可能在此過程中發(fā)揮重要的調(diào)節(jié)作用,特別是組蛋白的N端位于核小體外側,為化學修飾提供了空間優(yōu)勢。
組蛋白與轉錄調(diào)節(jié)
1980年代,主流分子生物學家仍主要以細菌為模式,研究DNA的功能,因此大多數(shù)科學家認為組蛋白是一種惰性分子,主要負責將DNA進一步濃縮為核小體,并不具有基因表達調(diào)節(jié)的功能。加州大學洛杉磯分校的格倫斯坦(M.Grunstein)對此觀點持謹慎態(tài)度,他決定以酵母為材料,驗證組蛋白的作用。格倫斯坦發(fā)現(xiàn),酵母組蛋白完全缺失導致酵母死亡,但是從這一結果仍無法判斷組蛋白對基因表達的影響,因為組蛋白的完全破壞造成染色體無法有效組裝。格倫斯坦進一步研究發(fā)現(xiàn),去除組蛋白H4在N端(氨基一側)的部分氨基酸,核小體結構不受明顯影響。在這種情況下酵母雖可正常生存,卻喪失有性生殖能力。分析表明,原本影響生殖的沉默基因被重新激活,造成了生殖紊亂。這是首次在活細胞內(nèi)證明了組蛋白與基因表達之間存在因果關系。格倫斯坦的研究還表明,當組蛋白H4的N端賴氨酸被乙?;?,原本的抑制作用也可消失,部分沉默基因發(fā)生轉錄激活,這就確立了組蛋白乙酰化具有調(diào)節(jié)基因表達的功能。接下來的問題是:組蛋白乙?;^程在體內(nèi)是如何完成的?
1990年代初,多家實驗室開始競相尋找組蛋白修飾酶,洛克菲勒大學的艾利斯(c.D.Allis)最終贏得這場勝利。1996年,艾利斯小組首先從四膜蟲鑒定出第一個組蛋白乙酰轉移酶(histone acetyltransferase.HAT),并發(fā)現(xiàn)它與酵母激活因子Gcn5高度同源,意味著組蛋白乙酰化具有轉錄激活效應。與此同時,哈佛大學施雷伯團隊(s.L.Schreiber)發(fā)現(xiàn)一種哺乳動物組蛋白去乙酰化酶(histone deacetylase,HDAC)與酵母轉錄抑制因子Rpd3p高度同源,表明組蛋白去乙?;哂修D錄抑制的作用。這兩項研究確立了組蛋白修飾(乙酰化)、修飾酶和基因表達調(diào)節(jié)(轉錄激活或抑制)作用的直接因果關系;其另一方面的意義則在于,繼發(fā)現(xiàn)可逆磷酸化影響蛋白質(zhì)活性,可逆泛素化影響蛋白質(zhì)穩(wěn)定性之后,又鑒定出可逆組蛋白乙酰化影響基因轉錄活性,是基因表達調(diào)節(jié)的一種分子開關。
組蛋白乙酰轉移酶和去乙?;傅陌l(fā)現(xiàn),開創(chuàng)了組蛋白研究的新時代。許多科學家開始重新評估這種被忽視了很久的蛋白質(zhì)功能。自此,以組蛋白修飾為主的基因表達調(diào)節(jié)研究,迅速成為生命科學和醫(yī)學的前沿與熱點之一。
組蛋白修飾的生物學作用
組蛋白起著廣泛的翻譯后修飾作用,主要類型包括乙?;⒓谆?、泛素化和磷酸化等,此外還有ADP核糖基化和SUMO化(SUMO:small ubiquitin-likemodifier,小泛素相關修飾物)等。
組蛋白可逆乙?;?/p>
人類存在多種乙酰轉移酶和去乙?;?,分別在乙?;揎椷^程中發(fā)揮“寫(write)”和“擦(erase)”的作用。此外還有一類乙酰化組蛋白識別蛋白,發(fā)揮了“讀(read)”的作用。
乙?;亲钤绫话l(fā)現(xiàn)并得到深入研究的組蛋白修飾,對其作用與機制的理解也較為全面。一般而言,組蛋白乙酰化是一種轉錄激活標志,因此可逆乙?;梢宰鳛榛虮磉_開關發(fā)揮活性作用,而識別蛋白則通過招募相關因子,使開關調(diào)節(jié)更為精細。目前已開發(fā)成功大量組蛋白乙酰轉移酶和去乙?;敢种苿?,對當前基礎生命科學研究和將來疾病治療具有重要應用價值。
組蛋白可逆甲基化
2000年,艾利斯小組發(fā)現(xiàn)組蛋白甲基轉移酶;2004年,哈佛大學施洋小組發(fā)現(xiàn)第一個組蛋白去甲基化酶LSDl;2006年,多個小組幾乎同時發(fā)現(xiàn)組蛋白去甲基化酶JmjC(Jumonji c)家族,從而證實組蛋白甲基化也是一個可逆的過程。
組蛋白H3和H4是最常見的修飾底物,主要修飾位點為集中于N端的賴氨酸與精氨酸兩種殘基。賴氨酸可分別被一甲基化、二甲基化和三甲基化修飾,精氨酸則可發(fā)生一甲基化、對稱二甲基化和非對稱二甲基化修飾。組蛋白甲基化修飾是一種重要的基因調(diào)節(jié)方式,其不同狀態(tài)可影響轉錄激活或抑制。賴氨酸與精氨酸雙位點修飾以及不同甲基化個數(shù)修飾,增加了組蛋白甲基化的多樣性,從而賦予這種修飾以更為復雜和多樣的調(diào)節(jié)功能。
組蛋白可逆泛素化
1975年,首次發(fā)現(xiàn)組蛋白H2A存在泛素化修飾,比發(fā)現(xiàn)泛素化介導的蛋白質(zhì)降解還要早。H2A和H2B是兩個被泛素化修飾最多的組蛋白。這種修飾也是可逆的過程,存在泛素連接酶和去泛素化酶。
組蛋白一般被單泛素化修飾,這種作用并不參與蛋白質(zhì)降解,而主要提供識別標志物,在特定基因轉錄調(diào)節(jié)和DNA損傷應答反應過程中發(fā)揮關鍵作用,此外還參與遺傳重組、mRNA加工等過程。
組蛋白可逆磷酸化
組蛋白磷酸化修飾位點為絲氨酸、蘇氨酸和賴氨酸這三種含有羥基的氨基酸。此修飾一方面也參與了基因表達的調(diào)控,另一方面可以在細胞周期過程中發(fā)揮調(diào)節(jié)作用。
組蛋白密碼假說
目前科學界普遍接受的觀點是,DNA無法解釋有關人類發(fā)育和疾病的所有問題,那么組蛋白修飾這種對基因的精細調(diào)控,是否在發(fā)育和疾病方面起重要作用呢?2000年,艾利斯等人首先提出了組蛋白密碼假說。所謂組蛋白密碼(histone code)亦稱“第二密碼”,是相對于DNA為第一密碼而言的。按照這個假說,多種組蛋白的翻譯后修飾(包括乙酰化、甲基化等)可以針對DNA為模板的細胞內(nèi)多個過程如復制、轉錄、重組和修復等,發(fā)揮單獨或聯(lián)合的調(diào)節(jié)作用。
組蛋白密碼假說在DNA中心地位的基礎上,強調(diào)了組蛋白翻譯后修飾的重要性,將傳統(tǒng)上以DNA為主線拓展到以DNA和組蛋白共同構成的染色體為重點,尤其突出了組蛋白修飾的三維結構在基因表達調(diào)節(jié)過程中的精細作用,從而突破了傳統(tǒng)的“DNA-RNA-蛋白質(zhì)一生物學功能”這一單純線性關系的限制。目前,大量數(shù)據(jù)均支持組蛋白密碼假說,該假說為眾多生命現(xiàn)象提供了全新的解釋。例如,不同細胞的同一基因,或者同一細胞在不同的時期,都有不同的表達模式。有時甚至相反。其中的原因之一可能在于組蛋白修飾上的差異。
組蛋白密碼與癌癥發(fā)生
組蛋白密碼在解釋許多生命現(xiàn)象的同時,也拓展了對多種疾病包括糖尿病、高血壓和癌癥等發(fā)生機理的理解和認識。這里重點介紹與癌癥有關的例子。大家普遍接受的觀點是,癌癥發(fā)生是先天遺傳因素與后天環(huán)境因素共同作用的結果。說到遺傳與環(huán)境的關聯(lián),一般認為環(huán)境因素通過影響DNA(造成DNA結構變異或點突---變等)而發(fā)揮生物學作用,但這一機制無法解釋目前發(fā)現(xiàn)的所有相關現(xiàn)象。那么,是否還有其他的機制呢?
首先看一下大腦學習記憶的磷酸化修飾模式。短時記憶的原理在于離子通道得到磷酸化修飾,引起離子通透性改變;而長時記憶則涉及轉錄因子的磷酸化,這改變了神經(jīng)元的基因表達模式。上述過程并不直接影響DNA序列。學習記憶是一個后天習得過程(當然也受一定遺傳因素影響),而大部分腫瘤也是后天形成的(遺傳性的腫瘤發(fā)生頻率極低,其機制也與后天腫瘤存在眾多差異)。由此可知,兩者之間可能存在一定的可比性。已經(jīng)在多種腫瘤組織中檢測出組蛋白修飾酶的基因突變和表達異常。從而破壞了組蛋白修飾的穩(wěn)定性和基因表達模式。
根據(jù)已發(fā)現(xiàn)的癌癥組蛋白修飾異常以及學習記憶磷酸化修飾機制這兩方面的事例,英國伯明翰大學的特納(B.M.Turner)提出癌癥發(fā)生的組蛋白修飾記憶假說。多種組蛋白的可逆修飾均為酶促過程,而內(nèi)外環(huán)境均可影響酶活性并進而改變基因表達模式。受環(huán)境因素影響的組蛋白修飾改變的短期效應,會造成細胞增殖異常,這是可以消除的;然而長期的環(huán)境脅迫會引起細胞持續(xù)增殖,也就是使細胞發(fā)生轉化,最終造成不可逆的癌變。遺傳因素的作用在于增加癌癥發(fā)生的易感性。組蛋白修飾記憶假說沒有完全否定DNA突變在腫瘤發(fā)生中的作用,而是提升了組蛋白在其中的重要性,改變了傳統(tǒng)上從突變到癌變的單一思維模式。
當然,要證實這一模型尚須面對三大挑戰(zhàn)。首先是在研究方法上取得突破。組蛋白修飾是一個動態(tài)的過程,不像DNA序列那么穩(wěn)定,而研究真核細胞內(nèi)實時的組蛋白修飾,仍是目前科學界的最大難題之一。其次是在分析方法上取得突破。組蛋白修飾是一種精細調(diào)節(jié),因此具有微效性,有時差異并不顯著,無法區(qū)分結果到底是組蛋白修飾造成的效應(真實信號),還是細胞本身的差異(噪聲信號)。最后是在理念上要有改觀。習慣了DNA分析的簡單模式,就可能不習慣組蛋白修飾這種復雜的調(diào)控現(xiàn)象。
組蛋白修飾記憶假說旨在為癌癥治療提供新的模式。傳統(tǒng)的癌癥治療思路是采用物理或化學方法將癌細胞殺死,往往帶來較大副作用,主要因為這些方法對正常細胞也具有一定殺傷力。然而從這個組蛋白修飾記憶假說看來,癌細胞和正常細胞鮮有真正意義上的差別,只在組蛋白修飾(記憶程度)上不同,所以即使殺死了所謂的“癌”細胞,其他“正常”細胞還是可以潛在地持續(xù)過渡到“癌”細胞。從這個角度出發(fā),癌癥的“雜合性”或者“異質(zhì)性”的原因,并不僅僅在于基因突變的不同,還可能與組蛋白修飾記憶模式的差異相關。由此看來,癌癥治療策略應以消除組蛋白記憶為主,這需要做三方面的工作:一是去除誘發(fā)因素,從而消除錯誤記憶;二是補充健康環(huán)境,重新建立正常記憶;三是形成局域化效應,將無法逆轉記憶的細胞限制于特定的空間。
前景與展望
傳統(tǒng)的DNA研究主要涉及基因與性狀對應的線性關系。相對于此,組蛋白修飾復雜得多,研究難度也較大。組蛋自修飾紊亂所致的表型,并無DNA異常所引起的顯著而穩(wěn)定的差異,有時很難與隨機誤差相區(qū)分,從而難以判斷其真正的生物學意義。不過,隨著組蛋白研究的深入,人們的認識也從傳統(tǒng)的DNA拓展到染色體層面,開始考慮組蛋白的生物學價值。相信隨著研究手段的發(fā)展與完善,通過組蛋白生物學研究將會對一些尤其涉及高等哺乳動物生理和病理的問題產(chǎn)生新理解與新認識,也將為預防和治療提供新的策略。其實許多藥物就是酶的抑制劑,而組蛋白修飾就是通過酶來調(diào)控的,組蛋白修飾研究可以幫助改進相關藥物的研發(fā)和使用理念。同時,該領域的深入探索還有助于生命科學從傳統(tǒng)的線性、靜態(tài)的研究過渡到非線性、動態(tài)的研究。
從生命科學史的發(fā)展軌跡來看,染色體研究統(tǒng)治了經(jīng)典遺傳學近50年,DNA研究統(tǒng)治了分子生物學50年,2l世紀的前50年是否已經(jīng)開始由組蛋白修飾為主的生物化學唱主角了呢?研究發(fā)展之新趨勢值得關注。