李浠榕
(西安交通大學(xué)附屬中學(xué),陜西 西安710000)
生物因為光、暗,冷、熱等呈周期變化的自然因素產(chǎn)生的節(jié)律行為具有周期性,而隨著外界自然環(huán)境變化,生物體自身進化出了一套能夠進行前瞻性調(diào)節(jié)的機制。根據(jù)節(jié)律的長短以及響應(yīng)不同的環(huán)境變化,這個機制的節(jié)律可分為:日節(jié)律、月節(jié)律、季節(jié)節(jié)律和年節(jié)律等。而被研究最多的是以24 小時為周期的日節(jié)律變化,這是生物因晝夜變化做出的適應(yīng),從生物的生理方面進行有周期性波動的內(nèi)在節(jié)奏稱為生物鐘(Circadian Clock)。
植物的生物鐘被首先發(fā)現(xiàn)與植物的葉片移動,比如菜豆葉片在光照條件不變的條件下,也會做出上下擺動,而葉子的升起和下降運動的所構(gòu)成的周期接近27 小時,近似于一天的24小時,這是植物的近似晝夜節(jié)律的典型例子。
一般來說,植物生物鐘系統(tǒng)可以分成三個組成部分:輸入途徑、核心振蕩器和輸出途徑。輸入途徑負(fù)責(zé)將外界環(huán)境變化信號傳導(dǎo)入生物鐘的信號通路,從而使核心振蕩器響應(yīng)環(huán)境信號,已知的輸入途徑有接受光- 暗變化以及冷- 熱變化等信號通路。核心振蕩器定位于細(xì)胞核內(nèi),為幾個以轉(zhuǎn)錄因子為主的基因所構(gòu)成的互相抑制調(diào)控的閉合回路,并利用表達高低不同產(chǎn)生近似24 小時的晝夜節(jié)律的振蕩。輸出途徑為核心振蕩器通過時間性表達差異調(diào)控植物其他基因的調(diào)控機制,單個振蕩器可以通過其轉(zhuǎn)錄因子特性,調(diào)控多個其他基因的表達,并利用其本身的表達節(jié)律性從而影響其他基因的表達節(jié)律性,以達到調(diào)控諸多關(guān)鍵基因從而控制植物生長發(fā)育和重要生理過程的目的。
十字花科植物擬南芥為植物研究的模式物種,具有在全球分部廣,生長周期短,結(jié)種多,基因組小等作為植物研究的優(yōu)點。2000 年,國際擬南芥基因組合作聯(lián)盟首先完成了擬南芥的基因組測序,是第一種完成全基因組測序和分析的植物,并闡述了擬南芥基因組序列與植物演化和農(nóng)業(yè)的關(guān)系,并介紹了其他植物基因組的課題。2016 年6 月9 日,1135 個擬南芥(Arabidopsis thaliana)基因組重測序的論文在Cell 期刊在線發(fā)表。這篇對1135 個擬南芥基因組全基因組序列分析的論文的發(fā)表,宣告了對模式植物擬南芥至少1001 個品系(生態(tài)型)的全基因組序列分析計劃項目一個階段的結(jié)束,該項目揭示不同株系的野生型擬南芥基因組上自然的序列突變,并發(fā)現(xiàn)了擬南芥存在著祖先的殘余群體。
前文已敘述過擬南芥基因組測序的已完成工作,在2017年,擬南芥基因組注釋得到了更新?,F(xiàn)今擬南芥的全部生物學(xué)信息位于The Arabidopsis Information Resource (TAIR)網(wǎng)站上供研究人員查詢使用,并包括擬南芥27 000 個基因和35 000個編碼蛋白的研究分析信息。通過該網(wǎng)站可以尋找各個擬南芥基因的序列,以及關(guān)于該基因的很多分析信息,另外還可以根據(jù)每一個基因的位置查找并且購買該基因的突變體。本文的生物信息學(xué)資源均來自TAIR 網(wǎng)站。
Diurnal 網(wǎng)頁是對多個植物基因的節(jié)律性表達進行預(yù)測的服務(wù)網(wǎng)頁,為的Mockler 實驗室構(gòu)建,是連接計算生物信息學(xué)和分子基因組學(xué)的重要分析工具,其數(shù)據(jù)來源為已知的基因表達分析數(shù)據(jù)。該網(wǎng)站是一個連接生物信息學(xué)和分子基因組生物學(xué)的工作站,可以根據(jù)基因編號查找通過計算方法統(tǒng)計出可視化數(shù)據(jù),可以預(yù)測一個基因的時間性表達狀況,自我剪接等等內(nèi)容,現(xiàn)在已經(jīng)收錄了包括擬南芥,水稻,短穗二柄草,大豆,楊樹,玉米等植物的相關(guān)生物學(xué)信息。
Plant CARE 網(wǎng)頁是啟動子分析服務(wù)網(wǎng)頁,為比利時根特大學(xué)和VIB 研究所共同創(chuàng)建,該服務(wù)網(wǎng)頁收錄了已公開發(fā)表的擁有染色質(zhì)免疫沉淀測序(ChIP-Seq)數(shù)據(jù),并根據(jù)數(shù)據(jù)分析了各種轉(zhuǎn)錄因子結(jié)合在啟動子上的結(jié)合片段(motif),而后根據(jù)已知的轉(zhuǎn)錄因子結(jié)合的motif 來預(yù)測一段啟動子上可能結(jié)合的轉(zhuǎn)錄因子情況。
為了預(yù)測擬南芥未知基因AT1G16730 的表達節(jié)律性,我們先在TAIR 網(wǎng)站上查找關(guān)于該基因的生物信息學(xué)資料,根據(jù)網(wǎng)頁顯示得知:該基因位于擬南芥第一條染色體上,堿基位數(shù)為第5727406-5726358,反向表達?;蚪M全長1039bp,其中編碼區(qū)全長609bp,編碼區(qū)中間有一個內(nèi)含子。編碼區(qū)可以編碼一段202 個氨基酸殘基的蛋白,分子量為21685.9,蛋白質(zhì)的等電點為4.79。該基因表達時期分析結(jié)果表明,基因表達的細(xì)胞內(nèi)定位在細(xì)胞核內(nèi),以及過氧化物酶體上,在擬南芥生長史上與開花時期表達,表達部位為保衛(wèi)細(xì)胞、雄蕊以及花莖。
圖1 AT1G16730 的表達節(jié)律,在第20 到24 小時有很明顯的表達高峰
圖2 AT1G16730 基因的啟動子分析
通過上述描述可以看出,這個基因的大小并不大,編碼的蛋白是一個相對比較小的蛋白,只有20kd 左右。另外這個基因在擬南芥植株的生活史中,只在開花時期才表達,并且表達有組織特異性,只在雄蕊,保衛(wèi)細(xì)胞,花莖中表達。根據(jù)擬南芥的生長規(guī)律,花莖只有擬南芥抽薹之后(進入花期)才會生長出來,而雄蕊更是只有花開始發(fā)育之后才會表達,證明該基因在擬南芥幼苗期,以及營養(yǎng)生長期的表達不會很高(只長蓮座葉時期),而基于其細(xì)胞內(nèi)定位在細(xì)胞核與過氧化酶酶體上這一點來看,該基因編碼的很可能是一個轉(zhuǎn)錄因子,這預(yù)示著它和擬南芥開花以及花的生長發(fā)育有關(guān),并且在這個過程中起重要的轉(zhuǎn)錄調(diào)控作用。
使用Diurnal 網(wǎng)頁輸入AT1G16730 基因的編號,可以對該基因的表達節(jié)律性可能性進行預(yù)測。前文已敘述過,Diurnal 網(wǎng)站通過收錄的各種植物的轉(zhuǎn)錄情況數(shù)據(jù)可以對某個基因的2個晝夜的表達情況進行預(yù)測。在輸入頁面之上,在Genome 選項中選擇物種Arabidopsis thliana(擬南芥),確定物種,而后選擇LLHD 選項選擇24 小時全光照的光照條件,最后在Cutoff 選項中選擇默認(rèn)的數(shù)值0.8,這個選項是將節(jié)律表現(xiàn)的不夠強的基因表達曲線去除,最后電擊Submit 提交條件。網(wǎng)頁歸化出的表達曲線表現(xiàn)出了很強的表達節(jié)律,在第0 小時和24 小時有明顯的表達峰值,但是在其他時間點表達量都不高(圖1)。
通過這個分析,我們得知該基因在全光照條件下在一天大部分時間表達量都不高,只有在臨近一天結(jié)束時期才會有一個峰值,這說明只有在午夜附近時候該基因的功能才起到最重要的作用,這首先預(yù)示著該基因可能在黑暗環(huán)境下的作用會比在有光照時候的作用大,結(jié)合該基因在保衛(wèi)細(xì)胞中表達這一點來看,有可能對氣孔開閉控制有調(diào)控作用。
一般情況某個基因的轉(zhuǎn)錄水平與該基因的啟動子直接相關(guān),現(xiàn)已知AT1G16730 基因的表達可能存在節(jié)律性,所以對該基因的啟動子做生物信息學(xué)分析就顯得尤為重要。利用Plant CARE 網(wǎng)頁進行分析,在網(wǎng)頁中點開Search of CARE 一項,將AT1G16730 基因起始密碼子上游1666 個堿基作為該基因的啟動子序列輸入進輸入框,點擊Search 鍵開始進行分析。
從分析的結(jié)果中可以得知,該基因啟動子中不但有擬南芥核心振蕩器調(diào)控必備的G-Box 區(qū)域以及與能夠被核心振蕩器基因CCA1,LHY 調(diào)控的相似序列MYB-Binding 序列,這預(yù)示著該基因有被擬南芥核心振蕩器調(diào)控的可能性(圖2)。
綜上所述,擬南芥AT1G16730 基因的各種分析表明,該基因表達可能有節(jié)律并且有可能是被生物鐘核心振蕩器直接調(diào)控的基因。因為生物鐘的重要性但是因為該基因表達存在組織特異性(只在雄蕊,保衛(wèi)細(xì)胞,花莖中表達)和生長階段特異性(只在開花時期表達),這與已知的直接被生物鐘核心振蕩器直接調(diào)控的基因有一定的差異,因為一般被核心振蕩器直接調(diào)控的基因在擬南芥幼苗階段就可以表達。關(guān)于擬南芥生物鐘的研究目前還比較多的集中于對擬南芥幼苗時期核心振蕩器的轉(zhuǎn)錄,翻譯,修飾以及它們構(gòu)成的對其他基因的調(diào)控網(wǎng)絡(luò),但是對于擬南芥開花時期生物鐘究竟是如何發(fā)揮作用的,除了影響開花時間之外其他方面研究還比較少?;跀M南芥的生活史,抽薹是擬南芥由營養(yǎng)性生長向生殖性生長的拐點,從此擬南芥進入花期,而植株整體的很多基因的表達,調(diào)控肯定會發(fā)生變化,是否會有很多類似AT1G16730 基因一樣只有在開花時期才表達的基因參與了生物鐘對植物各個方面的調(diào)控,從而參與到這個過程之中,這方面未來有待于相關(guān)研究人員做進一步的研究,而這些未知功能基因的生物信息學(xué)分析無疑是非常重要的一個步驟。