侯 哲,梅 梅,張曉林,陸秀君
(1.沈陽(yáng)農(nóng)業(yè)大學(xué) 林學(xué)院,遼寧 沈陽(yáng) 110866;2.中國(guó)林業(yè)科學(xué)研究院 a.林業(yè)研究所;b.國(guó)家林業(yè)局森林培育重點(diǎn)實(shí)驗(yàn)室;c.林木遺傳育種國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100091)
天女木蘭Magnolia sieboldiiK.Koch 是世界上稀有的珍貴樹(shù)種之一,主要分布于中國(guó)北部地區(qū),朝鮮、日本也有少量的分布。天女木蘭具有廣泛的開(kāi)發(fā)利用價(jià)值,花色潔白素雅,異常芬芳,是一種庭院綠化及觀賞樹(shù)種,木質(zhì)優(yōu)良,樹(shù)干通直,可做家具和雕刻用材。
天女木蘭種子不同部位都存在不同程度的發(fā)芽抑制物質(zhì),種胚發(fā)育不完全造成了種子的深休眠[1]。種子在可收獲的時(shí)候,胚乳中存在的不同濃度的植物激素,是致使種子難以萌發(fā)的又一個(gè)重要原因[2]。合理的濃度和浸種時(shí)間有利于提高種子質(zhì)量,促進(jìn)種子萌發(fā)[3]。生理休眠是天女木蘭種子難以萌發(fā)的原因,種皮的機(jī)械束縛并不能造成種子深度休眠,其主要原因是種胚發(fā)育不完全,對(duì)種子進(jìn)行150 d 的低溫沙藏后高溫15 d 催芽,種子可以達(dá)到90%的發(fā)芽率[4]。將GA3質(zhì)量濃度設(shè)置為300 mg/L 后浸種,通過(guò)變溫層積催芽效果較好,且在整個(gè)沙藏過(guò)程中溫度起主導(dǎo)作用。而種胚的生長(zhǎng)分化在采用GA3浸種變溫層積處理后會(huì)有一定的促進(jìn)作用,這是因?yàn)榉N子內(nèi)各種促進(jìn)種胚成熟物質(zhì)的積累對(duì)種胚的生長(zhǎng)產(chǎn)生有利的影響[5]。
種子打破休眠進(jìn)而萌發(fā)是一個(gè)復(fù)雜的生理過(guò)程,可以通過(guò)蛋白質(zhì)組學(xué)的研究來(lái)洞悉其分子機(jī)理[6]。木本植物在發(fā)芽期間的蛋白組變化的研究已有報(bào)道,包括山楂[6]、山毛櫸[7]、槭樹(shù)[8]、麻風(fēng)樹(shù)[9]、鳳仙花[10]和南洋杉[10]等。本課題組在前期的研究中,對(duì)天女木蘭種子進(jìn)行變溫層積處理,分別比較了種子在層積0、6、110 和150 d 的個(gè)體發(fā)育變化和蛋白組差異變化,以期確定與種子萌發(fā)相關(guān)的蛋白質(zhì),從而進(jìn)一步了解種子萌發(fā)的分子機(jī)理[11]。
天女木蘭層積催芽的種子在休眠解除過(guò)程中,差異表達(dá)蛋白天冬氨酸蛋白酶在層積過(guò)程中隨種胚的伸長(zhǎng)生長(zhǎng)呈波動(dòng)變化[12],表明天冬氨酸蛋白酶在種子萌發(fā)過(guò)程中發(fā)揮著重要作用。天冬氨酸蛋白酶是重要的蛋白水解酶,參與機(jī)體的新陳代謝及生物調(diào)控作用,廣泛存在于植物種子、花及葉片等組織中。有研究表明,天冬氨酸蛋白酶在種子休眠解除過(guò)程中起主導(dǎo)作用,參與了種子萌發(fā)期間儲(chǔ)藏蛋白的水解[12]。擬南芥PCS1基因編碼的天冬氨酸蛋白酶參與調(diào)控胚胎發(fā)育,而PCS1突變體缺失該功能,導(dǎo)致發(fā)育胚細(xì)胞死亡和雌雄配子體退化[13]。
眾多研究表明,天冬氨酸蛋白酶在種子休眠解除過(guò)程中起主導(dǎo)作用。本課題組在天女木蘭種子休眠解除過(guò)程中種胚發(fā)育和相關(guān)蛋白的研究中指出,天冬氨酸蛋白酶在層積過(guò)程呈波動(dòng)變化,在110 d 時(shí)達(dá)到高峰,說(shuō)明該蛋白參與種子萌發(fā)期間儲(chǔ)存蛋白的水解,在種子成熟胚的發(fā)育過(guò)程中發(fā)揮重要作用[11]。本研究以天女木蘭種子為試驗(yàn)材料,在建立天女木蘭總RNA 提取體系的基礎(chǔ)上,利用同源克隆法RACE 技術(shù)從天女木蘭種子中克隆得到天冬氨酸蛋白酶基因全長(zhǎng),采用生物信息學(xué)的方法進(jìn)行分析,利用分子生物學(xué)技術(shù)對(duì)天女木蘭種子休眠及其萌發(fā)機(jī)理進(jìn)行深入研究,這對(duì)于天女木蘭這一“活化石”樹(shù)種的保護(hù)和開(kāi)發(fā)利用具有非常重要的意義。
試驗(yàn)用到的天女木蘭種子采于沈陽(yáng)農(nóng)業(yè)大學(xué)植物園(40°49′N,123°34′E)內(nèi)8年生的健康植株,于9月末采集種子等材料并迅速冷凍于液氮中,或者冷藏于-80℃的超低溫冰箱中,直到RNA 提取。
參照北京天根生化科技有限公司RNA 提取試劑盒(DP419)說(shuō)明書進(jìn)行RNA 的提取,按照PrimeScriptRT(TaKaRa,Japan)試劑盒說(shuō)明書反轉(zhuǎn)錄合成cDNA。
1.3.1 基因中間片段的獲得
1.3.1.1 設(shè)計(jì)天冬氨酸蛋白酶的簡(jiǎn)并引物
根據(jù)已公布的麻瘋樹(shù)、梅花、油棕、綠豆等天冬氨酸蛋白酶的基因序列,利用Primer5.0 設(shè)計(jì)簡(jiǎn)并引物(表1),交由沈陽(yáng)匯佰生物科技有限公司合成。
表1 簡(jiǎn)并引物Table1 Degenerate primers
1.3.1.2 PCR 擴(kuò)增目的片段
PCR 用的是promega 的Go Taq DNA 聚合酶,反應(yīng)體系是20 μL 體系,溫度梯度從48 ℃到65 ℃,擴(kuò)增體系嚴(yán)格按照試劑說(shuō)明書進(jìn)行。
1.3.1.3 目的片段的回收
為了進(jìn)一步純化目的片段cDNA,使用全式金的EasyPure? Quick Gel Extractiom Kit 膠回收試劑盒進(jìn)行目的片段的回收。
1.3.1.4 目的基因與pGEM?-TEasy 載體連接及轉(zhuǎn)化
目的基因與pGEM?-TEasy 載體連接轉(zhuǎn)化反應(yīng)步驟參照pGEM?-TEasy 載體說(shuō)明書。
1.3.1.5 陽(yáng)性克隆載體的鑒定
篩選出只有白色菌落的部位,取出一部分稀釋到10 μL ddH2O 中,取2 μL 菌液作為PCR 模板,進(jìn)行陽(yáng)性克隆載體的鑒定。
1.3.1.6 測(cè)序及序列分析將符合要求的菌液送至沈陽(yáng)佰創(chuàng)生物技術(shù)有限公司進(jìn)行測(cè)序。測(cè)完序后用BLAST 軟件進(jìn)行序列比對(duì)分析。
1.3.2 天冬氨酸蛋白酶基因的3′ RACE 擴(kuò)增
根據(jù)已得到的天冬氨酸蛋白酶基因中間保守序列設(shè)計(jì)3′RACE特異性引物RC226-F1、RC226-F2,反轉(zhuǎn)錄引物、接頭引物及特異性引物序列如表2所示。
以3′ RACE Adaptor 為反轉(zhuǎn)引物的cDNA 為模板進(jìn)行3′ RACE 巢式PCR 擴(kuò)增(參照invitrogen 3′ race system manua 說(shuō)明書進(jìn)行),直到獲得3′目的片段。將巢式PCR 產(chǎn)物回收純化、連接載體、轉(zhuǎn)化測(cè)序。
1.3.3 天冬氨酸蛋白酶基因的5′ RACE 擴(kuò)增
5′ RACE 特異性引物、反轉(zhuǎn)錄引物、接頭引物及特異性引物序列如表3所示。
以特異性引物RC226-RT1 為反轉(zhuǎn)錄引物,得到cDNA,經(jīng)RNase H 和TdT 處理后,進(jìn)行巢氏PCR(操作步驟見(jiàn)invitrogen 5′ race system manual),直到獲得5′目的片段,然后將巢式PCR 產(chǎn)物回收純化、連接載體、轉(zhuǎn)化測(cè)序。
表2 3′RACE引物Table2 3′ RACE adaptor
表3 5′RACE引物Table3 5′ RACE adaptor
1.3.4 DNAMAN 拼接全長(zhǎng)序列
將得到的天冬氨酸蛋白酶基因的保守序列、5′RACE序列及3′RACE序列通過(guò)DNAMAN軟件進(jìn)行拼接,進(jìn)一步剪切掉重疊序列就可以得到天冬氨酸蛋白酶基因的全長(zhǎng)cDNA 序列。
將得到的全長(zhǎng)序列通過(guò)BLAST 中的nucleotide blast 進(jìn)行基因的同源性分析,將全長(zhǎng)cDNA 通過(guò)DNAMAN 軟件轉(zhuǎn)化為氨基酸序列后,輸入Blastp軟件進(jìn)一步進(jìn)行氨基酸的同源性分析,Clustalx 1.83 和MEGA 4.1 結(jié)合構(gòu)建系統(tǒng)進(jìn)化樹(shù)進(jìn)行親緣性分析。目的基因翻譯成蛋白后預(yù)測(cè)分析其理化性質(zhì),如相對(duì)分子量與等電點(diǎn)可以通過(guò)ProtParam(http://www.expasy.org/tools/protparam.html)進(jìn)行分析預(yù)測(cè);親水性與疏水性可以用ProtScale 軟件分析;蛋白的結(jié)構(gòu)域、二級(jí)結(jié)構(gòu)與三維結(jié)構(gòu)可以通過(guò)軟件Phyre2 預(yù)測(cè)分析;天冬氨酸蛋白酶基因的跨膜結(jié)構(gòu)是否存在可以通過(guò)在線分析軟件TMHMM Server-2.0 預(yù)測(cè);利用Plant-mPLoc 軟件對(duì)天女木蘭天冬氨酸蛋白酶基因編碼的蛋白進(jìn)行亞細(xì)胞定位預(yù)測(cè)分析。
所得到的RNA 十分完整,28 S RNA 的亮度是18 S RNA 的2 倍,完全滿足后續(xù)的分子試驗(yàn)要求(圖1,表4)。
3.2.1 天冬氨酸蛋白酶基因中間序列的克隆
由簡(jiǎn)并引物克隆得到的序列回收純化、連接載體后轉(zhuǎn)入感受態(tài)細(xì)胞中,選取陽(yáng)性克隆載體,從電泳檢測(cè)結(jié)果(圖2)可以看出1 和2 目的片段連接到載體上,可以進(jìn)行測(cè)序分析。
圖1 天女木蘭種子總RNA 電泳檢測(cè) Fig.1 Electrophoresis detection of total RNA of M.sieboldii seeds
表4 天女木蘭總RNA質(zhì)量濃度和產(chǎn)率的檢測(cè)Table4 Detection of concentrations and productivities of M.sieboldii total RNA
圖2 陽(yáng)性克隆載體的鑒定Fig.2 Identification of positive cloning vector
3.2.2 天冬氨酸蛋白酶基因的3′ RACE 擴(kuò)增
將3′ RACE 的PCR 產(chǎn)物回收純化后測(cè)序得到了224 bp 的堿基序列(圖3),該序列具有天然的poly(A)尾巴,且與已獲得的中間序列可以通過(guò)DNAMAN 軟件準(zhǔn)確拼接,BLAST 后發(fā)現(xiàn)與其他植物中的天冬氨酸蛋白酶基因同源性較高,可以確定克隆到的該序列為天女木蘭天冬氨酸蛋白酶基因的3′端。
3.2.3 天冬氨酸蛋白酶基因的5′ RACE 擴(kuò)增
圖3 3′ RACE 結(jié)果Fig.3 Results of 3′ RACE
將5′ RACE 的PCR 產(chǎn)物回收純化后測(cè)序得到了265 bp 的堿基序列(圖4),該序列與已獲得的中間序列可以通過(guò)DNAMAN 軟件準(zhǔn)確拼接,BLAST 后發(fā)現(xiàn)其與其他植物中的天冬氨酸蛋白酶基因同源性較高,可以確定克隆到的該序列為天女木蘭天冬氨酸蛋白酶基因的5′端。
圖4 5′ RACE 結(jié)果Fig.4 Results of 5′ RACE
3.2.4 天冬氨酸蛋白酶基因ORF 的獲得
將天冬氨酸蛋白酶基因的中間、3′端和5′端3 個(gè)片段經(jīng)過(guò)DNAMAN 軟件拼接后得到了1 798 bp 的堿基序列,全長(zhǎng)序列與已知的天冬氨酸蛋白酶基因的同源性較高,進(jìn)一步驗(yàn)證了該序列為天女木蘭天冬氨酸蛋白酶基因(圖5、圖6)。
圖5 全長(zhǎng)cDNA 示意圖Fig.5 Schematic diagram of the full length cDNA
圖6 天冬氨酸蛋白酶的核苷酸序列及氨基酸序列Fig.6 Nucleotide sequences and amino acid residues sequences of aspartic acidase
3.3.1 天冬氨酸蛋白酶基因的相似性分析
通過(guò)NCBI 中的Blastx 數(shù)據(jù)庫(kù)對(duì)獲得的天女木蘭天冬氨酸蛋白酶基因全長(zhǎng)進(jìn)行氨基酸同源性分析,比對(duì)結(jié)果顯示目的序列推導(dǎo)的氨基酸序列與其它植物中的已知的天冬氨酸蛋白酶基因的氨基酸序列的同源性都在85%以上,其中與蓮科的蓮花Nelumbo nucifera(XP 010252464.1)以及大戟科的蓖麻Ricinus communis,(XP 002529926.1)等的相似性最高,達(dá)到了87%;與其他植物的同源性都在84%~87%之間,同源性非常高,進(jìn)一步驗(yàn)證了所獲得的全長(zhǎng)序列是天女木蘭的天冬氨酸蛋白酶基因全長(zhǎng),比對(duì)結(jié)果見(jiàn)表5。
通過(guò)MEGA 5.1 軟件中Neighbouring-Joining聚類法對(duì)天女木蘭的天冬氨酸蛋白酶的氨基酸序列與其它植物的天冬氨酸蛋白酶氨基酸序列構(gòu)建進(jìn)化樹(shù)(圖7)。從圖7中可以看出,26 種植物的天冬氨酸蛋白合成酶基因由于親緣關(guān)系被分成三大類,就聚類分析來(lái)看,與睡蓮科的蓮花首先聚為一類,這與BLAST 同源性分析結(jié)果一致,可能是因?yàn)槎呔鶠殚_(kāi)花類的觀賞植物,屬于直系同源蛋白,與豆科的蕓豆與豇豆親緣關(guān)系較遠(yuǎn)。本研究在木蘭科及其親緣關(guān)系較近的其他植物的分子水平研究方面奠定了一定的基礎(chǔ)。
3.3.2 Ms Aspartic proteinase 基因編碼的蛋白結(jié)構(gòu)的分析
3.3.2.1 基本理化性質(zhì)的分析
將Ms Aspartic proteinase 編碼的氨基酸序列輸入在線軟件ProtParam,分析預(yù)測(cè)其基本的理化性質(zhì),通過(guò)軟件分析可知,Ms Aspartic proteinase 編碼的蛋白質(zhì)的分子量為55.176 KDa,理論等電點(diǎn)為5.25,推斷為含有酸性的蛋白;帶有49 個(gè)負(fù)電荷殘基(Asp+Glu),40 個(gè)正電荷殘基(Arg+Lys);共含有7 714 個(gè)原子,其中C、H、N、O、S 的原子含量分別為2 452、3 839、651、748、24;不穩(wěn)定系數(shù)計(jì)算后為37.31,歸于穩(wěn)定蛋白一類。
目的基因的親水性與疏水性可以通過(guò)在線分析軟件ProtScale 進(jìn)行預(yù)測(cè)分析(圖8),該蛋白的總平均親水性數(shù)值為0.015,因此判定天女木蘭天冬氨酸蛋白酶屬于疏水性蛋白。
表5 天冬氨酸蛋白酶基因和其它25種植物天冬氨酸蛋白酶基因推導(dǎo)的氨基酸序列相似性比對(duì)Table5 Similarity comparison of aspartic proteinase and other 25 plants aspartic proteinase synthase andamino acid in GenBank
圖7 26 種植物Aspartic proteinase 合成酶基因氨基酸序列構(gòu)建的N-J 樹(shù)Fig.7 Constructed N-J tree of amino acid sequences of aspartic proteinase from 26 plants
3.3.2.2 跨膜結(jié)構(gòu)的預(yù)測(cè)
Ms Aspartic proteinase 編碼的蛋白質(zhì)跨膜結(jié)構(gòu)可以通過(guò)在線分析軟件TMHMM 2.0 進(jìn)行分析預(yù)測(cè),結(jié)果見(jiàn)圖9。
結(jié)果顯示,天女木蘭的天冬氨酸蛋白屬于跨膜蛋白。
圖8 疏水性的預(yù)測(cè)分析Fig.8 Prediction analysis of hydrophobicity
圖9 跨膜結(jié)構(gòu)域的預(yù)測(cè)Fig.9 Prediction of transmembrane domain
3.3.2.3 信號(hào)肽位點(diǎn)的預(yù)測(cè)分析
在線分析軟件SignalIP 4.0 可以預(yù)測(cè)分析天女木蘭天冬氨酸蛋白的信號(hào)肽,結(jié)果如圖10 所示。
由圖10 可知,天女木蘭天冬氨酸蛋白酶基因編碼的蛋白在氨基酸的第26 位C 值最大,S 值陡峭,Y 值最高峰,為信號(hào)肽剪切位點(diǎn),屬于分泌蛋白。
3.3.2.4 三維結(jié)構(gòu)的構(gòu)建與分析
將天女木蘭的天冬氨酸蛋白酶同Phyre2 中其他同源的天冬氨酸蛋白酶已知的蛋白結(jié)構(gòu)作對(duì)比后創(chuàng)建模型(圖11),該蛋白由二級(jí)結(jié)構(gòu)和三維結(jié)構(gòu)覆蓋,覆蓋率高達(dá)84%,可信度為100%,再一次證明了所克隆得到的基因是天女木蘭天冬氨酸蛋白酶基因。
圖10 信號(hào)肽的預(yù)測(cè)Fig.10 Prediction of signal peptide
圖11 蛋白質(zhì)三維結(jié)構(gòu)建模Fig.11 Modeling of three-dimensional protein structure
RACE 技術(shù)在獲取各物種基因的全長(zhǎng)方面得到了廣泛的應(yīng)用。本研究以RACE 技術(shù)為核心技術(shù)獲取天女木蘭天冬氨酸蛋白酶基因,在獲取中間片段的基礎(chǔ)上,通過(guò)設(shè)計(jì)特異性引物和RACE需要的5′ 與3′ 端接頭引物,在優(yōu)化的PCR 擴(kuò)增條件以及為防止其他雜帶的產(chǎn)生而采取的巢式擴(kuò)增技術(shù)下,成功獲得了天女木蘭種子天冬氨酸蛋白酶基因的5′ 與3′ 端,具有5′ 與3′ 端應(yīng)有的特征外,同時(shí)通過(guò)DNAMAN 軟件可以正確的拼接,得到的全長(zhǎng)序列與其他已公布的天冬氨酸蛋白酶基因具有非常高的同源性,證實(shí)了克隆的正確性與完整性。
雖然RACE 技術(shù)在植物全長(zhǎng)cDNA 的克隆上取得了很大的進(jìn)展,但是科研人員在實(shí)際的實(shí)驗(yàn)操作上依然存在著大量的問(wèn)題與技術(shù)難題,如RACE 實(shí)驗(yàn)的基礎(chǔ)是一段已知的基因片段才能夠向兩端延伸,而中間片段的獲得也需要科研工作者大量的研究實(shí)驗(yàn),具有一定的難度;RACE 對(duì)于RNA、cDNA、引物、擴(kuò)增條件都具有相當(dāng)高的要求,在實(shí)驗(yàn)的過(guò)程中每一步都需要注意操作的精細(xì)度以獲得高質(zhì)量的實(shí)驗(yàn)材料以及實(shí)驗(yàn)環(huán)境;RACE 的3′ 端擴(kuò)增相對(duì)簡(jiǎn)單,而5′ 端擴(kuò)增難度較大,需要的技術(shù)較為復(fù)雜,即使各部分酶反應(yīng)順利,也有可能會(huì)產(chǎn)生大量的非特異性條帶。因此,需要針對(duì)不同的物種、不同的基因加以摸索研究,不斷優(yōu)化反應(yīng)條件,才能成功地利用RACE 技術(shù)獲取目的基因的全長(zhǎng)cDNA。
天冬氨酸蛋白酶基因總長(zhǎng)1 798 bp,序列中包含一段從109 bp ATG 起始到1 653 bpTAA 終止的完整的ORF 區(qū)域,總長(zhǎng)1 545 bp,可以編碼514個(gè)氨基酸殘基。天女木蘭天冬氨酸蛋白酶基因是否存在基因家族并不明確,該基因在天女木蘭的時(shí)空表達(dá)模式在本研究中沒(méi)有體現(xiàn),下一步還需要進(jìn)行深入的研究。
利用分子生物學(xué)技術(shù)對(duì)天女木蘭種子休眠及其解除機(jī)理深入研究,利用同源克隆法RACE 技術(shù)克隆得到天冬氨酸蛋白酶基因全長(zhǎng),結(jié)合生物分析技術(shù)來(lái)對(duì)天冬氨酸蛋白酶的結(jié)構(gòu)與功能以及亞細(xì)胞定位,有利于后續(xù)遺傳轉(zhuǎn)化中掌握天冬氨酸蛋白酶基因在天女木蘭植物體中的作用,有助于全面地研究天女木蘭種子休眠解除機(jī)理,為系統(tǒng)地探索天女木蘭種子休眠機(jī)制提供了理論基礎(chǔ),找到了新的窗口與靶點(diǎn)。