朱 斌,王曉雙,羅 茜,胡 鑫
(1.貴州師范大學生命科學學院,貴陽 550025;2.浙江農(nóng)林大學,杭州 311300)
CRM(Chloroplast RNA splicing and ribosome maturation)結(jié)構(gòu)域蛋白家族首先在古細菌和細菌中被鑒定[1],被認為參與葉綠體和線粒體基因的內(nèi)含子剪接,對于植物生長發(fā)育起著重要作用[2-5]。CRM結(jié)構(gòu)域蛋白主要葉綠體及線粒體基因參與I 類及II類內(nèi)含子的剪接,并影響葉綠體中 rRNA 的加工[2,6];CRM 結(jié)構(gòu)域蛋白還通過轉(zhuǎn)錄后調(diào)控來調(diào)節(jié)葉綠體或線粒體相關(guān)基因的表達[3];此外,基于擬南芥CRM家族基因的突變體研究表明,部分CRM基因在逆境條件下參與了幼苗的生長,證實CRM基因可響應逆境脅迫[4]?;谄浠蚪Y(jié)構(gòu)及所包含的結(jié)構(gòu)域,可將 CRM 家族結(jié)構(gòu)域蛋白分為 4 類:CRS1 亞族、CAF亞族、3 亞族及 4 亞族[1,3]。其中 CRS1 亞族、CAF 亞族及3 亞族基因參與I 類及II 類內(nèi)含子的剪切,4 亞族基因與核糖體亞基組裝相關(guān)[3]。
白菜(Brassica rapa)為十字花科(Cruciferae)蕓薹屬(Brassica)植物,是人類生活極為重要的蔬菜,其富含蛋白質(zhì)、糖類、多種維生素以及鈣、鐵等礦物質(zhì)。白菜存在眾多的變種,多在秋冬季種植,對低溫有較強的抵抗能力,目前是中國各地乃至東南亞地區(qū)重要的、種植面積最大的蔬菜作物。目前對于白菜的研究非常廣泛,主要集中在新品種研制、種質(zhì)資源提升、基因組測序以及分子輔助育種等方面[7,8]。白菜全基因組測序的完成為發(fā)掘白菜基因家族的研究提供了極大的可能性。近年來,對于白菜基因家族的研究課題不斷增加,如對白菜PLD、SAUR、ENT等基因家族進行鑒定和生物信息學的分析[9-11]。CRM基因家族在綠色植物葉綠體生長發(fā)育中起著不可或缺的作用,雖然在水稻[5]、擬南芥(Arabidopsis thaliana)[4]中被系統(tǒng)報道,但目前還未見對白菜CRM基因家族的研究。本研究對白菜CRM基因家族進行生物信息學分析,鑒定相應的CRM基因,旨在為今后研究白菜CRM基因家族的功能提供一定的理論基礎(chǔ)。
首先通過PFAM(http://pfam.xfam.org/)獲得CRM基因家族(Pfam:PF01985)的HMM文件,隨后以HMMER 3.1 軟件(HMMER3.1;http://plants.ensembl.org/index.html)的 Hmmsearch 工具在白菜數(shù)據(jù)庫(http://bras?sicadb.org/brad/)蛋白序列中進行全基因組篩選,獲得候選CRM基因,然后利用Pfam 網(wǎng)站的Sequence search 功能和 SMART 網(wǎng)站的 Normal mode 對獲得的白菜候選CRM基因進行蛋白序列結(jié)構(gòu)域預測,剔除不具有完整結(jié)構(gòu)域的候選基因,最終確定白菜CRM基因家族成員的序列。以蛋白質(zhì)分析軟件Expasy(http://web.expasy.org/protparam/)分析白菜 CRM 蛋白成員的分子量、等電點、氨基酸數(shù)量。
利用Clustal X 對擬南芥和白菜CRM基因的氨基酸序列進行比對[12],參數(shù)設置為默認值,隨后利用 MEGA 7.0[13]軟件中的鄰接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)進化樹,Bootstrap 校驗值設置為1 000,其余參數(shù)設置為默認值。
從 Ensembl(http://plants. ensembl. org/Triticum_aestivum/Info/Index)白菜基因組數(shù)據(jù)庫中確定CRM基因的初始染色體位置和染色體長度,同時下載白菜基因組的注釋文件。利用Tbtools[14]軟件對白菜CRM基因在染色體上的分布進行可視化,作圖。
從 Ensembl(http://plants. ensembl. org/Triticum_aestivum/Info/Index)白菜基因組數(shù)據(jù)庫獲得白菜CRM基因的CDS和基因組序列以及注釋文件。利用SMART domain search database(http://smart.embl.de/smart/batch.pl)對CRM基因結(jié)構(gòu)進行了鑒定,利用在線程序 MEME(http://meme-suite.org/tools/meme)分析CRM基因家族蛋白序列的保守基序,預測基序數(shù)量為10個,其他參數(shù)設置為默認值。利用TBtools軟件對CRM基因的基因結(jié)構(gòu)、蛋白結(jié)構(gòu)域和基序進行可視化。
從 GEO 數(shù)據(jù)(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi)中下載了 GSE43245 和 GSE69785[15]的轉(zhuǎn)錄組數(shù)據(jù),分析白菜CRM基因在愈傷組織(callus)、花器官(flower)、葉片(leaf)、根(root)、角果(silique)和莖(stem)中的組織特異表達,同時對Flg22 與Ps脅迫下的差異表達進行了分析,并用R 語言中的pheatmap 軟件包繪制了基因表達熱圖。
通過生物信息手段在白菜基因組中共預測到22 個CRM基因(表 1)。為進一步研究白菜CRM基因家族的系統(tǒng)發(fā)育關(guān)系,使用MEGA7.0 構(gòu)建白菜與擬南芥(Arabidopsis thaliana)的CRM基因家族系統(tǒng)進化樹(圖1)。系統(tǒng)進化樹包含了38 個CRM基因,其中16 個基因來自于擬南芥(Arabidopsis thaliana),22 個基因來自于白菜。根據(jù)進化樹結(jié)果,38 個CRM基因可分為3 個類群,類群Ⅰ包含15 個CRM基因,其中6 個擬南芥基因及9 個白菜基因;類群Ⅱ包含10 個CRM基因,其中 4 個基因來自擬南芥,6 個基因來自白菜;類群Ⅲ包含13 個CRM基因,其中6 個基因來自擬南芥,7 個基因來自白菜。
為了探究CRM基因在白菜基因組中的分布,分析了白菜基因組注釋信息,并通過Tbtools 軟件將其可視化(圖2)。結(jié)果表明,22 個白菜的CRM基因分布于除A10 外的9 條染色體上(1~4 個基因),且這些CRM基因并未成簇分布。其中A03 染色體上分布4個CRM基因;A02、A04、A05 染色體上分別有 3 個CRM基因;A01、A06、A07 和 A09 染色體上分別有 2個CRM基因;A08 染色體上僅有 1 個CRM基因。
不同CRM基因的蛋白編碼序列存在較大差異(表1),22 條CRM基 因編碼 長度范 圍為 657(Bra011945.1)~5 909 bp(Bra023555.1),平均長度為2 848 bp;蛋白長度為152(Bra022317.1)~1 917 aa(Bra023555.1),平均長度為580 aa;蛋白質(zhì)分子質(zhì)量為 17.24 k(Bra022317.1)~126.99 kDa(Bra023555.1),其等電點范圍為4.42(Bra033596.1)~9.89(Bra022317.1),有13 個蛋白等電點大于7,偏堿性,其余9 個蛋白等電點小于7,偏酸性,說明大部分CRM基因家族編碼
的蛋白質(zhì)富含堿性氨基酸。
表1 白菜CRM 基因分布及位置信息
如圖3 所示,白菜CRM家族所有基因都有內(nèi)含子,且數(shù)量差異明顯。其外顯子的數(shù)目從2 個(Bra022317.1、Bra036994.1、Bra011945.1)到 13 個(Bra039123.1)不等,其中第Ⅰ類群含有的外顯子數(shù)目最多,第Ⅱ類群的外顯子數(shù)量最少,不同成員之間基因長度差距較大。但總體上,含有相同外顯子數(shù)量的成員,其外顯子長度和分布差異較小,系統(tǒng)發(fā)育樹顯示親緣關(guān)系越近的基因,其基因結(jié)構(gòu)和長度越相似。
為進一步分析白菜CRM基因家族蛋白序列的差異,利用MEME 在線軟件對白菜CRM基因家族的保守基序進行分析,共獲得10 個保守基序,分別命名為Motif 1~ Motif 10。保守基序分析結(jié)果表明,不同的CRM 蛋白具有不同類型和數(shù)目的Motif,CRM基因家族的保守基序存在較大差異,第Ⅰ類群Motif的數(shù)量和種類最多,除了Bra022317.1基因具有2種、Bra036994.1基因具有 4 種類型的 Motif 外,其余CRM基因都具有所有類型的Motif類型;第Ⅱ類群的Motif類型和數(shù)目都非常保守,所有的CRM基因都僅含有 Motif 4、Motif 1、Motif 9、Motif 3、Motif 6 這 5 種類型,且Bra025285.1和Bra033017.1含有 2 個 Motif 4 結(jié)構(gòu)域;第Ⅲ類群中保守基序類型和數(shù)量都較少,且差異較大,在Bra014565.1基因中沒有檢測到Mo?tif 基序的存在??傮w上,系統(tǒng)進化樹同一分支上的基因家族成員所含基序種類、數(shù)量和位置差異較小,不同分支成員之間所含基序種類、數(shù)量和位置差異較大,可能不同的CRM 蛋白在生物體內(nèi)發(fā)揮的功能也有所不同。
利用轉(zhuǎn)錄組數(shù)據(jù),對白菜中葉、莖、花、角果、根以及愈傷組織中的CRM基因表達量進行分析(圖4A),結(jié)果表明,不同組織中各基因的表達量高低不同,除Bra022317.1、Bra036994.1和Bra011945.1幾乎不在任何組織和器官中表達外,其余的CRM基因至少在一個組織中表達,其中Bra034894.1及Bra033596.1在所有組織中均有較高水平的表達,且大多數(shù)基因在葉和莖中呈現(xiàn)出更加顯著上調(diào)的表達量(t-test,P<0.05)。通過對這些基因的表達量進行分析發(fā)現(xiàn),不同CRM家族基因在不同組織中的表達存在較大差異。
Flg22 是人工合成的細菌鞭毛蛋白中一段N 端由22 個氨基酸組成的多肽,它具有比鞭毛素更強的活性,能誘導多種防御基因的表達,從而激發(fā)植物的防御性反應[16,17]。研究表明,在病原菌侵染植物的過程中,會向植物分泌大量的效應因子到植物細胞的不同部位來破壞或延緩植物的防衛(wèi)反應,Ps 是大豆疫霉菌(Phytophthora sojae)侵染植物過程中分泌的一類效應因子,能抑制內(nèi)源轉(zhuǎn)錄因子的結(jié)合,從而抑制植物的免疫表達。本研究利用Flg22 及Ps 對白菜進行脅迫,結(jié)果表明,F(xiàn)lg22 脅迫下,與對照組相比,白菜CRM基因家族中10 個基因的表達量顯著下調(diào)表達(P<0.05),8 個基因表達量在脅迫前后無顯著差異(P>0.05),僅有4 個基因的表達量表現(xiàn)出輕微的上調(diào)趨勢,但差異不顯著;而在Ps 脅迫下,14 個基因的表達量顯著下調(diào),其余8 個基因的表達量無顯著變化,說明白菜的CRM基因家族可能廣泛響應生物脅迫(圖4B)。
CRM 蛋白來源于原核生物的核糖體前體結(jié)合蛋白,主要參與線粒體和葉綠體內(nèi)包含Ⅱ型內(nèi)含子基因的剪接,而在真核生物中,CRM 結(jié)構(gòu)域僅在植物細胞中被發(fā)現(xiàn),且CRM 結(jié)構(gòu)域在古生物和細菌中是以獨立蛋白的形式存在,在植物個體中則是以單個或多個結(jié)構(gòu)域的蛋白形式存在[1]。本研究利用生物信息學的方法對白菜CRM基因進行鑒定,共獲得白菜 22 個CRM基因,擬南芥 16 個CRM基因。研究表明,水稻基因組包含 14 個CRM基因[18],同水稻基因組相比,蕓薹屬CRM基因出現(xiàn)了擴增現(xiàn)象。相較于擬南芥基因組,白菜基因組在進化過程中經(jīng)歷過一個三倍化過程以及隨后的二倍化階段[19],因此白菜又稱為中間多倍體(Mesopolyploid)。理論上白菜中CRM基因的數(shù)目應當為擬南芥中的3 倍,本研究在擬南芥基因組中鑒定到16 個CRM基因,而白菜基因組中鑒定到22 個CRM基因,遠低于理論數(shù)目,說明白菜中部分CRM基因在二倍化過程中可能發(fā)生了基因丟失、新功能化或變異,此外,白菜CRM基因的保守基序存在較大差異,而水稻CRM基因的基序高度保守[5],這可能由白菜基因組二倍化導致,基因組測序也證實了白菜基因組存在廣泛的基因丟失及新功能化事件[19]。
通過對白菜不同組織中CRM基因家族的表達量進行分析發(fā)現(xiàn),不同基因在不同組織中的表達量存在差異,大多數(shù)CRM基因家族的基因在葉和莖中的表達量較大,在這些器官中具有較強的轉(zhuǎn)錄活性,有關(guān)水稻CRM基因家族的研究也證實CRM基因在幼嫩及新出葉片中表達量升高[5],表明CRM基因表達量的差異可能與光合作用之間存在較大聯(lián)系或者參與葉片的發(fā)育過程,研究證實水稻中OsCAF1[20]和OsCRS2[21]參與水稻葉綠體的形成。研究表明擬南芥AtCFM4(屬于4 亞族)對鹽和冷脅迫比較敏感[22],水稻CRM基因的表達水平在非生物脅迫下也出現(xiàn)顯著的變化,特別是在鹽脅迫下,所有的CRM基因顯著下調(diào)表達[5]。本研究以 Flg22 及 Ps 模擬生物脅迫,對不同脅迫下CRM基因的表達量進行分析,發(fā)現(xiàn)白菜中CMR基因呈現(xiàn)明顯的下調(diào)表達趨勢,說明白菜的CRM基因家族可能廣泛響應生物脅迫。本研究首次闡述了CRM基因家族在白菜基因組中的數(shù)目、分布、進化特征,并揭示這些基因可能響應生物脅迫,為白菜應對生物脅迫研究提供一定的理論基礎(chǔ)。