李坤杰,譚杉杉,孫 勃,饒 丹,何 琦,閔愛玲,李夢瑤
(四川農(nóng)業(yè)大學(xué)園藝學(xué)院,成都 611130)
轉(zhuǎn)錄因子(transcription factor),是一類能夠識別并結(jié)合特定序列DNA 結(jié)合域的啟動子區(qū)域、并以此調(diào)節(jié)新陳代謝或發(fā)育過程的蛋白質(zhì)[1]。TCP 是植物特有的轉(zhuǎn)錄因子家族之一,其基因的命名來自3 個不同物種的4 個基因的首字母縮寫,分別是玉米 TB1、金魚草 CYC、水稻 PCF1 和 PCF2[2-4]。這 4 個基因所編碼的蛋白質(zhì)共同點是在其N 末端都含有一段高度保守的60 個左右的氨基酸殘基,又名TCP結(jié)構(gòu)域,能夠形成一個非典型的堿性-螺旋-環(huán)-螺旋的結(jié)構(gòu)[5-6]。根據(jù)TCP 結(jié)構(gòu)域的氨基酸序列差異,該家族可分為兩個亞組:ClassⅠ和ClassⅡ,ClassⅠ又名PCF,ClassⅡ還可繼續(xù)分為兩個小組,分別為CIN 和 CYC/TB1[7]。
自1999年來,TCP 家族作為新的轉(zhuǎn)錄因子家族出現(xiàn),對其功能的探索在不斷加深。在TCP 命名的4個基因中,對基因的功能研究均顯示它們參與了植物的生長發(fā)育。玉米TB1 抑制了側(cè)生分生組織和雄花原基發(fā)育[2];金魚草Cyc 基因調(diào)控花的對稱發(fā)育[3];水稻PCFI 和PCF2 基因促進了分生組織中PCAN基因啟動子的特異性表達[4]。最近研究表明,TCP 轉(zhuǎn)錄因子除了參與植物的生長發(fā)育,還與植物的免疫調(diào)控及響應(yīng)逆境脅迫息息相關(guān):CIN-like TCP 與植物抵御病原菌入侵的免疫反應(yīng)有關(guān)[8];木薯MeTCP4基因在干旱及低溫脅迫下表達受到抑制[9];水曲柳TCP4 響應(yīng)寒冷、鹽、干旱等非生物脅迫以及激素信號,說明其參與了植物逆境脅迫的調(diào)控[10]。
芥菜(Brassica juncea)是十字花科蕓薹屬重要的園藝作物。莖瘤芥是芥菜的一個莖用變種,其瘤莖在生長發(fā)育過程中,葉柄基部發(fā)生變態(tài),形成1~5 個瘤狀凸起,并隨莖膨大而橫向膨大[11]。莖瘤芥的瘤莖生長發(fā)育過程非常復(fù)雜,涉及到形態(tài)、生理、生化和遺傳等多方面的變化。目前,對莖瘤芥的瘤莖膨大的機理研究尚不深入,尤其與莖膨大相關(guān)的功能基因的研究報道較少。TCP 家族基因廣泛參與了植株的生長發(fā)育,目前的研究主要集中于擬南芥、水稻、玉米等植物中,對芥菜TCP 家族研究尚未見報道。
本研究,通過生物信息學(xué)方法,對芥菜基因組數(shù)據(jù)庫進行檢索,篩選并鑒定芥菜所有的TCP基因,并對這些基因的理化性質(zhì)、結(jié)構(gòu)特征以及基因表達等進行分析,以期為今后進一步研究芥菜TCP 基因的功能及參與莖膨大的調(diào)控機制提供理論基礎(chǔ)。
從 Pfam 數(shù)據(jù)庫(http://pfam.xfam.org/)下載 TCP家族模塊序列(PF03634),從芥菜基因組數(shù)據(jù)庫(http://brassicadb.org/)下載芥菜蛋白序列,利用HMMER 軟件從芥菜基因組序列中檢索TCP 蛋白序列[12]。將候選蛋白進一步提交至NCBI-CDD 和Pfam(http://pfam.xfam.org/)進行 TCP 結(jié)構(gòu)域的確認。利用 ExPASy 網(wǎng)站(http://web.expasy.org/protparam/)對確認的TCP 蛋白序列進行蛋白質(zhì)分子量、等電點和氨基酸大小預(yù)測,利用WOLF PSORT(http://www.genscript.com/wolf-psort.html)和 TargetP(http://www.cbs.dtu.dk/services/TargetP/)進行亞細胞定位分析。擬南芥和水稻的TCP 基因序列分別下載自TAIR(https://www.arabidopsis.org/)和 PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)網(wǎng)站。
使用Clustal X 2.1 軟件對芥菜、擬南芥和水稻的所有TCP 蛋白序列進行多序列聯(lián)配[13],將多序列聯(lián)配的結(jié)果利用MEGA 6.06 軟件采用鄰接法(NJ)法進行系統(tǒng)進化分析[14],校驗參數(shù)bootstrap 重復(fù)1 000次,構(gòu)建了系統(tǒng)進化樹。
從芥菜基因組數(shù)據(jù)庫(http://brassicadb.org/)下載芥菜基因組信息,找出TCP 家族基因成員的染色體位置及結(jié)構(gòu)信息,并利用MapInspect(http://mapinspect.software.informer.com)軟件繪制TCP 家族基因的染色體位置分布圖。
登錄 GSDS 服務(wù)器(http://gsds.cbi.pku.edu.cn/),通過比對編碼序列與基因序列信息,繪制TCP 家族基因的內(nèi)含子和外顯子的結(jié)構(gòu)模式圖。利用MEME(http://meme-suite.org/)對芥菜 TCP 家族基因成員的保守基序進行分析,參數(shù)設(shè)定保守基序(motif)大小為10~100 個氨基酸,輸出的結(jié)構(gòu)域數(shù)目最大為15,motif 結(jié)構(gòu)繪圖采用 TBtools 軟件[15]。
莖瘤芥品種“涪雜2 號”不同發(fā)育階段(莖的直徑分別為2、4、6、8 cm)的轉(zhuǎn)錄組測序由本課題組完成,測序所獲得的數(shù)據(jù)已提交至NCBI 網(wǎng)站,登錄號為SRP151320。使用FPKM 值來反映TCP 基因在芥菜不同發(fā)育階段的表達豐度,基因表達熱圖使用Microsoft Excel 2010 作圖。
通過對芥菜全基因組數(shù)據(jù)庫進行檢索,并利用Pfam 工具鑒定結(jié)構(gòu)域,最終獲得53 條具有典型TCP結(jié)構(gòu)域的序列,分別命名為BjuTCP1~BjuTCP53。根據(jù)序列信息進行理化性質(zhì)分析,基因名稱、登錄號、氨基酸大小、分子量、理論等電點、染色體定位和亞細胞定位等特征見表1。結(jié)果顯示,這些TCP 基因的氨基酸大小、分子量及等電點呈現(xiàn)出較大差異:氨基酸長度最短的是BjuTCP25 基因編碼的蛋白,只含有216 個氨基酸,其蛋白分子質(zhì)量為23 116.85 Da,氨基酸最長的是BjuTCP31 蛋白,含有437 個氨基酸,其蛋白分子質(zhì)量為50 079.68 Da,理論等電點預(yù)測為5.50~10.18。根據(jù)亞細胞定位分析,絕大部分基因主要定位于細胞核,和已報道的其他物種中TCP 轉(zhuǎn)錄因子基因類似。
(續(xù)表1)
為了分析TCP 轉(zhuǎn)錄因子家族基因的進化關(guān)系,選用模式植物擬南芥、水稻與芥菜一起構(gòu)建系統(tǒng)進化樹。在TCP 家族進化樹中,53 個芥菜TCP、24 個擬南芥TCP 和21 個水稻TCP 呈現(xiàn)明顯的聚類現(xiàn)象,如圖1 所示,TCP 家族可清楚地劃分為2 個大的亞家族,其中Class Ⅱ還可以細分為2 個小組,根據(jù)前人的分類方法,分別命名為:Class Ⅰ(PCF)、ClassⅡ(CIN)和 Class Ⅱ(CYC/TB1)。Class Ⅰ(PCF)包含的成員數(shù)目最多,其中芥菜Class Ⅰ(PCF)包含30個基因,水稻包含10 個,擬南芥包含13 個;其次是Class Ⅱ(CIN)亞組,包含 12 個芥菜基因、8 個水稻、8 個擬南芥;Class Ⅱ(CYC/TB1)成員數(shù)目最少,芥菜有11 個,水稻有3 個,擬南芥有3 個。
TCP 家族成員的基因結(jié)構(gòu)分析顯示,44 個成員具有外顯子結(jié)構(gòu),占全部基因的83%,僅有9 個基因含有1~3 個內(nèi)含子,其中內(nèi)含子序列較長的是BjuTCP32,達 600 bp 左右(圖 2)。芥菜與番茄[16]、黃瓜[17]和柑橘[18]TCP 基因所含內(nèi)含子數(shù)量所占比例類似,表明TCP 轉(zhuǎn)錄因子家族基因的結(jié)構(gòu)和進化在物種間相對保守。
圖1 芥菜、擬南芥和水稻TCP 基因系統(tǒng)進化樹圖Figure 1 Phylogenetic tree of all TCP genes in B.juncea,Arabidopsis and Oryza sativa
利用MEME 網(wǎng)站對芥菜TCP 家族進行基因序列的保守基序分析,所得結(jié)果見圖2 和表2。分析結(jié)果發(fā)現(xiàn)芥菜所有基因都含有TCP 家族中最基本的motif 1,表2 橫線處為motif 1 中氨基酸同源性大于90%區(qū)域,說明motif 1 是TCP 家族最重要的保守結(jié)構(gòu)。TCP 家族不同組內(nèi)保守基序的分布有較大差異,ClassⅠ組的大部分基因的保守基序數(shù)量明顯比Class Ⅱ組的高。ClassⅠ組全部含有motif 1 和motif 2,且排列順序都一樣,說明這2 個motif 在ClassⅠ組內(nèi)非常的保守;此外,一部分TCP 蛋白含有特有的基序,如 BjuTCP01 ~06 特異性含有 motif 9,BjuTCP07~20 特異性含有 motif 14,BjuTCP21~20 特異性含有motif 5 和motif 8,這些特異性的基序結(jié)構(gòu),可能與不同成員參與一些特定的調(diào)控過程有關(guān)。對于Class Ⅱ組來說,CYC/TB1 組中均含有motif 13,而 CIN 亞組不含有 motif 13 但含有 motif 6,且CIN 含有的基序模塊明顯少于CYC/TB1,說明兩個亞組存在顯著的模塊差異,可能影響兩個亞組成員的功能。整體看來,大部分位于同一亞族的基因具有相似的保守基序,并表現(xiàn)出一定的排列規(guī)律,與前面的系統(tǒng)進化樹的分類相吻合,不同亞族成員間的差異也為研究TCP 家族中不同亞族的進化提供了參考。
在所篩選出的53 個TCP基因中,除了BjuTCP46尚未確定染色體位置,其他基因都有明確的染色體信息(表1)。本研究利用MapInspect 軟件繪制出剩余52 個TCP 基因家族成員在染色體上的分布情況,如圖3 所示。結(jié)果發(fā)現(xiàn)僅A01 和A04 染色體沒有基因分布,其余16 條染色體上基因分布位置不均勻,且B 類亞基因組中染色體分布的基因比A 類亞基因組多。A 類亞基因組染色體共含有24 個基因,占46%;B 類亞基因組含有基因28 個,占54%。一些TCP 基因在染色體上聚集在相近或相同的區(qū)域,表現(xiàn)出成簇的現(xiàn)象,例如A03 染色體上的BjuTCP45 和 BjuTCP22、A07 染色體上的下端 4 個基因、B07 染色體上的 BjuTCP31 和 BjuTCP32、BjuTCP30 和 BjuTCP43 等。
對染色體上基因數(shù)量的分布情況進行統(tǒng)計(圖4),發(fā)現(xiàn)只有A03、B03 和B07 染色體分布有不同亞組的TCP 基因;A02 和B03 染色體上基因數(shù)目最多,達到6 個,但B03 分布種類更加豐富;A08、A10、B01 和B06 等4 條染色體只分布有 1 個基因,大都位于染色體下端。
圖2 芥菜TCP 家族成員基因結(jié)構(gòu)分析圖Figure 2 Gene structure analysis of TCP family members in B.juncea
表2 芥菜TCP 蛋白基序信息Table 2 Motif information of TCP family proteins in B.juncea
圖3 TCP 家族成員染色體定位信息Figure 3 Chromosomal localization of TCP family members
圖4 芥菜各染色體TCP 基因分布數(shù)量Figure 4 Number of TCP genes in each chromosomes
根據(jù)芥菜瘤莖膨大不同時期的轉(zhuǎn)錄組數(shù)據(jù),對TCP 家族基因的表達模式進行分析。通過比較不同發(fā)育階段轉(zhuǎn)錄組數(shù)據(jù)中的表達豐度,除BjuTCP31、BjuTCP43、BjuTCP44、BjuTCP45 和 BjuTCP48 外,剩下的48 個基因都檢測到了相應(yīng)的表達量,基因的表達模式如圖5 所示。芥菜TCP 基因的表達模式在不同亞組內(nèi)具有較高的相似性,可以按亞組分成兩類:ClassⅠ和ClassⅡ。ClassⅠ亞組基因整體呈現(xiàn)出較高的表達水平,推測Class Ⅰ亞組成員在莖發(fā)育中發(fā)揮重要的作用;其中ClassⅠ亞組中,BjuTCP02、BjuTCP03、BjuTCP04、BjuTCP05 和 BjuTCP06 在前 2個階段表達量較高,后兩個階段明顯下降,推測這幾個基因參與了芥菜莖前期發(fā)育;ClassⅡ亞組成員整體表達量相對較低,除了BjuTCP39 外,其余基因表達量始終維持在較低的水平。在其他物種TCP 基因的功能研究中,發(fā)現(xiàn)Class Ⅰ亞組成員廣泛參與了植物的生長發(fā)育,OsTCP7 基因在水稻分蘗期的表達量最高[19],TCP15 與TCP22 之間可能存在功能冗余并共同調(diào)節(jié)葉片的衰老死亡過程[20]。芥菜中大量的TCP 家族基因在莖發(fā)育階段的高表達,對莖瘤芥產(chǎn)品器官的正常發(fā)育起了重要的作用。
圖5 芥菜TCP 基因在莖不同發(fā)育時期的表達模式熱圖Figure 5 Expression pattern of TCP genes in B.juncea at different stages of stem development
隨著分子生物學(xué)和生物信息技術(shù)的發(fā)展,TCP家族基因相繼在番茄、黃瓜、柑橘、葡萄以及碭山酥梨[16-22]等多種物種中得到鑒定。為了比較不同物種間TCP 家族成員的構(gòu)成,我們檢索了14 種植物的TCP 家族基因成員,各物種TCP 基因數(shù)量的統(tǒng)計情況見表3。結(jié)果顯示,大部分物種Class Ⅱ含有的基因數(shù)量整體大于Class Ⅰ;除了蘋果、番茄和葡萄外,PCF 亞組含有基因數(shù)量最多,CIN 亞組次之,CYC/TB1 亞組含量最少,但玉米中不含有CIN 亞組成員。雖然在不同物種中各個亞組基因數(shù)目存在差異,但幾乎每個亞族所占比例較為一致,這些結(jié)果均揭示了TCP 家族在物種間的進化具有較高的保守性。雙子葉植物明顯比單子葉植物含有的TCP 基因數(shù)量更多,可能與基因組的進化關(guān)系有關(guān),推測TCP 家族在雙子葉植物的演化過程中發(fā)生了大規(guī)模的擴增;在雙子葉植物中,TCP 基因數(shù)量從15~78之間不等,各科各屬之間的TCP 家族基因數(shù)量存在著較大差異,薔薇科的梨和蘋果基因數(shù)量明顯大于葫蘆科的黃瓜和西瓜;與芥菜同屬于蕓薹屬的其他植物含有TCP 家族成員基因數(shù)量也較大,以異源四倍體的甘藍型油菜含有基因數(shù)量最多,幾乎是白菜和甘藍的2 倍,大致符合禹氏三角理論。
TCP 轉(zhuǎn)錄因子是植物特有的一類轉(zhuǎn)錄因子家族,參與植物生長發(fā)育中的多種生理過程[7]。隨著分子生物學(xué)技術(shù)的發(fā)展普及,TCP 轉(zhuǎn)錄因子家族基因相繼在擬南芥、水稻、番茄、黃瓜、蘋果及葡萄等物種得到鑒定。在擬南芥和水稻基因組中分別發(fā)現(xiàn)24和 21 個 TCP 基因[23],黃瓜中鑒定 22 個[17],葡萄中鑒定 15 個[21],番茄中鑒定 36 個[24],蘋果中鑒定 52 個[25]。但芥菜TCP 家族基因成員還未見報道。本研究采用生物信息學(xué)的方法對芥菜全基因組數(shù)據(jù)庫進行檢索,共鑒定出53 個芥菜TCP 轉(zhuǎn)錄因子家族基因成員,并利用生物信息學(xué)方法對其進行較為系統(tǒng)全面的分析。與不同物種的TCP 基因數(shù)量進行對比(表3),各物種間有較大差異,甘藍型油菜TCP 基因數(shù)量含量多,含78 個,芥菜次之。
表3 不同物種TCP 基因數(shù)目比較Table 3 The number of TCP genes in different species
根據(jù)序列基本特征分析顯示,這些基因序列長度、氨基酸大小、分子量和等電點差異較大,且多編碼堿性氨基酸,位于細胞核上;系統(tǒng)進化樹分析把芥菜的53 個家族基因分為兩大類:ClassⅠ(PCF)和Class Ⅱ(CIN),又稱(CYC/TB1);基因結(jié)構(gòu)分析表明芥菜TCP 基因結(jié)構(gòu)較為簡單,大部分基因沒有內(nèi)含子,暗示了家族序列具有較高的保守性;保守基序分析結(jié)果與進化分析相匹配,各亞組內(nèi)部保守基序有很強的特異含有性;染色體定位分析表明TCP 基因并不完全分配在芥菜的全部18 條染色體上,且呈現(xiàn)分布不均的現(xiàn)象,B 亞基因組含有的TCP 基因多于A 亞基因組,基因在染色體上呈現(xiàn)成簇或分散的現(xiàn)象,這可能與基因復(fù)制相關(guān)。
本研究進一步利用芥菜轉(zhuǎn)錄組數(shù)據(jù),分析了TCP 基因在芥菜莖膨大時期的表達模式?;虮磉_分析結(jié)果也表現(xiàn)出聚類現(xiàn)象,基于進化分析,可將結(jié)果按表達量的相似性分為Class Ⅰ和Class Ⅱ兩類。Class Ⅰ(PCF)大部分成員顯示出較高的表達量,Class Ⅱ成員表達水平相對較低。這說明同一亞組的基因,功能上可能也存在較大的相似性。研究發(fā)現(xiàn),TCP 轉(zhuǎn)錄因子家族在植物整個生長周期中參與多種生物學(xué)過程的調(diào)控,尤其與生長發(fā)育密切相關(guān)。Class Ⅰ(PCF)基因表達范圍廣泛,尤其在含有大量分生細胞的組織器官中特異性表達[5]。擬南芥AtTCP14 和AtTCP15 在幼穗莖、幼花花梗、子葉和葉原基節(jié)間表達,參與調(diào)節(jié)葉片葉形發(fā)育,通過促進細胞增殖來調(diào)節(jié)節(jié)間發(fā)育[26]。J.M.Davière 等[27]發(fā)現(xiàn)GA 激素參與TCP 基因?qū)χ旮叩恼{(diào)控過程,雙突變體 AtTCP14 和 AtTCP15 會導(dǎo)致植物矮化;西瓜ClTCP14a 和ClTCP15 也有相似功能,通過與激素的相互作用參與植株的生長發(fā)育[28]。莖瘤芥的主要產(chǎn)品器官是其肉質(zhì)瘤狀莖,莖的膨大涉及大量細胞的增殖分化,有關(guān)基因參與莖膨大的轉(zhuǎn)錄調(diào)控研究目前還較少報道。芥菜Class Ⅰ(PCF)基因在莖發(fā)育時期顯著表達,尤其是一些基因(如BjuTCP02、BjuTCP 03、BjuTCP04、BjuTCP05 和 BjuTCP06)顯示出明顯的階段表達特點,推測該組成員在莖發(fā)育中起重要作用。Class Ⅱ由CYC/TB1 和 CIN 兩個亞組組成,對該類成員的功能研究較多。金魚草CYC 是第1 個被鑒定出調(diào)控不對稱花發(fā)育的TCP 基因[3];TB1 基因是側(cè)枝發(fā)育的負調(diào)控元件,在擬南芥、玉米、水稻和矮牽牛中,該基因通過控制腋芽的生長來影響分蘗數(shù),其缺失突變體均表現(xiàn)為腋芽增長側(cè)枝增多[29-32]。CIN 亞組基因受到 miRNA319 調(diào)控,與葉片發(fā)育、葉片形態(tài)建成有關(guān)[33-36]。AtTCP2 和AtTCP17與植物光合作用有關(guān),參與光信號傳導(dǎo)途徑[37-38]。在芥菜莖發(fā)育中,Class Ⅱ組成員表達量水平整體較低,可能未直接參與莖的膨大過程,但猜測可能在植物其他生長發(fā)育如葉的發(fā)育、花的發(fā)育中起作用。綜合以上結(jié)果,我們發(fā)現(xiàn)芥菜的TCP 家族不同亞組成員對植物的調(diào)控存在一定的差異,各基因的具體功能還需要進一步的功能驗證。本文基于全基因測序結(jié)果和轉(zhuǎn)錄組數(shù)據(jù)結(jié)果,對芥菜TCP 家族的成員進行了較為系統(tǒng)的鑒定和分析,為今后研究TCP 家族基因功能提供了理論依據(jù),并為研究莖瘤芥生長發(fā)育奠定理論基礎(chǔ)。
四川農(nóng)業(yè)大學(xué)學(xué)報2019年4期