劉 俊 ,李 龍,吳耀松,劉 燕,任閃閃,陳玉龍*
1.河南中醫(yī)藥大學中醫(yī)藥科學院 河南省中醫(yī)方證信號傳導重點實驗室,河南 鄭州 450046
2.西北農林科技大學林學院,陜西 楊凌 712100
3.國際竹藤中心 國家林業(yè)和草原局竹藤科學與技術重點開放實驗室,北京 100102
4.國際竹藤中心 安徽太平試驗中心,安徽 黃山 245716
TCP(Teosinte branched 1/Cycloidea/ Proliferating)蛋白一般由60個氨基酸組成,含有一個非典型的基本螺旋(bHLH)結構和R結構域[1],分為Class I和Class II 2個亞家族,Class I又稱為PCF,Class II進一步劃分為CIN和CYC/TB1亞家族[2]。TCP轉錄因子參與植物胚胎發(fā)育[3]、側枝形成[4-5]、開花調控[6]、脅迫響應[7]以及激素信號[5]等生物學過程。
TB1和TB1-like蛋白屬于CYC/TB1亞家族,抑制擬南芥分枝發(fā)育[8]。AtTCP4通過誘導脂肪氧化酶(LIPOXYGENASE2)基因表達,促進茉莉酸(JA)生物合成和成熟葉片衰老[9],在花器官中AtTCP4抑制LIPOXYGENASE2基因表達[10]。AtTCP4通過靶向生長素生物合成酶基因YUCCA5調控生長素生物合成[11],AtTCP14是PCF亞家族成員,在種子萌發(fā)過程中發(fā)揮負調控作用[12]。毛竹PeTCP10通過脫落酸(ABA)依賴信號在抗旱中發(fā)揮正調控作用,以茉莉酮酸甲酯(Me-JA)介導途徑負調控側根生長[13]。OsPCF2通過正調控NHX1影響水稻耐鹽性[14],OsCP21和OsPCF6是microRNA319的靶基因,在冷脅迫中發(fā)揮正調控作用[15]。在擬南芥中超表達OsTCP19誘導IAA3、ABI3、ABI4上調表達,LOX2下調表達,導致側根數(shù)目減少,提高轉基因植株脅迫耐受性[16]。
杜仲Eucommia ulmoidesOliver是我國特有單科、單屬、單種的多年生第三紀孑遺樹種,雌雄異株,具有橡膠和藥材的雙重性質[17]。廣泛分布于溫帶及亞熱帶地區(qū),適應能力強,在酸性或鹽堿性的貧瘠土壤中均能生長良好[18]。其樹皮、葉片及種子均可入藥,富含多種活性成分,對多種疾病的預防及提高人體免疫力具有顯著的效果,是我國二級珍稀保護植物。目前,對杜仲的研究與利用多局限于資源收集、藥理學及形態(tài)學研究,分子遺傳學方面的報道相對較少,嚴重制約了杜仲分子育種及相關生物學特性研究。目前TCP轉錄因子已在多個物種中進行了研究,然而杜仲TCP基因家族還未報道,本研究以杜仲基因組數(shù)據(jù)[19]為基礎,從基因組水平對TCP基因家族進行鑒定、理化性質、進化關系、保守基序以及表達模式分析,以期為進一步探索杜仲TCPs基因功能奠定基礎。
從杜仲基因組數(shù)據(jù)庫Genome Warehouse(https://bigd.big.ac.cn/gwh/Assembly/13/show)中下載TCP蛋白候選序列,利用NCBI的(Conserved Domain Search Service(CD Search))分析蛋白結構域,保留含有完整bHLH結構域的序列。通過在線軟件ProtParam (http://web.expasy.org/protparam/)分析蛋白理化性質,使用Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/) 預 測EuTCPs蛋白亞細胞定位,利用在線工具ExPASY(https://www.expasy.org/tools)預測EuTCPs氨基酸數(shù)量、相對分子質量、理論等電點,通過Expasy(https://web.expasy.org/protscale/)軟件分析蛋白的親疏水性,利用 SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.plpage=npsa_sopma.html)和 Phyre 2(http://www.sbg.bio.ic.ac.uk/ phyre2/html/page.cgi?id=index)軟件分別預測蛋白的二級結構和三級結構。
通過Clustal X1.83軟件對杜仲、水稻、擬南芥和毛竹TCPs氨基酸序列進行多序列比對,利用MEGA 6.0的鄰接法(neighbor-joining)構建系統(tǒng)發(fā)育樹,重復次數(shù)設置為1000次,其他參數(shù)為默認值[20]。
通過MEME(http://meme-suite.org/)在線軟件對EuTCP基因家族成員進行基序分析(參數(shù)是:any number of Repetitions(anr),maximum number of Motifs=10,minimum width≥6,and maximum width ≤50)。為了解析EuTCPs啟動子區(qū)域順勢作用元件,對EuTCPs基因ATG上游2000 bp序列進行查找分離,利用Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/htmL/)軟件進行啟動子順勢作用元件分析。
從NCBI的Short Read Arshive(SRA)數(shù)據(jù)庫中下載杜仲葉片不同發(fā)育時期(葉芽、初生葉、幼葉、老葉)(版本號:SRP218063)[21]及不同膠含量(低含量、高含量)(版本號:SRP158357)[22]轉錄組數(shù)據(jù),EuTCPs基因相對表達豐度用FPKM值表示,對該數(shù)值取對數(shù)進行統(tǒng)計分析,通過MeV4-9-0工具繪制基因表達圖譜,表達量最高的用綠色方框表示,表達量最低的用黃色方框表示。
利用STRING軟件(https://string-db.org/)上傳EuTCPs蛋白序列,選擇擬南芥數(shù)據(jù)庫進行序列比對,根據(jù)已知擬南芥蛋白互作關系,通過Blast比對杜仲同源蛋白,通過Cytoscape 3.7.0軟件對EuTCP基因家族蛋白互作信息進行評估和預測[23]。
通過Genome Warehouse數(shù)據(jù)庫,從杜仲基因組中共鑒定到14個EuTCPs基因(表1),利用Pfam和NCBI的Conserved Domain Search在線分析軟件對EuTCPs蛋白進行結構域驗證。結果顯示,14個EuTCPs蛋白均含有非典型的bHLH(BASIC、HELIX I、LOOP和HELIX II)特征結構域,分別命名為EuTCP1~EuTCP14。使用ExPASy工具,對EuTCP家族成員進行蛋白質理化性質分析,EuTCP14蛋白最長,編碼492個氨基酸,EuTCP13蛋白最短,編碼139個氨基酸,相對分子質量分布區(qū)域為18 880~53 620,等電點范圍是5.54(EuTCP14)到9.72(EuTCP6)。亞細胞定位預測結果顯示,EuTCPs均定位在細胞核中(表1)。
表1 杜仲TCP蛋白序列特征及亞細胞定位預測Table 1 Amino acid sequence characteristics and predicted subcellular location of E.ulmoides TCP proteins
二級結構分析顯示,EuTCPs蛋白主要由α螺旋、無規(guī)則卷曲、延伸鏈和β轉角組成,順序均是由無規(guī)則卷曲>α螺旋>延伸鏈>β轉角,具體數(shù)值見表2。α螺旋在DNA結合基序中發(fā)揮重要作用,無規(guī)則卷曲易受側鏈相互作用,構成活性部位和功能部位。EuTCPs蛋白三級結構非常相似,結果如圖1所示,無規(guī)則卷曲所占比例最大,蛋白空間結構不同,決定功能的差異。
圖1 杜仲TCPs三級結構預測Fig.1 Tertiary structure prediction of E.ulmoides TCPs
表2 杜仲TCP基因家族二級結構分析Table 2 Secondary structures analysis of E.ulmoides TCP gene family
利用MEGA 6.0分析軟件,對14個杜仲EuTCPs,22個水稻OsTCPs[24],24個擬南芥AtTCPs[25]和19個毛竹PheTCPs[26]蛋白進行1000次重復搜索,構建系統(tǒng)進化樹。結果如圖2所示:79個TCPs蛋白分為Class I和Class II 2個大亞家族,其中Class I又稱為PCF亞家族;Class II亞家族進一步劃分為CYC/TB1和CIN亞家族。PCF亞家族所包含TCPs成員數(shù)量最多,含有40個TCPs蛋白,5個EuTCPs,13個AtTCPs,10個OsTCPs和12個PtTCPs,其次是CIN亞家族,由29個TCPs蛋白組成,CYC/TB1亞家族所含蛋白數(shù)量最少,僅包含10個TCPs蛋白,3個AtTCPs,3個EuTCPs,3個OsTCPs,1個PheTCPs。
圖2 杜仲、水稻、擬南芥和毛竹TCPs蛋白系統(tǒng)進化樹Fig.2 Phylogenetic tree of TCP proteins from E.ulmoides, rice, Arabidopsis and moso bamboo
為了分析杜仲TCP轉錄因子家族保守結構域序列特征,利用DNAMAN7.0工具對杜仲、擬南芥和水稻TCP家族成員氨基酸序列進行比對,結果如圖3所示,杜仲TCP結構域氨基酸分布與擬南芥和水稻十分相似,14個杜仲TCP家族成員均含有完整的非典型性bHLH結構域,暗示杜仲TCP結構域高度保守性。BASIC區(qū)域由19個氨基酸組成,其中有9個氨基酸是高度保守的,HLH區(qū)域含有5個高度保守的氨基酸。杜仲TCP轉錄因子家族有5個蛋白(EuTCP1、EuTCP4、EuTCP6、EuTCP10和EuTCP12)BASIC區(qū)域缺少4個氨基酸,圖2系統(tǒng)進化樹結果顯示,他們均屬于Class I亞家族,其余蛋白均屬于Class II亞家族,這與前人研究結果相一致[2],表明杜仲TCP轉錄因子家族進化的保守性。
圖3 擬南芥、水稻和杜仲TCP蛋白保守結構域氨基酸序列比對Fig.3 Alignment of amino acid sequences in conserved domains from members of TCP proteins of Arabidopsis, rice, and E.ulmoides
為了解析EuTCPs基因結構多樣性和進化關系,利用MEME在線軟件對EuTCPs轉錄因子家族進行基序分析。結果如圖4所示,EuTCPs轉錄因子分為3個亞家族(PCF、CYC/TB1和CIN),進化關系與圖2結果相一致,20個保守基序,分別命名為Motif 1~Motif 20,14條EuTCPs蛋白均含有Motif 1基序,表明均屬于TCP轉錄因子家族。同一亞家族EuTCPs蛋白基序具有高度相似性,CIN亞家族均含有Motif 1和Motif 2,PCF亞家族成員均含有Motif 1和Motif 19,表明同一亞家族EuTCPs可能具有相似的功能。不同亞家族基序存在顯著差異,有些Motifs只在特定亞家族中存在,例如,Motif 3~Motif 6只存在于PCF亞家族,只有CYC/TB1亞家族含有Motif 7和Motif 9,暗示某些基序在亞家族功能特異性方面發(fā)揮重要作用。
圖4 EuTCPs蛋白保守基序分析Fig.4 Conservative motif analysis of EuTCP proteins
為了探索EuTCPs基因功能和表達調控模式,利用Plant CARE在線分析軟件對EuTCPs起始密碼子(ATG)上游2000 bp序列進行順式作用元件分析,結果如圖5所示,EuTCPs啟動子中不僅含有基本順式作用元件,還存在4種類型元件:(1)激素調控元件,如赤霉素響應元件ABRE;生長素響應元件 AuxRR-core;水楊酸響應元件CGTCA-motif;(2)光響應元件,如Box 4、G-box、G-Box、GT1-motif、GATA-motif等;(3)脅迫響應元件,如干旱脅迫響應元件MBS,低溫響應元件:LTR和厭氧脅迫相關元件ARE等;(4)生理響應元件,如O2-site、CAT-box等,推測EuTCPs可能在杜仲生長發(fā)育、脅迫響應、激素調節(jié)以及光周期調控中發(fā)揮重要作用。EuTCPs基因中光響應元件數(shù)量最多,共有135個,其中G-box元件有38個,含有28個Box 4元件,暗示EuTCPs基因的轉錄可能受光周期調控。EuTCPs啟動子區(qū)域含有44個ABRE元件和25個ARE元件(圖5-B),表明EuTCPs可能參與ABA調節(jié)和厭氧調控。
圖5 EuTCPs啟動子順式作用元件分布Fig.5 Cis-elements distributed in promoters of EuTCPs
為了解析EuTCPs基因在杜仲葉片不同發(fā)育時期及膠形成中的功能,根據(jù)轉錄組數(shù)據(jù),檢測EuTCPs基因的表達模式(圖中顯示基因編號與文章中基因命名一致)。結果如圖6、7所示,不同EuTCPs基因在杜仲葉片不同發(fā)育時期及膠含量中表達豐度存在顯著差異,大部分EuTCPs基因在杜仲葉片發(fā)育時期表達豐度較低,有2個EuTCPs基因(EuTCP11和EuTCP14)在杜仲葉片中未檢測到,推測EuTCP11和EuTCP14在杜仲葉片中不發(fā)揮作用。EuTCPs基因在杜仲葉片不同發(fā)育時期表達趨勢不盡相同,暗示EuTCPs在杜仲葉片發(fā)育中具有不同的功能,5個基因(EuTCP1、EuTCP7、EuTCP8、EuTCP9、EuTCP13)在杜仲葉芽中表達量最高,4個(EuTCP2、EuTCP3、EuTCP6、EuTCP12)基因在初生葉中表達豐度最高,3個基因(EuTCP4、EuTCP5和EuTCP10)在老葉中轉錄水平最高。
圖6 EuTCPs基因在杜仲葉片不同發(fā)育時期的表達模式Fig.6 Expression patterns of EuTCPs genes at different development stages of E.ulmoides leaves.
為了預測EuTCPs在杜仲膠形成中的功能,利用不同膠含量的轉錄組數(shù)據(jù),檢測EuTCPs基因的轉錄水平。結果如圖7所示,大部分EuTCPs在杜仲不同膠含量中表達水平較低,并且低膠含量葉片中的轉錄水平低于高膠含量葉片,例如:EuTCP10在高膠含量葉片中的FPKM平均值是17.25,在低膠含量葉片中為7.26,EuTCP4在高膠含量中的轉錄水平是24.26,在低膠中為5.05,推測EuTCPs在杜仲膠形成過程中發(fā)揮正調控作用。
圖7 EuTCPs基因在杜仲不同膠含量葉片中的表達模式Fig.7 Expression pattern of EuTCPs genes in leaves with different gum content
表達模式結果顯示,EuTCP3在杜仲葉片不同發(fā)育階段和膠含量中表達量均較高,特別在初生葉中,F(xiàn)PKM值為111,暗示EuTCP3在杜仲葉片發(fā)育和膠形成過程中發(fā)揮重要作用。為了檢測EuTCP3與其他蛋白的互作關系,利用STRING數(shù)據(jù)庫,預測EuTCP3的互作蛋白。結果如圖8所示,EuTCP3可以與10個蛋白發(fā)生相互作用,其中7個屬于EuTCP基因家族,參與種子萌發(fā)、生物鐘調節(jié)、細胞周期以及蛋白轉錄調控。MYB-like轉錄因子,在發(fā)育種子的原花青素積累中發(fā)揮關鍵的決定性作用,LOB轉錄因子AS2,是葉片正面細胞增殖負調控因子,調節(jié)葉片對稱層的形成和脈絡的建立,AN1-like(SAP11)鋅指蛋白,參與植物非生物脅迫響應[27],推測EuTCP3可能與其他蛋白相互作用共同參與杜仲葉片生長發(fā)育以及脅迫響應。
圖8 EuTCP3蛋白互作網(wǎng)絡Fig.8 Interaction network of EuTCP3
利用Cytoscape 3.7.0軟件,構建EuTCP轉錄因子家族共表達調控網(wǎng)絡。結果如圖9所示,調控網(wǎng)絡中共有11個節(jié)點(代表EuTCPs蛋白)和35條邊(代表蛋白質之間的相互作用),表明14個EuTCPs中有11個蛋白存在互作關系,其中EuTCP3、EuTCP5和EuTCP8蛋白互作數(shù)量最多,均與8個EuTCPs蛋白存在互作關系,暗示EuTCP3、EuTCP5、EuTCP8可能處于EuTCP基因家族核心位置,EuTCP1、EuTCP10、EuTCP11和EuTCP14與7個EuTCPs蛋白互作,EuTCP4和EuTCP6預測與5個EuTCPs蛋白互作,EuTCP7與4個EuTCPs蛋白互作,EuTCP9與2個EuTCPs蛋白發(fā)生互作關系。
圖9 EuTCP基因家族蛋白互作預測Fig.9 Prediction of protein interactions between EuTCP gene family
杜仲是絞木目(Garryales)杜仲科(Eucommiaceae)杜仲屬EucommiaL.中唯一現(xiàn)存的一個種,是我國主要天然橡膠樹種,也是重要的木本油料和名貴中藥材[28],藥理作用廣泛[29],主要分布于我國的陜西、湖南、貴州、云南、四川、江西等地區(qū)[30]。TCP蛋白是植物特有的參與生長發(fā)育、非生物脅迫、葉片衰老、側枝形成、花粉發(fā)育等多種生物學過程的一類轉錄因子[13,31]。目前為止,TCP基因家族已在多個物種中進行了報道,擬南芥中有24個AtTCPs[25],水稻含有22個OsTCPs[24],玉米中存在29個ZmTCPs成員[32],棉花中包含38個GrTCPs[33],番茄中有30個SlTCPs[34],黃瓜中存在22個CsTCPs[35],柑橘中含有20個CsTCPs[36],西瓜中有27個ClTCPs[37],葡萄中包含18個VvTCPs[38],蘋果中52個MdTCPs[39],菠蘿中有9個[40]、毛竹中存在19個PheTCPs[26]等。本研究以杜仲基因組數(shù)據(jù)為基礎,利用生物信息學方法,從杜仲基因組中共鑒定到14個EuTCPs基因,分為3個亞家族,這與前人研究結果相一致。PCF亞家族包含5個EuTCPs蛋白,CYC/TB1亞家族含有3個,6個EuTCPs蛋白屬于CIN亞家族。序列比對結果顯示,14個EuTCPs與擬南芥、水稻TCP蛋白結構域具有高度的相似性,N末端均含有非典型的basic-helix-loop-helix結構域(圖3),基序分析發(fā)現(xiàn),Motif 1基序存在于所有EuTCPs轉錄因子(圖4),表明他們均屬于TCP轉錄因子家族,在基因進化過程中具有較保守性。根據(jù)保守結構域是否含有4種氨基酸殘基,將TCP基因家族分為2個亞家族,Class I亞家族保守結構域含有16個氨基酸殘基,Class II亞家族TCP結構域包含20個氨基酸,保守結構域外含有促進蛋白質相互作用的精氨酸富集R結構域[1],EuTCP3、EuTCP5、EuTCP7和EuTCP9均含有motif 8(R結構域),與AtTCPs、OsTCPs[24]、BpTCPs[41]、VvTCPs[37]、PmTCPs[42]和FvTCPs[43]等具有相似性,推測EuTCP3、EuTCP5、EuTCP7和EuTCP9可能具有相似的功能。
聚類分析結果顯示,EuTCP4與AtTCP20聚為同一分支,AtTCP20參與調節(jié)擬南芥細胞擴張、分裂和分化,在硝酸鹽誘導的系統(tǒng)信號通路中發(fā)揮重要作用[44],菊花CmTCP20為AtTCP20的同源基因,超表達CmTCP20增加轉基因菊花和擬南芥的側根數(shù)量和長度[45]。EuTCP10是AtTCP14的同源基因,AtTCP14主要在胚胎維管組織中表達,促進幼嫩節(jié)間細胞增殖,抑制葉片細胞擴增,attcp14突變體提高種子萌發(fā)對外源脫落酸和多效唑的敏感性,AtTCP14參與激活擬南芥胚胎生長[46],CmTCP14異源轉化擬南芥導致細胞周期相關基因下調表達,抑制器官大小,葉綠素和類胡蘿卜素含量升高,延長花期,延緩葉片衰老[47]。EuTCP6和EuTCP12聚為同一分支的AtTCP7、AtTCP8、AtTCP21、AtTCP22和AtTCP23均在擬南芥幼嫩葉片中表達,與野生型相比,attcp23突變體增加葉片面積,tcp8-1、tcp15-1、tcp22-1、tcp23-1四重突變體和tcp8-1、tcp15-1、tcp22-1、tcp23-1、tcp21-1五重突變體蓮座葉數(shù)目減少,葉片增大[48]。EuTCP14為AtTCP4的同源基因,AtTCP4在幼苗子葉中表達,激活SAUR16和SAUR50的光響應表達,通過光敏色素相互作用因子(PIFs)調節(jié)AtTCP4與SAUR14、SAUR16和SAUR50啟動子的結合,黑暗條件下PIF3抑制AtTCP4與上述啟動子的結合[49]。AtTCP4與CONSTANS(CO)啟動子結合,黃昏前后誘導CO基因表達,AtTCP4與細胞核中另一個開花調節(jié)因子GIGANTEA(GI)結合,誘導CO以GI依賴方式表達,調節(jié)發(fā)育和開花調控[50]。EuTCP3與AtTCP2互為同源基因,超表達AtTCP2導致轉基因擬南芥在光依賴條件下下胚軸矮小,特別是藍光條件下,AtTCP2與隱花色素蛋白(CRY1)互作,正調控HYH和HY5基因表達[51]。AtTCP17與EuTCP3親緣關系最近,AtTCP17在陰暗條件下顯著積累,AtTCP17及其同源基因AtTCP5和AtTCP13通過PIF依賴和獨立途徑誘導生長素生物合成,在介導陰暗誘導下胚軸伸長中發(fā)揮重要作用。白光下,tcp5、tcp13、tcp17三重突變體(3tcp)表現(xiàn)出下胚軸缺陷;陰暗條件顯著降低3tcp下胚軸伸長,TCP17與PIFs和YUCCAs的啟動子結合,誘導生長素表達[52],推測EuTCPs轉錄因子在杜仲生長發(fā)育、激素調節(jié)和開花調控中發(fā)揮重要作用。
綜上所述,本研究以杜仲全基因組數(shù)據(jù)為背景,對杜仲TCP轉錄因子家族進行了全面的生物信息學分析,共鑒定出14個EuTCPs,分為Class I與Class II 2大類,進一步劃分為3個亞家族(PCF、CYC/TB1和CIN)。理化性質分析顯示,EuTCPs編碼139~492個氨基酸,理論等電點分布于5.54~9.72,相對分子質量為18 880~53 620,亞細胞定位于細胞核中,均為親水性蛋白,二級結構以α-螺旋和無規(guī)則卷曲為主,均含非典型bHLH保守結構域。表達模式分析顯示,EuTCPs基因家族在杜仲葉片發(fā)育中具有不同的表達模式,EuTCPs在高膠含量中的轉錄水平高于低膠含量,推測EuTCPs在杜仲膠形成中發(fā)揮正向調控作用,本研究為深入探索EuTCPs基因功能奠定理論基礎。
利益沖突所有作者均聲明不存在利益沖突