周 瑾,李 潔,李曉燕,肖丹怡,李夢瑤
(四川農業(yè)大學園藝學院,成都 611130)
芹菜(Apiu m graveolens L.)也稱旱芹,是傘形科芹屬重要的二年生蔬菜作物,原產于地中海沿岸地區(qū)。芹菜在我國有著悠久的種植歷史,目前在南北地區(qū)廣泛栽培,是中國人餐桌上最常見的佳肴之一。芹菜富含多種營養(yǎng)物質,例如蛋白質、碳水化合物、維生素和揮發(fā)性芳香成分;同時還具有平肝清熱、健胃利血、降低血壓等多種藥理功效,受到越來越多消費者青睞[1-2]。但芹菜喜冷涼,不耐高溫,夏季高溫嚴重影響芹菜產量和品質,制約了芹菜的周年生產。
轉錄因子(transcription factor)是一類能特異結合DNA的蛋白,在高等植物各類基因的時空表達中扮演著重要的角色,能激活或抑制下游基因的表達,參與逆境脅迫和生長發(fā)育等關鍵生物學過程[3]。TCP家族是植物特有的一類轉錄因子家族,TCP的名字來源于最早鑒定的4個特征成員:玉米(Zea mays)中的TB1(Teosinte Branch 1),金魚草(Antirrhi?num majus)中的 CyC(Cycloidea),以及水稻(Oryza sativa)中的PCF1和PCF2(PROLIFERATING CELL FACTORS 1 and 2),它們的首字母縮寫構成了TCP的名字[4-6]。TCP轉錄因子含有一個保守的TCP結構域,在N端構成一個基本的螺旋-環(huán)-螺旋(BHLH)結構。該結構域對DNA結合至關重要,并參與蛋白質與蛋白質的相互作用[7-8]。根據(jù)TCP結構域的氨基酸序列相似性,將TCP基因分為兩大亞族:ClassⅠ亞族(PCF或TCP-P)和ClassⅡ亞族(TCP-C)[9]。這兩類蛋白之間最顯著的區(qū)別是在I亞族蛋白的堿性區(qū)域相對于Ⅱ類蛋白缺失了4個氨基酸。根據(jù)氨基酸序列的差異,Ⅱ亞族蛋白又可進一步分為CIN和CYC/TB1兩個亞類,尤其是在TCP結構域的堿性區(qū)域。
隨著多個物種基因組測序的完成,越來越多的TCP轉錄因子家族相繼被挖掘和鑒定。研究表明,TCP基因在植物生長發(fā)育的許多生物學過程中發(fā)揮著重要作用,包括種子萌發(fā)[10]、葉片形態(tài)發(fā)生[11]、葉片發(fā)育[12]、分枝[13]和激素信號轉導[14]等途徑。例如,在水稻中,OsTB1基因參與水稻[15]的側枝發(fā)育過程;擬南芥的AtTCP5、AtTCP13、AtTCP17和AtTCP24與葉片發(fā)育相關[16]。CIN亞類的另外3個基因AtTCP5、AtTCP13和AtTCP17在促進下胚軸伸長方面起著重要作用[17]。此外,還有研究發(fā)現(xiàn)TCP可能參與了花青素積累,通過在山茶轉錄組注釋結果中搜索,發(fā)現(xiàn)了兩個TCP負調控因子在花青素合成中可能起抑制作用[18]。
TCP還受到外界環(huán)境信號的調節(jié),在逆境脅迫中起著重要的調控作用。在茶樹中,TCP19、TCP20、TCP12和TCP32在鹽脅迫和低溫處理后分別上調,TCP18和TCP30在低溫處理后分別表達下調[19]。OsPCF5和OsPCF8能夠調控水稻的耐冷性[20]。擬南芥TCP5及TCP17基因在高溫下可促進光敏色素相互作用因子4(PIF4)的表達來調控對高溫脅迫的抵御[21]。基于轉錄組測序的分析發(fā)現(xiàn)馬鞍藤TCP家族成員在高溫脅迫下差異表達,可能在植物應對極端溫度中發(fā)揮關鍵作用[22]。
TCP家族成員參與植物生長發(fā)育及逆境脅迫應答的多個生物學進程,該家族成員的功能研究受到科研工作者的廣泛關注[23]。芹菜基因組測序的完成,對挖掘TCP家族成員提供了數(shù)據(jù)基礎,然而至今對芹菜TCP基因的全面挖掘及其響應逆境脅迫的研究還未有報道。本研究通過生物信息學方法對芹菜基因組數(shù)據(jù)庫進行檢索,篩選并鑒定了芹菜所有的TCP基因,分析了該家族成員的理化性質、基因結構、系統(tǒng)進化及基因表達模式,旨在為進一步研究TCP基因在芹菜生長發(fā)育及逆境脅迫中的作用提供參考。
從已公布的兩個芹菜基因組數(shù)據(jù)庫(http://apiaceae.njau.edu.cn/celerydb[24]和http://celerydb.bio2db.com/[25])下載芹菜蛋白序列,構建本地blast數(shù)據(jù)庫。從Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)下載TCP保守結構域種子文件(PF03634),利用HMMER軟件從芹菜蛋白序列中檢索TCP蛋白序列。去除冗余,將所得結果用NCBI-CDD和Pfam(http://pfam.xfam.org)進行TCP結構域的進一步確認[26]。接下來利用TargetP(http://www.cbs.dtu.dk/services/TargetP/)和WOLF PSORT(https://www.genscript.com/wolf-psort.html)對TCP進行亞細胞定位分析。利用ExPASy網站(http://web.expasy.org/protparam/)對最終確認的芹菜TCP蛋白序列進行理化性質分析等。
擬南芥的TCP蛋白序列從PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)下載獲取,水稻的TCP蛋白序列從TAIR(https://www.arabidopsis.org/)下載獲取。使用默認設置的ClustalX(v.2.1)對所有TCP氨基酸序列進行多序列聯(lián)配,通過MEGA6.06軟件采用鄰接法(NJ)構建了系統(tǒng)進化樹,校驗參數(shù)bootstrap重復1 000次[27]。傘形科植物的基因組序列和注釋從胡蘿卜數(shù)據(jù)庫(https://phytozome-next.jgi.doe.gov/pz/portal.html)和香菜數(shù)據(jù)庫(http://cgdb.bio2db.com/)獲得。物種之間的共線性關系通過MCScanX軟件進行分析,并通過TBtools軟件進行可視化。
從芹菜基因組數(shù)據(jù)庫下載獲取芹菜基因組信息,采用 MapInspect(http://mapinspect.software.informer.com)軟件繪制TCP家族成員的染色體位置分布圖[28]。從芹菜基因組數(shù)據(jù)庫中獲得所有AgTCP基因起始密碼子上游1 500 bp的啟動子序列,使用PlantCARE網頁版軟件鑒定(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)順式作用元件。
芹菜TCP基因內含子和外顯子的結構分析通過比對基因序列信息與編碼序列信息,登錄GSDS(http://gsds.cbi.pku.edu.cn/)網頁版軟件進行繪制。利用在線網站MEME(http://meme-suite.org)對芹菜TCP家族成員進行motif分析[29],輸出的結構域數(shù)目最大為15,參數(shù)設定保守基序(motif)大小為10~100 aa。采用ClustalX軟件對TCP成員的保守結構域進行分析,使用TBtools軟件可視化,在GenDOC中查看結果。
不同顏色的芹菜轉錄組測序數(shù)據(jù)下載于國家基因組科學數(shù)據(jù)中心(https://ngdc.cncb.ac.cn/),登錄號為CRA001997,芹菜高溫脅迫及不同組織的轉錄組測序數(shù)據(jù)由本課題組完成。使用FPKM值來反映AgTCP基因在不同樣品中的表達豐度,基因表達熱圖使用Microsoft Excel作圖。
芹菜種植于四川農業(yè)大學園藝學院實驗教學基地,生長1個月后在38℃下進行高溫處理,設置1個對照CK(0 h)和3個處理階段(2、4和24 h),取健壯植株的葉片與莖段作混樣,使用深圳艾偉迪生物(http://www.aivdbiotech.cn/index.php)植物總 RNA提取試劑盒提取芹菜RNA,使用北京擎科生物(https://tsingke.com.cn/)逆轉錄試劑盒將RNA反轉獲得芹菜cDNA。采用Bio-Rad Real-time PCR System和Bio-Rad CFX Manager進行實時定量PCR。根據(jù)芹菜TCP基因序列,設計熒光定量引物(表1),以反轉錄獲得的cDNA稀釋10倍作為模板,按照全式金公司(https://www.transgen.com.cn/)熒光定量試劑盒說明書配制反應體系,反應條件設定:95.0℃預變性1 min,95.0℃ 10 s,58.0℃ 15 s,39個循環(huán),所有設定保存后運行程序,每個樣品設3次重復。以芹菜AgTUB基因作為內參,相對定量計算公式采用 2-△△CT,△CT=CT(目標基因)-CT(AgTUB)。獲得數(shù)據(jù)使用Microsoft Excel分析,Origin 2019作圖。
表1 熒光定量中引物序列Table 1 Primer sequence s in qRT-PCR
基于芹菜全基因組數(shù)據(jù),總共鑒定出29個芹菜TCP基因,將其命名為AgTCP1~29(表2)。AgTCPs編碼的氨基酸長度范圍為129(AgTCP17)~462(AgTCP27)個氨基酸,分子量范圍為15 004.08 Da(AgTCP17)至48 800.74 Da(AgTCP27),等電點的值范圍為5.09至10.52。就氨基酸組成而言,芳香族氨基酸平均僅占7%,脂肪族氨基酸平均占16%,堿性氨基酸和酸性氨基酸平均分別占14%和10%。所有AgTCP蛋白的GRAVY值為負,表明它們都是親水性的蛋白。同時,根據(jù)亞細胞定位分析發(fā)現(xiàn)大多數(shù)基因主要位于細胞核中。
表2 芹菜TCP基因家族成員基本信息Table 2 Basic information of TCP gene family members in A.graveolens
在29個芹菜TCP基因中,27個基因在9條染色體上呈現(xiàn)不均勻分布,其余2個基因位于未組裝到染色上的重疊群上,其余染色體不含芹菜TCP基因(圖1)。且在染色體03、05和11分布的基因較多,均含有5個芹菜TCP基因。除未鑒定的重疊群外,染色體01和02分別只定位到了1個基因。此外,部分TCP基因聚集在染色體上相同或者相近的區(qū)域,例如在05號染色體上AgTCP3和AgTCP27聚集在長臂,AgTCP2和AgTCP14聚集在07號染色體短臂,AgTCP5、AgTCP6和AgTCP7聚集在11號染色體長臂。
圖1 芹菜TCP基因家族染色體定位Figure 1 Chromosome location of AgTCPs genes in celery
為了分析芹菜TCP基因家族的進化關系,本研究選用了模式植物單子葉植物水稻和雙子葉植物擬南芥與芹菜共同構建系統(tǒng)進化樹。21個水稻TCP蛋白、24個擬南芥TCP蛋白和29個芹菜TCP蛋白在系統(tǒng)進化樹中呈現(xiàn)出了明顯的聚類現(xiàn)象。在圖2中,根據(jù)基因聚類TCP基因家族可分成ClassⅠ和ClassⅡ兩個亞族,其中ClassⅡ亞族還可以細分成ClassⅡ-a(CIN)和ClassⅡ-b(CYC/TB1)兩個亞族。在這3個亞族中,ClassⅡ-b(CYC/TB1)亞族所含有的TCP基因數(shù)目最少,其中芹菜有8個,水稻和擬南芥僅分別有3個;TCP基因家族成員最多的是ClassⅠ(PCF),包含有芹菜9個TCP基因、水稻10個TCP基因和擬南芥13個TCP基因。而在ClassⅡ-a(CIN)亞族中,分別有12個芹菜、8個水稻和8個擬南芥TCP基因。
圖2 芹菜、擬南芥和水稻TCP基因系統(tǒng)進化樹Figure 2 Phylogenetic tree of TCPs in A.graveolens,Arabidopsis thaliana and O.sativa
根據(jù)基因結構分析顯示,芹菜的29個TCP基因家族成員全部具有編碼區(qū)域(CDS),只有少數(shù)基因有內含子和非翻譯區(qū)(UTR),其中內含子序列較長的是AgTCP1(圖3)。同時,序列相似性更高的AgTCPs在結構上更相似,例如屬于ClassⅡ(CYC/TB1)的AgTCP13~20,除AgTCP17外的其他基因編碼區(qū)域長度相似,且結構也相似,因此,與其他亞家族相比,ClassⅡ-b中AgTCPs的基因結構更為保守。
圖3 芹菜TCP基因家族基因結構及保守基序Figure 3 Gene structure and conserved motifs of A.graveolens TCP gene family
此外,為了更好地了解芹菜TCP蛋白序列中保守結構,采用MEME軟件分析TCP蛋白結構,鑒定了15個不同的保守基序(表3)。位于同一亞族的大部分芹菜TCP成員具有類似的保守基序,與家族系統(tǒng)進化樹的分組情況恰相吻合,都表現(xiàn)出了一定的排列規(guī)律。芹菜所有TCP基因都含有該家族最基本的motif 1和motif 2。此外,ClassⅠ亞族的基因成員特異性地含有motif 4,ClassⅡ-b特異性含有motif 3。ClassⅡ-a亞組基序除了較為保守的motif 1和motif 2外,蛋白間保守結構差異較大。由此分析,不同亞族的TCP家族成員參與協(xié)調了生長發(fā)育的特定過程的原因可能是具有各自特異的保守結構。
表3 AgTCPs中的保守基序和序列Table 3 Conserved motifs and sequences in AgTCPs
為了進一步預測AgTCPs基因的功能,使用在線軟件PlantCARE分析了翻譯起始位點1 500 bp上游序列(啟動子區(qū)域)中的順式調控元件。結果顯示,與植物生長發(fā)育相關、脅迫反應相關、和激素反應有關的順式作用元件在多個AgTCPs基因啟動子區(qū)域被鑒定。如圖4所示,分別在24個和21個AgTCPs基因的啟動子區(qū)域中鑒定了與植物生長和發(fā)育過程中參與光響應的元件Box 4和G-box,同時也發(fā)現(xiàn)了控制植物晝夜節(jié)律的順式作用調節(jié)元件(circadian)和與植物分生組織表達有關的順式作用調節(jié)元件(CAT-box)。在激素相關元件中,總共12水楊酸響應元件(TCA-element)、54個ABA響應元件(ABRE)、12個赤霉素響應元件(TATC-box)和33個茉莉酸甲酯響應元件(CGTCA-motif)在AgTCPs基因中出現(xiàn)。大量的激素響應元件在啟動子區(qū)域被鑒定表明激素在植物生長發(fā)育過程中有著尤為重要的作用。同時,還在多個芹菜TCP基因的啟動子中檢測到了厭氧誘導(ARE)、低溫(LTR)、干旱誘導(MBS)和應激響應(STRE)等元件。
圖4 芹菜TCP基因家族啟動子區(qū)域順式作用元件Figure 4 Cis-acting elements in the promoter region of AgTCPs genes in celery
通過對芹菜、胡蘿卜及香菜的共線性關系進行分析(圖5),胡蘿卜和芹菜基因組間有35 653個共線性區(qū)域,共線基因數(shù)占總基因數(shù)的58.95%。在胡蘿卜基因組中共篩選到50個TCP基因,其中,20個胡蘿卜TCP基因和19個芹菜TCP基因之間共檢測到27個同源基因對。芹菜和香菜基因組間有38 311個共線性區(qū)域中,共線基因數(shù)就總基因數(shù)的60.24%。在香菜基因組中共篩選到43個TCP基因,其中,21個香菜TCP基因和18個芹菜TCP基因之間共檢測到31個同源基因對。同屬于傘形科作物的胡蘿卜、芹菜、香菜基因組具有大量的保守區(qū)域及同源基因對,充分說明了三者親緣關系較近。
圖5 傘形科作物共線性分析Figure 5 Collinearity analysis of Apiaceae plants
為了了解TCP基因家族的表達特征,下載并分析了芹菜不同組織、不同品種和高溫脅迫下的轉錄組表達豐度。如圖6A,各個亞族內的TCP基因在不同組織內表達模式具有高度的相似性,例如,ClassⅠ亞族(AgTCP21~29)在根、葉柄和葉片3個組織中表達水平均較高,其中AgTCP23表達豐度最高,表明了ClassⅠ亞族基因與芹菜不同組織的形態(tài)建成、激素調節(jié)和脅迫反應等過程都密切相關。而ClassⅡ-b(AgTCP13~20)在3個組織中的表達水平均較低,表達水平沒有太大差異。但AgTCP1~12即使來自同一亞族,不同成員的表達方式也不同,大多數(shù)基因在葉片高表達,部分基因在根部表達水平較低。
如圖6B所示,ClassⅠ(AgTCP21~29)亞族在白色、綠色和紅色芹菜中的表達豐度較高。雖然ClassⅡ兩個亞族的表達豐度總體較低,但AgTCP6、AgTCP7和AgTCP12這3個基因的表達豐度卻較高。28個AgTCPs在白色、綠色和紅色芹菜3種芹菜中的表達豐度近似,而僅有AgTCP4在綠色芹菜的表達豐度較高而在白色和紅色芹菜表達中較低。
如圖6C所示,ClassⅡ-b亞族(AgTCP13~20)在高溫處理前后的表達水平較低,多數(shù)基因的表達呈下降的趨勢。而在ClassⅡ-a亞族中,AgTCPs的表達水平都較高,但在高溫處理2 h后表達有所下降,其中AgTCP12的表達水平在高溫處理4 h和24 h后又上調,但仍低于高溫處理前。ClassⅠ中的AgTCP24~29在高溫處理后表達水平明顯增加,尤其表現(xiàn)在高溫處理24 h后,表明ClassⅠ亞族可能與高溫脅迫下的應答有關。
圖6 AgTCPs在芹菜中的表達模式Figure 6 Different expression patterns of AgTCPs in celery
為驗證芹菜TCP家族ClassⅠ亞族成員(AgTCP21~29)基因在高溫脅迫下的應答模式,采用熒光定量PCR分析了AgTCP21~29在高溫脅迫狀態(tài)下的表達水平。結果如圖7所示,ClassⅠ亞族成員在高溫處理下都有一定程度的響應。AgTCP22和AgTCP25在高溫處理后,表達水平持續(xù)增加。AgTCP21、AgTCP23、AgTCP27、AgTCP28和 AgTCP29基因在處理后2 h、4 h時高表達,但隨著處理時間的增加,在24 h時表達有所下調。AgTCP24和AgTCP26基因在處理后2 h表達水平波動幅度較小,在4 h和24 h時其表達量顯著上升。同轉錄組數(shù)據(jù)比較,熒光定量驗證結果與轉錄表達豐度表現(xiàn)出較好的一致性,進一步表明ClassⅠ亞族成員可能參與了高溫脅迫的應答。
圖7 芹菜TCP家族ClassⅠ亞族成員在高溫脅迫下表達分析Figure 7 Relative expression levels of TCP genes of the ClassⅠin celery under heat temperature stress
TCP基因家族是一類高等植物所特有的轉錄因子,具有高度保守的結構域[30]。隨著高通量測序的發(fā)展,越來越多的植物完成了全基因組測序,多個物種的TCP家族成員被鑒定和分析。本研究采用生物信息學方法對芹菜TCP進行檢索,共鑒定了29個芹菜TCP家族成員。植物中TCP家族成員的數(shù)量相對保守,擬南芥中共鑒定到23個[31]、水稻22個[31]、高粱20個[32]、紫花苜蓿21個[33]和桃20個[34]。
本研究中進化關系分析表明,29個芹菜TCP蛋白可分為3大亞類:ClassⅠ(PCF)、ClassⅡ-a(CIN)和 ClassⅡ-b(CYC/TB1),這與前人對TCP轉錄因子的研究結果相似。植物在長期的進化過程,物種間既保留了共同祖先的一些特征,每個物種也會形成自己特有的特征。芹菜在進化過程中經歷了一次全基因組三倍化事件(雙子葉植物共有)和兩次全基因組二倍化事件,大量基因發(fā)生了擴增或收縮[24]。與擬南芥和水稻的各亞組成員數(shù)目相比,芹菜的ClassⅡ-b(CYC/TB1)亞族數(shù)目顯著多于水稻和擬南芥。暗示在芹菜進化過程中可能為了適應生存環(huán)境的變化,該亞組發(fā)生了擴增,在植物適應性方面發(fā)揮了潛在作用。根據(jù)進化樹分析的結果,聚類關系越是相近的基因,說明功能和結構更為相同或者相近。亞細胞定位分析推測絕大多數(shù)TCP基因位于細胞核中,可能發(fā)揮轉錄調控的功能。光響應的元件(如 Box 4、GT1-motif)、ABA 響應元件(ABRE)、茉莉酸甲酯響應元件(CGTCA-motif)、低溫(LTR)和傷誘導(W box)等順式作用元件在植物生長發(fā)育、植物激素反應和脅迫反應中具有重要的作用[35]。芹菜TCP成員富集了大量的順式元件,推測AgTCPs是芹菜非常重要的一類轉錄調控基因,可能參與了芹菜生長發(fā)育和多種生物學過程。前人研究也發(fā)現(xiàn)茶樹TCP啟動子中也分布了大量的與逆境相關的LTR、W box等順式作用元件[19]。小麥TCP成員啟動子也富含ABRE、CGTCA-motif等激素相關的順式作用元件[36]。在順式作用元件分析中,光響應相關元件Box 4、G-box在ClassⅡ-b中顯著富集,而GT1-motif在Class I中顯著富集。與脅迫反應相關順式元件ABRE在ClassⅡ中顯著富集,Class I中則顯著富集STRE元件。
系統(tǒng)發(fā)育和共線性分析是預測可能的遺傳和進化關系以及基因家族潛在功能的基礎。胡蘿卜和香菜與芹菜共線的基因占據(jù)多數(shù),且分別檢測到多對同源基因對,這強烈暗示了一定程度的功能相似性。探究芹菜TCP基因的功能,對傘形科其他物種的TCP基因研究具有較好的參考性。對芹菜TCP家族成員在不同的組織、不同品種及高溫脅迫中的表達模式進行分析,發(fā)現(xiàn)在3個基因亞族中,ClassⅠ(PCF)基因數(shù)目最多、表達范圍廣泛。ClassⅠ在根、葉柄和葉片3個組織中表達水平均較高,尤其是AgTCP23表達豐度最高,表明ClassⅠ亞族在芹菜不同組織形態(tài)形成有重要作用。芥菜中ClassⅠ成員在莖發(fā)育過程中顯示出較高的表達量[28],葡萄中ClassⅠ成員參與了植物生長中的多個器官如花芽、葉片、莖的發(fā)育[37]。還有研究表明,擬南芥中ClassⅠ類的成員AtTCP14和AtTCP15基因能夠有效延長下胚軸對生長素的反應,在植物發(fā)育中發(fā)揮重要作用[38]。對ClassⅠ亞組成員的啟動子分析也發(fā)現(xiàn)該亞組成員含有多種參與植物發(fā)育和激素調節(jié)的順式元件,尤其是GT1-motif、ABRE等,暗示芹菜該亞組成員在功能上與其他物種的ClassⅠ類的成員具有相似性。此外,不同顏色的芹菜品種中,ClassⅠ亞族成員(AgTCP21~29)在白色、綠色和紅色芹菜中的表達豐度都很高。也有研究報道,山茶中TCP20和TCP23轉錄因子參與了花青素合成調控[19]。但有關TCP成員參與花青素合成調控的具體機制還需進一步探究。在高溫脅迫下,相對于CK,大部分ClassⅠ成員的表達量被誘導并維持在較高的水平,這些基因可能參與了高溫脅迫下的應答,而ClassⅡ-a和ClassⅡ-b在高溫處理后表達量差異變化并不顯著。采用qRT-PCR對該ClassⅠ成員表達量進行驗證,熒光定量結果與轉錄組數(shù)據(jù)具有較好的一致性,進一步說明了ClassⅠ亞族成員參與了高溫脅迫應答。但在擬南芥的研究中,發(fā)現(xiàn)的能夠參與高溫應答的兩個基因TCP5和TCP17均屬于ClassⅡ-a的成員[22]。也有其他研究發(fā)現(xiàn)ClassⅠ亞族成員參與非生物的逆境應答,如過表達豇豆Class I亞族成員TCP9能夠顯著增強轉基因植株的抗旱性和耐鹽性[39]。芹菜TCP基因如何參與高溫調控的應答網絡,還有待于進一步的研究,將對解析芹菜響應高溫脅迫后進行適應性生長的機制具有重要意義。