韓立軍,劉寶玲,李潤(rùn)植,薛金愛(ài)
(山西農(nóng)業(yè)大學(xué) 分子農(nóng)業(yè)與生物能源研究所,山西 太谷 030801)
WRKY轉(zhuǎn)錄因子是指與真核基因啟動(dòng)子區(qū)域順式作用元件結(jié)合的DNA結(jié)合蛋白[1]。自ULMASOV等[1]從甘薯中鑒定出第1個(gè)WRKY家族轉(zhuǎn)錄因子SPF1以來(lái),WRKY家族轉(zhuǎn)錄因子相繼在水稻、小麥、番茄等多種植物中被發(fā)現(xiàn)[2-4]。WRKY因其蛋白含有高度保守的WRKYGQK七肽結(jié)構(gòu)而得名,每個(gè)家族成員具有1~2個(gè)七肽保守序列(N端)和1個(gè)鋅指結(jié)構(gòu)域(C端)構(gòu)成。WRKY域由60個(gè)氨基酸組成,C端為鋅指結(jié)構(gòu)C2H2(C-X4-5-C-X22-23-H-X-H)或C2HC(C-X7-C-X23-H-X-C)[5]。N端的WRKYGQK保守結(jié)構(gòu)域能識(shí)別并結(jié)合保守的DNA結(jié)合位點(diǎn)W-Box(TTTGACC/T)進(jìn)而調(diào)控靶基因的表達(dá)[6]。盡管WRKYGQK高度保守,但在擬南芥、大豆、水稻等植物中發(fā)現(xiàn)WRKYGQK與鋅指結(jié)構(gòu)發(fā)生了變異[7-10]。根據(jù)七肽保守序列數(shù)量和鋅指結(jié)構(gòu)的特點(diǎn)將WRKY蛋白家族分成了三大類,第Ⅰ類和第Ⅱ類含有C2H2型鋅指結(jié)構(gòu),差別在于第Ⅰ類含有2個(gè)七肽保守序列而第Ⅱ類僅含有1個(gè);第Ⅲ類則含有1個(gè)七肽保守序列和C2HC型鋅指結(jié)構(gòu)。其中,第Ⅰ類近N端七肽保守序列的DNA結(jié)合活性較弱,但近C端的七肽保守序列特異性增強(qiáng)與靶基因的結(jié)合[11-12]。WRKY作為植物最大的轉(zhuǎn)錄因子之一,廣泛參與植物的生長(zhǎng)發(fā)育、生理過(guò)程以及多種生物和非生物脅迫響應(yīng)等[13]。魏鑫等[14]通過(guò)構(gòu)建棉花GhWRKY33過(guò)表達(dá)載體并轉(zhuǎn)化擬南芥,結(jié)果發(fā)現(xiàn),GhWRKY33響應(yīng)干旱脅迫,過(guò)表達(dá)后能明顯提高轉(zhuǎn)基因擬南芥的抗旱性。蘇瑩等[15]研究發(fā)現(xiàn),GhWRKY41過(guò)表達(dá)株系中,GhWRKY41參與了棉花響應(yīng)鹽和干旱脅迫應(yīng)答過(guò)程,且過(guò)表達(dá)可提高轉(zhuǎn)基因棉花耐鹽性和耐旱性。嚴(yán)曉紅等[16]通過(guò)實(shí)時(shí)熒光定量PCR(qPCR)檢測(cè)干旱脅迫下萌發(fā)棉籽的子葉和胚根中WRKY的表達(dá)變化,結(jié)果發(fā)現(xiàn),WRKY主要在胚根中表達(dá)從而響應(yīng)干旱脅迫。雷煜等[17]利用VIGS沉默技術(shù)抑制GhWRKY22基因的表達(dá),發(fā)現(xiàn)沉默植株對(duì)大麗輪枝菌的敏感性增加,證明GhWRKY22基因正調(diào)控棉花的抗病性。劉秀芳[18]利用組織培養(yǎng)的方法將GhWRKY25異源轉(zhuǎn)化到本生煙中,結(jié)果獲得GhWRKY25超表達(dá)植株;與野生型本生煙相比,T3超表達(dá)GhWRKY25植株增強(qiáng)了對(duì)干旱脅迫的敏感性,并參與了ROS代謝路徑。目前,關(guān)于陸地棉中GhWRKY的研究多集中在生物及非生物脅迫方面[19],而對(duì)于WRKY參與種子萌發(fā)過(guò)程調(diào)控的研究鮮有報(bào)道。盡管已有研究表明,擬南芥AtWRKYⅠ亞家族中的AtWRKY2與種子萌發(fā)有關(guān)[20],但目前仍不清楚陸地棉WRKYⅠ亞家族成員是否也可能調(diào)控陸地棉種子萌發(fā)。
棉花作為我國(guó)重要的經(jīng)濟(jì)作物,其產(chǎn)量與品質(zhì)制約著與之相關(guān)產(chǎn)業(yè)的發(fā)展,系統(tǒng)鑒定異源四倍體陸地棉的WRKY轉(zhuǎn)錄因子家族,將有助于深入解析棉花的生長(zhǎng)發(fā)育和脅迫應(yīng)答等生命活動(dòng)的調(diào)控機(jī)制。本研究聚焦全基因組鑒定陸地棉(Gossypium hirsutum)GhWRKYⅠ亞家族,應(yīng)用組學(xué)工具檢測(cè)GhWRKYⅠ家族基因結(jié)構(gòu)、編碼蛋白理化性質(zhì)、進(jìn)化關(guān)系,基于轉(zhuǎn)錄組數(shù)據(jù)對(duì)陸地棉GhWRKYⅠ亞家族基因的組織表達(dá)差異和對(duì)多種非生物脅迫的應(yīng)答進(jìn)行了分析,進(jìn)一步論證了參與棉籽萌發(fā)調(diào)控的候選GhWRKY24基因的表達(dá)譜,研究結(jié)果將為GhWRKYⅠ亞家族蛋白生物學(xué)功能和棉籽萌發(fā)調(diào)控機(jī)制的研究提供新的科學(xué)參考。
從TAIR里獲取擬南芥WRKYⅠ所有蛋白序列,利用這些序列在棉花數(shù)據(jù)庫(kù)CottonFGD(https://cottonfgd.org/)進(jìn)行BLASTP,獲得陸地棉WRKYⅠ所有蛋白序列,通過(guò)同源性比對(duì)去掉重復(fù)序列后,在CDD(https://www.ncbi.nlm.nih.gov/cdd/?term=)中查找具有2個(gè)WRKY結(jié)構(gòu)域的所有序列,獲得GhWRKYⅠ亞家族所有成員。在CottonFGD中下載陸地棉基因組注釋文件,使用TBtools進(jìn)行染色體定位。
使 用LocTree3(https://rostlab.org/services/loctree3/)預(yù)測(cè)亞細(xì)胞定位,并在SIB(http://expasy.org/)中獲得GhWRKYⅠ亞家族成員的氨基酸數(shù)目、分子質(zhì)量、理論等電點(diǎn)、不穩(wěn)定系數(shù)、穩(wěn)定性和親水指數(shù)。利用Euk-mPLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)預(yù)測(cè)亞細(xì)胞定位。
從PlantFDB(http://planttfdb.gao-lab.org/)中獲得擬南芥、水稻W(wǎng)RKYⅠ亞家族蛋白序列(表1)。在MAGE 7.0軟件里采用鄰接法(Neighbor-joining,NJ)對(duì)擬南芥、水稻和陸地棉WRKYⅠ亞家族蛋白構(gòu)建系統(tǒng)進(jìn)化樹(shù),抽樣次數(shù)(Bootstrap)設(shè)置為1 000次。
表1 擬南芥和水稻W(wǎng)RKYⅠ基因登錄號(hào)Tab.1 Gene accession numbers of WRKYⅠsubfamily genes in Arabidopsis and rice
利用TBtools與陸地棉基因組注釋文件獲得GhWRKYⅠ蛋白,在CDD中分析GhWRKYⅠ蛋白的保守結(jié)構(gòu)域;利用在線網(wǎng)站MEME(http://memesuite.org/)預(yù)測(cè)陸地棉GhWRKYⅠ蛋白保守基序,保守基序數(shù)目為10;其他參數(shù)設(shè)定為默認(rèn)值。
利用GhWRKYⅠ亞家族蛋白序列在DNAMAN中進(jìn)行多重序列比對(duì),分析亞家族組內(nèi)成員的WRKY保守結(jié)構(gòu)域。
在棉花庫(kù)CottonFGD(https://cottonfgd.org/)中下載陸地棉WRKY基因家族在不同組織及冷、熱、鹽、PEG等4種脅迫下的相關(guān)數(shù)據(jù),利用軟件TBtools繪制GhWRKYⅠ亞家族基因組織表達(dá)及脅迫表達(dá)熱圖,對(duì)結(jié)果進(jìn)行分析。
將陸地棉(冀豐1271)在28℃、16 h光照/8 h黑暗條件下分別培養(yǎng)0、24、48、72 h,用于提取RNA并反轉(zhuǎn)錄為cDNA。利用實(shí)時(shí)熒光定量PCR(Quantitative Real-time PCR)檢測(cè)其表達(dá)量。根據(jù)轉(zhuǎn)錄組測(cè)序得到的GhWRKY24CDS序列,用Primer 6.0設(shè) 計(jì)qRT-PCR特異性引物(表2),并由上海生工公司合成引物。用實(shí)時(shí)熒光定量PCR儀進(jìn)行擴(kuò)增,總反應(yīng)體系為10 μL:TB Green為5 μL,ddH2O為3.4 μL,正反向引物各0.4 μL,cDNA為0.8 μL。反應(yīng)條件為:95℃5 s;59℃30 s,72℃30 s,共40個(gè)循環(huán)。以Histone作為內(nèi)參基因,每樣品設(shè)3次重復(fù),最終結(jié)果用2-ΔΔCt法計(jì)算基因相對(duì)表達(dá)量(0 h為對(duì)照)。
表2 GhWRKY24基因的qRT-PCR引物Tab.2 Primers for qRT-PCR of GhWRKY24 gene
通過(guò)篩選、整合,最終鑒定出35個(gè)具有2個(gè)七肽保守序列的GhWRKYⅠ亞家族基因,不均勻地分布在19條染色上(圖1),依次命名為GhWRKY1~GhWRKY35;其中,在A亞基因組的10條染色體上分布著19個(gè)GhWRKYⅠ基因,在D亞基因組的9條染色體上分布著16個(gè)GhWRKYⅠ基因,在D4染色體上分布的基因多達(dá)5個(gè),A4、A5、A7、A13、D13均含有3個(gè)GhWRKYⅠ,A8和D8上分布有2個(gè)GhWRKYⅠ,其余11條染色體各分布有1個(gè)GhWRKYⅠ。這些基因的分布取決于從原始的二倍體陸地棉進(jìn)化到四倍體陸地棉過(guò)程中相應(yīng)基因發(fā)生串聯(lián)重復(fù)等因素。
圖1 GhWRKYⅠ家族基因在染色體上的分布Fig.1 Distribution of GhWRKYⅠsubfamily genes on chromosomes
由表3可知,GhWRKYⅠ家族基因編碼的氨基酸數(shù)目為331(GhWRKY9)~769個(gè)(GhWRKY33),分子質(zhì)量在36.50(GhWRKY9)~82.87 ku(GhWRKY33)。有15個(gè)GhWRKYⅠ蛋白的理論等電點(diǎn)小于7,呈酸性,其余20個(gè)GhWRKYⅠ蛋白的理論等電點(diǎn)大于7,呈堿性。所有GhWRKYⅠ蛋白不穩(wěn)定系數(shù)均大于40,表現(xiàn)出不穩(wěn)定性。從親水指數(shù)來(lái)看,GhWRKYⅠ的所有成員都是親水性蛋白,均定位在細(xì)胞核中。
表3 GhWRKYⅠ基因及其編碼蛋白的理化性質(zhì)Tab.3 Physicochemical properties of GhWYKYⅠgene and its coding proteins
續(xù)表3 GhWRKYⅠ基因及其編碼蛋白的理化性質(zhì)Tab.3(Continued)Physicochemical properties of GhWYKYⅠgene and its coding proteins
通過(guò)聚類分析(圖2),發(fā)現(xiàn)陸地棉、擬南芥和水稻這3個(gè)物種的WRKYⅠ亞家族成員盡管同屬一類,但還是存在著3種不同的進(jìn)化方向,表明這3個(gè)物種在分化形成之前已經(jīng)發(fā)生了基因擴(kuò)增事件,它們可能在植物不同生理過(guò)程中發(fā)揮著不同的作用。從整體看,與擬南芥的聚類相比,與水稻關(guān)系更近,這可能與物種本身在進(jìn)化過(guò)程中陸地棉的GhWRKYⅠ的選擇壓力有關(guān)。
圖2 擬南芥、陸地棉、水稻W(wǎng)RKYⅠ蛋白的系統(tǒng)進(jìn)化樹(shù)Fig.2 Phylogenetic tree of WRKYⅠproteins from Arabidopsis,upland cotton and rice
如圖3所示,GhWRKYⅠ保守基序排序相似,數(shù)目為6~10個(gè),其中Motif1~Motif5最為保守。根據(jù)陸地棉基因組注釋文件檢測(cè)到,GhWRKYⅠ亞家族的保守結(jié)構(gòu)域都包含N端和C端的2個(gè)WRKY保守結(jié)構(gòu)域。從基因結(jié)構(gòu)看,GhWRKYⅠ亞家族具有3~6個(gè)外顯子和2~5個(gè)內(nèi)含子。
圖3 GhWRKYⅠ蛋白及基因結(jié)構(gòu)Fig.3 The structures of GhWRKYⅠgenes and their encoded proteins
GhWRKY3、GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY12、GhWRKY15不 具 有5'-UTR,其 余29個(gè)GhWRKYⅠ亞家族基因同時(shí)含有5'-UTR和3'-UTR序列。
對(duì)GhWRKYⅠ亞家族蛋白進(jìn)行多序列比對(duì),結(jié)果發(fā)現(xiàn)(圖4),各成員N端WRKY結(jié)構(gòu)域高度保守,但GhWRKY11蛋白C端WRKY保守結(jié)構(gòu)域的WRKYGQK序列突變?yōu)閃RNYGQK。除此之外,還檢測(cè)到C端的C2H2(C-X4-C-X23-H-X-H)型鋅指結(jié)構(gòu)。
圖4 GhWRKYⅠ蛋白多重序列比對(duì)Fig.4 Multiple sequence alignment of GhWRKYⅠproteins
由圖5可知,GhWRKYⅠ亞家族的多數(shù)基因都表現(xiàn)出了組織特異性和對(duì)不同的非生物脅迫的響應(yīng)特征,例如GhWRKY2、GhWRKY4、GhWRKY8、GhWRKY21、GhWRKY22、GhWRKY24、GhWRKY31在各個(gè)組織與多種非生物脅迫下都有著較高的表達(dá)量。
圖5 GhWRKYⅠ亞家族基因在不同組織及脅迫下的表達(dá)模式Fig.5 Expression patterns of GhWRKYⅠsubfamily genes in different tissues and various stresses
GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY14、GhWRKY18、GhWRKY23和GhWRKY29在不同組織及脅迫下表達(dá)量極低。結(jié)合進(jìn)化樹(shù)的分布情況可以看出,這些低表達(dá)的GhWRKYⅠ基因所在的染色體上還存在著1個(gè)或多個(gè)其他GhWRKYⅠ亞家族基因,這些表達(dá)量極低的基因可能是陸地棉在進(jìn)化過(guò)程中的冗余基因。
GhWRKY2、GhWRKY3、GhWRKY21和Gh-WRKY25在莖中表現(xiàn)出極高的表達(dá)量,表明它們很可能參與莖的形態(tài)建成。與其他亞家族成員相 比,GhWRKY2、GhWRKY21、GhWRKY24和GhWRKY25更多地在種子中高表達(dá),其中以GhWRKY24表達(dá)量最高,推測(cè)其與種子發(fā)育以及種子萌發(fā)有關(guān)。
進(jìn)一步檢測(cè)了GhWRKY24在陸地棉種子萌發(fā)過(guò)程中的表達(dá)譜,qRT-PCR結(jié)果表明(圖6),在陸地棉種子萌發(fā)的5 h內(nèi),GhWRKY24的表達(dá)量基本沒(méi)有升高,此時(shí),棉籽正處于吸漲時(shí)期,并無(wú)強(qiáng)烈生化反應(yīng);從10 h起,該基因表達(dá)量開(kāi)始升高,24~48 h表達(dá)量急劇增加,在72 h時(shí)相對(duì)表達(dá)量達(dá)到最高。基因表達(dá)譜分析顯示,GhWRKY24可能是參與棉花種子萌發(fā)生理生化調(diào)控的一個(gè)重要轉(zhuǎn)錄因子。
圖6 GhWRKY24在種子萌發(fā)過(guò)程的表達(dá)譜分析Fig.6 Expression analysis of GhWRKY24 during seed germination process
WRKY是植物中最大的一類轉(zhuǎn)錄因子,在植物的生長(zhǎng)、發(fā)育和逆境響應(yīng)方面發(fā)揮著重要功能。目前,對(duì)于棉花WRKY的研究大多集中在逆境脅迫響應(yīng)和參與植物衰老進(jìn)程[21-22],WRKY轉(zhuǎn)錄因子參與棉籽萌發(fā)過(guò)程調(diào)控的研究卻鮮有報(bào)道[19]。與棉花其他WRKY亞家族研究相比[23],有關(guān)陸地棉WRKYⅠ亞家族成員的鑒定,尤其是生物功能的研究有限。因此,鑒定異源四倍體陸地棉WRKYⅠ亞家族成員及其生物學(xué)功能可為全面解析棉花WRKY轉(zhuǎn)錄因子介導(dǎo)的調(diào)控網(wǎng)絡(luò)和棉花遺傳改良提供新的科學(xué)參考。
采用組學(xué)工具,本研究從陸地棉基因組共鑒定出35個(gè)含有2個(gè)WRKY保守域和C2H2型鋅指結(jié)構(gòu)的GhWRKYⅠ亞家族基因。這些基因不均勻地分布于A亞基因組和D亞基因組的19條染色體上,均為定位于細(xì)胞核的親水性蛋白,基因內(nèi)含子和外顯子分別為2~5個(gè)和3~6個(gè),其編碼331~769個(gè)氨基酸,其中15個(gè)WRKY蛋白為酸性蛋白,20個(gè)為堿性蛋白,這與其他植物轉(zhuǎn)錄因子的亞細(xì)胞定位一致[24-25]。GhWRKYⅠ亞家族蛋白保守基序的排列順序相似,但含有的基序數(shù)目差異較大,最少的僅有6個(gè),最多的有10個(gè)。盡管WRKY結(jié)構(gòu)域高度保守,但在擬南芥[7]、大豆[8]、水稻[9]等植物中發(fā)現(xiàn)了WRKYGQK肽鏈和鋅指結(jié)構(gòu)的變異。本研究中,GhWRKY11蛋 白C端WRKY保守結(jié)構(gòu) 域 的WRKYGQK序列突變?yōu)閃RNYGQK,而其他GhWRKYⅠ蛋白WRKY保守結(jié)構(gòu)域序列未出現(xiàn)變異。與之不同的是棉花其他WRKY亞家族蛋白的WRKY保守結(jié)構(gòu)域序列變異較多[26]。
WRKY蛋白聚類分析顯示,陸地棉、擬南芥、水稻的GhWRKYⅠ亞家族組內(nèi)成員之間存在著3種不同的進(jìn)化方向,表明這3個(gè)物種在分化形成之前已經(jīng)發(fā)生了基因擴(kuò)增事件?;蛑g的聚類分組,對(duì)于推測(cè)基因的生物學(xué)功能具有重要的參考價(jià)值。例如,AtWRKY11與AtWRKY17同為G2-d組,在擬南芥對(duì)丁香假單胞菌抗病性方面具有相似的功能[27]。與之相對(duì)應(yīng)的棉花GhWRKY成員也可能具有相似的功能,但這需要進(jìn)一步試驗(yàn)鑒定。根據(jù)轉(zhuǎn)錄組數(shù)據(jù),對(duì)陸地棉GhWRKYⅠ亞家族基因的組織與逆境表達(dá)模式進(jìn)行系統(tǒng)分析,發(fā)現(xiàn)
GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY14、GhWRKY18、GhWRKY23和GhWRKY29在不同組織及脅迫下未檢測(cè)到表達(dá),推測(cè)這些基因可能為陸地棉進(jìn)化過(guò)程中產(chǎn)生的冗余基因,這也是生物有機(jī)體減少外界不利環(huán)境對(duì)其生存影響的一種保險(xiǎn)對(duì)策[28]。GhWRKY2、GhWRKY4、GhWRKY8、
GhWRKY21、GhWRKY22、GhWRKY24、GhWRKY31在所測(cè)各組織中高水平表達(dá),預(yù)示著他們可能參與各個(gè)組織的生理生化反應(yīng)以及對(duì)多種非生物脅迫的響應(yīng),這些基因的多重生物學(xué)功能及調(diào)控機(jī)制有待深入研究。WRKY參與多種植物信號(hào)分子的調(diào)控途徑,其中赤霉素和生長(zhǎng)素均能調(diào)控莖的 伸 長(zhǎng)[29]。本 研 究 中,GhWRKY2、GhWRKY3、GhWRKY21和GhWRKY25在莖中顯著表達(dá),這4個(gè)棉花GhWRKYⅠ轉(zhuǎn)錄因子是否通過(guò)調(diào)控這2種激素來(lái)參與陸地棉莖的生長(zhǎng)還需要進(jìn)一步探究。
更重要的是,已有研究報(bào)道了一些棉花WRKY成員的功能。例如,轉(zhuǎn)基因擬南芥試驗(yàn)證明,棉花GhWRKY33負(fù)調(diào)控植物抗旱性[30];棉花GhWRKY22參與花藥和花粉的發(fā)育調(diào)控[31];GhWRKY27協(xié)同調(diào)控陸地棉衰老途徑[32];異源過(guò)表達(dá)棉花GhWRKY53導(dǎo)致擬南芥植株腺毛密度顯著增加[33]。與這些有關(guān)棉花WRKY的研究結(jié)果不同,本研究發(fā)現(xiàn),GhWRKY2、GhWRKY21、GhWRKY24和GhWRKY25在陸地棉種子中高度表達(dá),特別是GhWRKY24在棉花種子萌發(fā)過(guò)程中表達(dá)量顯著上調(diào),預(yù)示著GhWRKY24可能介導(dǎo)棉花種子萌發(fā)過(guò)程中生理生化的調(diào)控。擬南芥AtWRKY41敲除突變體顯著下調(diào)了ABI3并影響了種子休眠[34]。后續(xù)需要試驗(yàn)檢測(cè)GhWRKY24是否也能通過(guò)調(diào)控激素來(lái)參與種子萌發(fā)過(guò)程的調(diào)控。本研究結(jié)果為全面解析GhWRKYⅠ亞家族成員的生物學(xué)功能和棉花WRKY轉(zhuǎn)錄因子介導(dǎo)陸地棉種子萌發(fā)過(guò)程調(diào)控機(jī)制奠定了理論基礎(chǔ),亦為陸地棉遺傳改良提供了可挖掘的基因資源。