戴 麒,徐瑞強,李 寧,,王柏柯,王 娟,黃少勇,帕提古麗·艾斯木托拉,余慶輝
(1.新疆農(nóng)業(yè)科學(xué)院園藝作物研究所,烏魯木齊 830091;2.新疆農(nóng)業(yè)大學(xué)林學(xué)與園藝學(xué)院,烏魯木齊 830042)
【研究意義】轉(zhuǎn)錄因子是一類調(diào)控基因特異表達(dá)的蛋白質(zhì),真核生物中約有4%~7%的基因編碼轉(zhuǎn)錄因子[1]。GRF(Growth regulating factor)蛋白僅在植物中特異存在,特征為N’端含有QLQ和WRC兩個典型保守結(jié)構(gòu)域[2-3],其中QLQ結(jié)構(gòu)域與酵母Swi2/Snf2(Switch/Sucrose Non-fermentable)蛋白的N’段部分相似,可以結(jié)合其互作轉(zhuǎn)錄因子GIF中的SNH結(jié)構(gòu)域以調(diào)控啟動基因表達(dá)[4];WRC結(jié)構(gòu)域包含一個由3個半胱氨酸和1個組氨酸殘基組成的C3H基序,另外還包含大量堿性氨基酸殘基,C3H基序已被證明為DNA結(jié)合區(qū)域,而堿性氨基酸殘基則主要與GRF基因核定位有關(guān)[5-8]?!厩叭搜芯窟M(jìn)展】第一個GRF基因家族成員為水稻中發(fā)現(xiàn)的OsGRF1,主要調(diào)控赤霉素介導(dǎo)的深水稻節(jié)間分生組織生長受損[9]。GRF基因在擬南芥、水稻、棉花、葡萄、油菜等多種物種中已被報道[10-14]。GRF基因家族最初被認(rèn)為與植物葉和莖的生長發(fā)育有關(guān),擬南芥GRF4基因缺失突變導(dǎo)致葉片遠(yuǎn)小于正常植株,GRF2在植物幼嫩葉片中高表達(dá),通過促進(jìn)細(xì)胞增殖來促進(jìn)葉片生長[15];GRF基因?qū)﹂_花、果實發(fā)育及根生長同樣有調(diào)控作用,AtGRFs/GUS融合基因表達(dá)載體驗證顯示,GRF基因影響植株開花抽薹時間及雄性植株育性[16]?;趍iRNA396介導(dǎo)下的AtGRF7基因表達(dá)失調(diào)會導(dǎo)致擬南芥可再生根的數(shù)量下降和長度縮短[17];GRF基因也參與植物快速應(yīng)答和逆境響應(yīng)機制,滲透脅迫下擬南芥AtGRF7基因會與脫水反應(yīng)元件結(jié)合特定蛋白序列以維持植株生長[18],干旱和鹽脅迫下黃瓜CsGRF6基因會在6和12 h內(nèi)高度表達(dá)以應(yīng)對環(huán)境變化[19];GRF基因家族還被證明可提高蔬菜作物產(chǎn)量[20]、改善作物光合效能、提高油料作物種子質(zhì)量和含油量等[14]。潘那利番茄(S.pennellii)作為野生番茄資源具有含糖量高、可溶性固形物含量高的特點,同時潘那利番茄在抵御抵御生物和非生物脅迫上也較栽培番茄更具優(yōu)勢,并且也是番茄漸滲系構(gòu)建的主要野生親本之一[21]。【本研究切入點】GRF(Growth regulating factor)為一類植物特有的轉(zhuǎn)錄因子,參與調(diào)控多個植物生長發(fā)育過程,在植物抗逆防御等方面也發(fā)揮著重要作用。但有關(guān)潘那利番茄(S.pennellii)中GRF基因家族的研究尚無報道。前人已研究了栽培番茄中的13個GRF家族基因[22,23],但關(guān)于潘那利番茄中GRF基因家族特征及其參與潘那利番茄生長發(fā)育和遺傳進(jìn)化等過程仍未見報道?!緮M解決的關(guān)鍵問題】通過生物信息學(xué)技術(shù)鑒定潘那利番茄中的10個GRF家族基因,研究其理化性質(zhì)和保守基序,并與擬南芥和水稻中的GRF基因家族比較,分析潘那利番茄與其他物種中GRF基因家族的共線性關(guān)系,為研究潘那利番茄GRF家族基因的功能提供參考依據(jù)。
從擬南芥信息資源數(shù)據(jù)庫(https://www.arabidopsis.org/)中下載已報道的擬南芥GRF家族基因AtGRF1~9的蛋白序列,并下載擬南芥TAIR.10全基因組數(shù)據(jù)。從GeneBank中下載已報道的水稻GRF家族基因OsGRF1~12的蛋白序列。從茄科植物基因組數(shù)據(jù)庫(https://solgenomics.net/)中下載潘那利番茄Spenn-V2全基因組數(shù)據(jù)。
1.2.1 潘那利番茄GRF基因家族成員的鑒定及理化性質(zhì)
以擬南芥GRF家族和水稻GRF家族基因蛋白序列作為種子序列,本地構(gòu)建BLAST庫,比對潘那利番茄基因組提取GRF家族候選基因(E-value:1e-10),通過SMART(http://smart.embl.de/)、CDD-search(https://www.ncbi.nlm.nih.gov/cdd/)和PFAM(http://pfam.xfam.org/)三大數(shù)據(jù)庫分析GRF候選基因結(jié)構(gòu)域,刪除不含有典型結(jié)構(gòu)域QLQ(PF08880)和WRC(PF08879)的基因,每個基因保留一個代表轉(zhuǎn)錄本,最終獲得潘那利番茄中的GRF家族基因,并根據(jù)其在染色體上的位置命名為SpGRF1~10。
通過ExPASy在線數(shù)據(jù)庫ProtParam tool(http://www.expasy.org/protparam/)預(yù)測分析SpGRFs蛋白的氨基酸數(shù)目、等電點、脂肪指數(shù)等理化性質(zhì),通過WoLF PSORT(https://wolfpsort.hgc.jp/))在線軟件對蛋白亞細(xì)胞定位進(jìn)行預(yù)測[24]。
1.2.2 潘那利番茄GRF基因家族保守基序分析及系統(tǒng)進(jìn)化樹構(gòu)建
本地利用MEME(v4.12.0)搜索SpGRFs中的motif,搜索個數(shù)為10,motif長度范圍定義為6~50,通過TBtools繪制保守基序和基因結(jié)構(gòu)圖[25];根據(jù)SpGRFs基因在染色體上的位置信息,通過MapChart繪制染色體核型圖;使用MEGA7.0軟件對擬南芥、水稻和潘那利番茄的GRF家族蛋白序列進(jìn)行多序列比對,并采用鄰接法(Neighbor-joining)構(gòu)建系統(tǒng)進(jìn)化樹,其中自舉法分析(Bootstrap)數(shù)值設(shè)定為2000,運用泊松模型(Poisson correction)[26]。
1.2.3 潘那利番茄GRF基因家族順式作用元件和共線性
提取潘那利番茄中GRF家族基因啟動子序列(翻譯起始點上游1 500 bp),采用PlantCARE數(shù)據(jù)庫中Search for CARE工具預(yù)測SpGRFs基因順式作用元件,使用GSDS(http://gsds.gao-lab.org/)在線軟件繪制順式作用元件分布圖;使用McscanX提取SpGRFs共線性基因,使用Circos軟件繪制物種內(nèi)共線性圖,使用Python函數(shù)比對AtGRFs和SpGRFs、OsGRFs間的共線性基因,并繪制物種間共線性圖[27]。
研究表明,以擬南芥、水稻中的GRF基因家族蛋白序列AtGRFs和OsGRFs作為種子序列,通過本地BLAST比對,從潘那利番茄基因組中初步得到13條GRF基因序列,刪除不含有典型典型結(jié)構(gòu)域QLQ和WRC和重復(fù)的序列,獲得10個GRF序列。根據(jù)其在基因組上的位置順序,將其命名為SpGRF1~SpGRF10。表1
研究表明,SpGRFs的蛋白大小為202~604 aa,分子量為23 232.7~64 906.7 Da,等電點在6.69~9.31。SpGRFs的蛋白序列較穩(wěn)定,大多數(shù)蛋白為堿性蛋白,且具有良好親水性。SpGRFs蛋白主要位于細(xì)胞核(N)中,部分蛋白在細(xì)胞質(zhì)(Cy)和葉綠體(Ch)中也有分布,僅有SpGRF1和SpGRF4分別特異分布在細(xì)胞外(E)和質(zhì)膜(PM)中。表1
表1 SpGRFs基因家族理化性質(zhì)Table 1 SpGRFs gene family physicochemical properties
10個SpGRFs基因不均等分布在潘那利番茄的7條染色體上,分別為1號、2號、3號、4號、7號、8號和10號染色體,其中8號染色體上包含SpGRF6、SpGRF7、SpGRF8和SpGRF9四個基因,其余每條染色體上各分布有一個基因。圖1
圖1 SpGRFs基因家族染色體核型Fig.1 SpGRfs gene family Karyotype mapping
研究表明,潘那利番茄GRF基因家族可分為Ⅰ和Ⅱ兩大類,其中Ⅰ包含SpGRF3、SpGRF8和SpGRF9,Ⅱ包含SpGRF1、SpGRF2、SpGRF4、SpGRF5、SpGRF6、SpGRF7、SpGRF10。依據(jù)擬南芥和水稻的分組情況,10個SpGRF可分為6組,分別為GROUP1~6,其中GROUP1和GROUP2均由3種植物基因家族成員組成。GROUP3、GROUP4和GROUP5僅包含擬南芥和番茄中的GRF基因家族成員,GROUP6中僅包含水稻和番茄中的家族成員。潘那利番茄GRF家族成員中,SpGRF8與水稻中GRF基因的同源性更高,SpGRF1、SpGRF3、SpGRF9和SpGRF10與擬南芥GRF基因的同源性更高,SpGRFs基因在各組中均有分布,潘那利番茄中的GRF基因家族進(jìn)化程度完整。圖2,圖3
圖2 SpGRFs基因家族進(jìn)化樹Fig.2 SpGRFs gene family cladogram
圖3 多物種間GRF基因家族進(jìn)化關(guān)系Fig.3 GRF gene family evolutionary relationships among multiple species
研究表明,不同SpGRFs中基序數(shù)目和分布有所不同。其中Motif1和Motif2分別為QLQ和WRC保守結(jié)構(gòu)域,在所有SpGRFs基因中均有分布,其中除SpGRF1含有兩個WRC保守結(jié)構(gòu)域以外,其余基因中兩種保守結(jié)構(gòu)域數(shù)量均為1個,SpGRFs基因家族的完整性和準(zhǔn)確性。SpGRF2、SpGRF4、SpGRF5、SpGRF6和SpGRF7進(jìn)化距離較近,在蛋白序列上也顯示出相似基序,其功能表達(dá)也基本相似。SpGRFs基因中包含2~5個內(nèi)含子,不同亞家族基因之間存在結(jié)構(gòu)差異,潘那利番茄中GRF家族基因并非由簡單復(fù)制得來。圖4,圖5
注:A.基因結(jié)構(gòu)(外顯子/內(nèi)含子分布);B.保守基序分布。相同顏色的方塊代表相同的基序
圖5 SpGRFs蛋白的基序Fig.5 SpGRFs gene family Motifs of the protein
研究表明,潘那利番茄GRF基因家族上游1 500 bp啟動子序列中的順式作用元件進(jìn)行預(yù)測,共預(yù)測到58種順式作用元件。10個SpGRF基因中分別包含3~10種光響應(yīng)元件、0~8種激素響應(yīng)元件和1~6種脅迫響應(yīng)元件。根據(jù)順式作用元件的數(shù)目,選擇與光響應(yīng)有關(guān)的順式作用元件Box-4、G-Box、GT1-motif和chs-CMA1a,與激素響應(yīng)相關(guān)的順式元件ABRE、CGTCA-motif和ERE,以及與脅迫響應(yīng)相關(guān)的ARE、MBS和WUN-motif繪制順式作用元件分布圖。3種順式作用元件在SpGRFs啟動子序列中分布均勻,所有基因中都存在與光響應(yīng)和激素響應(yīng)相關(guān)的順式作用元件,由此推測潘那利番茄中GRF基因主要調(diào)控特征與光和激素有關(guān),同時SpGRF3、SpGRF6和SpGRF9中沒有與脅迫響應(yīng)相關(guān)的作用元件,3個基因?qū)δ婢巢幻舾?,SpGRF9中含有的順式作用元件最多,在基因表達(dá)調(diào)控中可能起重要作用。除光、激素和脅迫響應(yīng)元件外,GRF基因家族啟動子序列中還存在O2-site、HD-Zip III等與生長發(fā)育相關(guān)元件。潘那利番茄中的GRF基因家族可能參與生長發(fā)育及逆境響應(yīng)相關(guān)的多種功能。圖6
研究表明,潘那利番茄GRF基因家族存在3個旁系同源基因?qū)?,分別為SpGRF2/SpGRF4、SpGRF3/SpGRF9和SpGRF6/SpGRF7,其中SpGRF2/SpGRF4旁系同源基因?qū)碓从?號染色體和4號染色體的片段復(fù)制(Segmental),SpGRF3/SpGRF9旁系同源基因?qū)碓从?號染色體和7號染色體的片段復(fù)制,SpGRF6/SpGRF7旁系同源基因?qū)ξ挥谕粭l8號染色體上的片段復(fù)制。通過KAKS_Calculator 2.0計算3個同源基因?qū)χg的替換率,SpGRF6/SpGRF7和SpGRF2/SpGRF4旁系同源基因?qū)Φ腒a/Ks值均小于1,這兩對基因的進(jìn)化受到了純化選擇壓力的影響,基因功能趨向保守,且進(jìn)化速率減慢,而SpGRF3/SpGRF9旁系同源基因?qū)Φ腒a/Ks大于1,基因受到正選擇,正處于快速進(jìn)化階段,該對基因?qū)ε四抢训倪M(jìn)化有重要意義。根據(jù)茄科植物分化速率R(0.19重排/染色體Mya),3個基因?qū)Φ姆只瘯r間,SpGRF6/SpGRF7是潘那利番茄GRF家族基因中最早發(fā)生片段復(fù)制的一對基因,距今大約2.835 Mya,而SpGRF2/SpGRF4和SpGRF3/SpGRF9兩對、基因分化時間稍短,分別為2.648 Mya和2.287 Mya,這也與其進(jìn)化速率的結(jié)果相吻合。圖7,表2
表2 GRF旁系同源基因KaKs分析及分化時間計算Table 2 Analysis of spgrf paralog KaKs and calculation of differentiation time
圖7 SpGRFs基因家族種內(nèi)共線性Fig.7 SpGRFs gene family intraspecies colinearity analysis
研究表明,擬南芥中共有9個GRF基因,分別為AtGRF1~AtGRF9,SpGRFs中有6個基因與AtGRFs為直系同源基因,分別為SpGRF1、SpGRF2、SpGRF4、SpGRF8、SpGRF9和SpGRF10,其中SpGRF1和SpGRF8都與AtGRF9有共線性,SpGRF2和SpGRF4都與AtGRF1有共線性,這表明這兩對基因可能分別調(diào)控相似或互補的功能。水稻中共有12個GRF家族成員,其中有3個基因與潘那利番茄中的GRF基因存在共線性關(guān)系,位于2號染色體的OsGRF10和位于4號染色體的OsGRF12都與SpGRF1存在共線性關(guān)系,位于3號染色體的OsGRF6與SpGRF2共線性。水稻中SpGRFs的直系同源基因數(shù)目較少,番茄中該基因家族與擬南芥親緣關(guān)系更近。所有存在直系同源基因SpGRFs中,僅有SpGRF1、SpGRF2和SpGRF10與2個水稻或擬南芥GRF基因有共線性關(guān)系,表明SpGRF1、SpGRF2和SpGRF10很可能在潘那利番茄GRF基因家族的進(jìn)化中起著重要作用。同時潘那利番茄GRF基因家族中SpGRF3、SpGRF5、SPGRF6和SpGRF7與擬南芥和水稻基因組均無共線性關(guān)系,這4個基因為潘那利番茄特有基因,并參與其特異功能的表達(dá)。圖8
注:從上往下依次為水稻(藍(lán)色)、潘那利番茄(紅色)和擬南芥(綠色)的基因組,紅線為共線性關(guān)系
深度測序技術(shù)的不斷發(fā)展提高了基因組學(xué)研究的分辨率和精確度,但針對全基因組范圍內(nèi)的測序總是無法避免個別基因序列注釋錯誤,因而聚焦少數(shù)基因反復(fù)預(yù)測和驗證對基因組學(xué)研究有深遠(yuǎn)意義[28]。自2012年番茄基因組公布以來,有關(guān)報道多數(shù)集中在栽培種番茄中[7]。
潘那利番茄中共有10個GRF基因家族成員,與擬南芥、葡萄、水稻相似,少于香蕉、芝麻、龍眼。所有SpGRFs均含有QLQ和WRC結(jié)構(gòu)域,且含有3或4個外顯子,染色體定位的結(jié)果顯示10個SpGRF基因分布在7條染色體上,其中第8條染色體上有4個SpGRF基因,其余每條染色體上一個,與辣椒中GRF基因的分布類似[29],GRF基因家族氨基酸數(shù)目通常為300~600 aa,而預(yù)測結(jié)果顯示SpGRF8僅含有202 aa,遠(yuǎn)小于常規(guī)GRF蛋白大小,推測為功能冗余的假基因。依據(jù)與擬南芥和水稻中的親緣關(guān)系,SpGRFs被分為6個亞家族,這點與前人結(jié)論基本一致[30],不同亞家族中,GROUP1包含的3個SpGRF和GROUP2包含的2個SpGRF基因,各自與其亞家族內(nèi)部的其他基因有著相似的基因結(jié)構(gòu)和保守基序,而其余5個SpGRF基因則無明顯的相似性。除了保守結(jié)構(gòu)域外,GRF蛋白還往往在C’端含有FFD、TQL基序或其他氨基酸殘基,導(dǎo)致其調(diào)控蛋白的多樣化[31],研究中SpGRFs有7個基因至少含有FFD或TQL中的一個,SpGRF1基因C’端出現(xiàn)了一個重復(fù)的WRC域,這與擬南芥中的AtGRF9基因類似,可能同樣調(diào)控植物花蕾的發(fā)育[32]。
對潘那利番茄GRF基因啟動子序列的預(yù)測,發(fā)現(xiàn)了包括MYB等啟動子在內(nèi)的58種順式作用元件,這表明SpGRFs基因參與介導(dǎo)多種潘那利番茄生命活動。對光、脅迫和激素響應(yīng)元件分析顯示,所有SpGRFs中光響應(yīng)順勢作用元件分布最為廣泛,每個SpGRF基因中均存在3個及以上的光響應(yīng)元件,其中又以BOX-4和G-BOX為主,SpGRFs有著較為敏感的光應(yīng)答途徑,這與GRF在其他植物中表現(xiàn)有所出入[33,13,14,28],而栽培種番茄中亦未見相關(guān)報道,推測可能是由于潘那利番茄本身特性所引起的表達(dá)偏好。與激素響應(yīng)相關(guān)的順式作用元件同樣存在于所有SpGRFs基因的啟動子序列中,如GA、ABA、水楊酸等響應(yīng)元件,SpGRFs基因家族可能通過參與介導(dǎo)激素調(diào)控植物生長發(fā)育[34]。
提取比對共線性基因發(fā)現(xiàn),潘那利番茄中一共有三對共線性基因,組內(nèi)同源性相對較高。非同義替換(Ka)和同義替換(Ks)的比例一定程度上反應(yīng)了基因進(jìn)化所受的選擇壓力大小。各物種中關(guān)于GRF基因家族Ka/Ks的研究相對較少,香蕉中該家族基因MaGRFs的Ka/Ks值在0.171~0.521[33],大豆中GmGRFs的Ka/Ks值在0.123~1.96[35],梨中這一值在0.070~0.167[11],GRF基因家族的Ka/Ks值無論在物種間還是物種內(nèi)均有較大差異,一些物種中的GRF家族基因仍處于快速進(jìn)化狀態(tài)。研究中,SpGRF3/SpGRF9基因?qū)Φ腒a/Ks略大于1,SpGRF2/SpGRF4和SpGRF6/SpGRF7基因?qū)Φ腒a/Ks略小于1,潘那利番茄中SpGRFs受到自然選擇的壓力不大,而結(jié)構(gòu)和保守基序分析排除了SpGRF3與SpGRF9假基因的可能,該對旁系同源基因?qū)ε四抢阎蠫RF家族的進(jìn)化有重要意義。染色體分布顯示,SpGRF2/SpGRF4和SpGRF3/SpGRF9基因?qū)Ψ植荚诓煌旧w上,SpGRF6/SpGRF7基因?qū)﹄m在同一條染色體上,但中間基因較多,因此推測潘那利番茄中所有的GRF家族同源基因都來自于片段復(fù)制。
對潘那利番茄、擬南芥和水稻中GRF家族基因共線性分析,結(jié)果顯示潘那利番茄與擬南芥的同源性較高,與水稻的親緣關(guān)系更遠(yuǎn),潘那利番茄與擬南芥在進(jìn)化上有相近的親緣關(guān)系,同時多物種之間GRF基因家族的同源性也證明該基因家族在進(jìn)化中較為保守,且在起源上有共同的祖先,這點與前人研究一致[36]。而SpGRF1、SpGRF2、SpGRF10均有多個直系同源基因,這3個基因在SpGRFs基因家族進(jìn)化中起到重要作用。GRF基因家族受miRNA396反向調(diào)控[37],潘那利番茄小RNA測序數(shù)據(jù)不夠完善,關(guān)于SpGRFs基因的miRNA調(diào)控機制仍有待研究。
從潘那利番茄基因組中鑒定獲得了可進(jìn)一步分為6個亞家族的10個SpGRF基因,SpGRFs蛋白主要位于細(xì)胞核中,除了SpGRF1和SpGRF4分別特異分布在細(xì)胞外和質(zhì)膜中。