張彥楠 蔡大潤 黃先忠石河子大學生命科學學院/植物基因組學實驗室,新疆石河子 832003
?
亞洲棉bZIP蛋白家族的鑒定及GaFD基因的組織表達分析
張彥楠 蔡大潤 黃先忠*
石河子大學生命科學學院/植物基因組學實驗室,新疆石河子 832003
摘 要:堿性亮氨酸拉鏈(basic leucine zipper,bZIP)是真核生物中數(shù)量最多并且最具多樣性的轉(zhuǎn)錄因子之一,參與植物生長發(fā)育及響應生物和非生物脅迫。本研究利用亞洲棉(Gossypium arboreum)全基因組數(shù)據(jù)庫,通過生物信息學分析分布在13條染色體上的159個bZIP家族基因的全序列。系統(tǒng)進化、基因結(jié)構(gòu)和保守基序分析表明這些基因分成13個亞家族。其中,A亞家族有3個GaFD基因GaFD1、GaFD2和GaFD3,通過實時熒光定量PCR分析3個GaFD基因在不同組織中的表達,結(jié)果表明GaFD1和GaFD2在SAM中的表達量最高,GaFD3在莖中表達量最高。研究表明棉花基因組中具有數(shù)量眾多的bZIP家族成員,不同基因結(jié)構(gòu)及FD基因不同的表達特征表明bZIP基因在棉花生長發(fā)育中可能具有不同的功能,這些結(jié)果為進一步解析棉花bZIP家族基因的功能和作用機理積累了有價值的資料。
關(guān)鍵詞:堿性亮氨酸拉鏈;亞洲棉;FD;進化分析;基因表達
本研究由教育部新世紀優(yōu)秀人才支持計劃項目(NCET-12-1072),國家自然科學基金項目(31360366)和新疆生產(chǎn)建設兵團博士基金項目(2012BB007)資助。
This study was supported by the Program for New Century Excellent Talents in University of Ministry of Education of China (NCET-12-1072),the National Natural Science Foundation of China (31360366),and Program for Doctor Foundation in XinJiang Production and Construction Corps (2012BB007).
第一作者聯(lián)系方式∶ E-mail∶ zhangyn0513@163.com,Tel∶ 0993-2057262
URL∶ http∶//www.cnki.net/kcms/detail/11.1809.S.20160314.1444.002.html
在生物體中,轉(zhuǎn)錄因子(TF)負責調(diào)控基因的表達,堿性亮氨酸拉鏈(bZIP)轉(zhuǎn)錄因子是最大并且最具多樣性的轉(zhuǎn)錄因子家族之一。bZIP轉(zhuǎn)錄因子根據(jù)它們共有的 bZIP保守結(jié)構(gòu)域而被命名。bZIP結(jié)構(gòu)域由一個堿性區(qū)域和一個亮氨酸拉鏈區(qū)域組成,包含60~80個氨基酸,其中堿性區(qū)域具有一個含18個氨基酸殘基的保守基序 N-x7-R/K-x9,這個區(qū)域的作用是參與細胞核定位和DNA結(jié)合;亮氨酸拉鏈結(jié)構(gòu)域的特征是每7個氨基酸的第7位含有一個亮氨酸(Leu),或者還含有其他疏水性氨基酸,比如異亮氨酸(Ile)、纈氨酸(Val)、苯丙氨酸(Phe)和甲硫氨酸(Met),該結(jié)構(gòu)域參與bZIP蛋白與DNA結(jié)合之前的二聚體化[1]。植物bZIP蛋白能與含有AGCT核心區(qū)域的DNA序列元件特異性結(jié)合,并且優(yōu)先與G-box (CACGTG)、C-box (GACGTC)和A-box (TACGTA)結(jié)合[2]。當bZIP蛋白與DNA序列相互作用時,其堿性結(jié)構(gòu)域的N端插入DNA雙鏈的大溝,同時亮氨酸拉鏈的C端二聚體化而形成一個疊加的卷曲螺旋[3-4]。隨著更多真核生物基因組測序的完成,越來越多物種的bZIP轉(zhuǎn)錄因子家族已被鑒定或者預測[5-12]。但在植物中只有很少一部分 bZIP轉(zhuǎn)錄因子的功能被確定。已有的研究表明植物bZIP蛋白參與許多器官和組織的分化、種子萌發(fā)[13]、花序及葉片的發(fā)育[14];另一方面,bZIP蛋白還參與信號傳遞和響應生物、非生物刺激,比如脫落酸(ABA)信號、滲透作用、組織缺氧、干旱、高鹽和冷脅迫[15],以及病原體防御等[16];bZIP蛋白也響應光效應,并且參與光形態(tài)建成[17]。
根據(jù)堿性結(jié)構(gòu)域和其它保守基序的特征,將擬南芥的75個bZIPs基因劃分為A、B、C、D、E、F、G、H、I和S類10個亞家族[9]。其中A亞族中有少部分bZIPs基因已被克隆,如ABF和AREB主要在ABA 和脅迫信號調(diào)控網(wǎng)絡中發(fā)揮重要作用[15,18];ABI5主要參與種子萌發(fā)和早期幼苗的發(fā)育[13,19]。A亞家族中的 FD基因?qū)χ参飩?cè)枝發(fā)育、花序形成和開花起到重要作用[14,20]。擬南芥開花位點T控制基因 FT編碼成花素(Florigen)蛋白,成花素在葉片中合成,經(jīng)過韌皮部到達頂端分生組織(SAM),與在SAM產(chǎn)生的FD蛋白結(jié)合,促進下游開花身份相關(guān)基因如 AP1等表達,進而促進開花[20];水稻 Hd3a編碼的蛋白是水稻中的成花激素,在水稻 SAM 中,Hd3a、成花素受體蛋白14-3-3與OsFD1相互作用,形成一個成花素激活復合物FAC來促進水稻開花[21],而Hd3a、14-3-3和OsFD2蛋白形成一個FAC來調(diào)節(jié)葉片的發(fā)育[14]。在玉米C亞家族中,O2通過和PBF蛋白相互作用調(diào)控胚乳發(fā)育[22]。D亞族參與防御病害和生理生長兩種不同進程[23-27]。G亞家族的成員參與光應答啟動子的調(diào)節(jié)[28]和種子的成熟[29]。H亞家族HY5參與光形態(tài)發(fā)生和光信號轉(zhuǎn)導,進而影響下胚軸和根的發(fā)育[18]。I亞家族中,煙草 RSG和番茄 VSF-1基因調(diào)節(jié)植物的生長發(fā)育[30-31]。S亞家族是擬南芥 bZIP家族中成員最多的,但是只有 ATB2基因功能研究的報道,表明ATB2與平衡碳水化合物的供需有關(guān)[32],此外,一些 S亞家族的同源基因在脅迫后能激活轉(zhuǎn)錄和在花的特定部位特異性表達[33-34]。
異源四倍體陸地棉(Gossypium hirsutum)占全世界栽培種棉花的 90%以上,是可再生的紡織用纖維的主要來源,還能產(chǎn)生油料種子[35]。陸地棉的 2個現(xiàn)存的祖親屬亞洲棉(Gossypium arboreum)和雷蒙德氏棉(Gossypium raimondii)的基因組測序的完成[36-37],為二倍體棉花 bZIP轉(zhuǎn)錄因子家族的分析提供了數(shù)據(jù)支持,并且隨著異源四倍體陸地棉[38-39]、海島棉基因組的測序[40],進一步加快了棉花生物技術(shù)的進步。bZIP蛋白在棉花整個發(fā)育過程中起重要的作用,尤其是bZIP家族的FD基因,與棉花花器官的發(fā)育和開花有關(guān)。本研究利用二倍體棉花基因組數(shù)據(jù)庫鑒定亞洲棉bZIP家族成員,并查找bZIP家族FD基因序列,分析 FD基因在亞洲棉不同組織中的表達特征,為進一步研究棉花bZIP家族基因的功能奠定了基礎(chǔ)。
1.1 試驗材料
亞洲棉(G. arboreum)中亞1號A由國家種質(zhì)三亞野生苗圃提供。2015年4月 26日將其種植于石河子大學試驗農(nóng)場。播種后40 d采集根、莖、真葉,在解剖鏡下剝?nèi)ト~片將SAM分離出來;采集開花當天的花、雌蕊和雄蕊以及20 d的棉鈴,將胚珠從棉桃中剝離。所有棉花組織立即浸沒于液氮中,-80℃保存?zhèn)溆谩?/p>
1.2 亞洲棉bZIP家族基因的查找
通過 NCBI的全基因組鳥槍(whole-genome shotgun contigs,WGS)數(shù)據(jù)庫(http∶//www.ncbi.nlm. nih.gov/)獲得亞洲棉(G. arboreum)全基因組序列,分別從擬南芥轉(zhuǎn)錄因子數(shù)據(jù)庫(DATF) (http∶//datf.cbi. pku.edu.cn/)和植物轉(zhuǎn)錄因子數(shù)據(jù)庫v2.0 (Plant TFDB) (http∶//planttfdb.cbi.edu.cn/)獲得擬南芥和雷蒙德氏棉bZIP轉(zhuǎn)錄因子序列。分別以擬南芥和雷蒙德氏棉的bZIP基因的開放閱讀框序列(ORF)為查詢序列(query),運行TBLASTX,選擇數(shù)據(jù)庫wgs、物種 G. arboreum,其他為缺省值,搜索亞洲棉基因組上的bZIP基因序列,選擇比對結(jié)果中E值小于E-10的序列。通過MegAlign在線軟件比對分析雷蒙德氏棉和獲得的亞洲棉的 bZIP基因序列,獲得亞洲棉bZIP基因的 ORF序列。用 SMART (http∶//smart. emblheidelberg.de/)和Pfam (http∶//pfam.sanger.ac.uk/)軟件鑒定亞洲棉 bZIP基因編碼的蛋白序列是否存在 bZIP結(jié)構(gòu),參數(shù)設置為缺省值,去除非全長的短片段以及相同基因的冗余序列,保存完整且具有表達信息的基因序列用于下一步分析,最終確定亞洲棉基因組中bZIP基因的序列。
1.3 亞洲棉bZIP家族進化樹的構(gòu)建
利用ClustalX2程序比對159個亞洲棉、13個擬南芥[9](https∶//www.arabidopsis.org/)和11個水稻[10](http∶//rice.plantbiology.msu.edu/)的 bZIPs蛋白的序列,通過 MEGA5.1軟件分析系統(tǒng)發(fā)育和分子進化,以鄰位相連法(Neighbor-Joining,NJ)構(gòu)建進化樹[41],運用p-distance模型,BootStrap參數(shù)設置為1000次重復,使分支結(jié)果更為可靠。
1.4 亞洲棉bZIP家族保守結(jié)構(gòu)的鑒定
利用在線MEME分析工具(MEME version 4.8.1)(http∶//meme.sdsc.edu/meme/cgi-bin/meme.cgi)鑒 定亞洲棉bZIP轉(zhuǎn)錄因子除bZIP結(jié)構(gòu)以外的保守基序,設置基序的最小寬度、最大寬度和最大數(shù)量,分別限制為6、200和25。由最低E-value < E-48值確定基序的最終數(shù)量,根據(jù)這些基序在MEME中的位置順序和出現(xiàn)的頻率確定亞洲棉 bZIP家族序列所屬的亞家族。
1.5 亞洲棉 bZIP家族基因結(jié)構(gòu)和保守內(nèi)含子剪接位點分析
利用在線軟件 Gene Structure Display Server (GSDS) (http∶//gsds.cbi.pku.edu.cn/)分析亞洲棉bZIP基因外顯子/內(nèi)含子(intron-exon)的分布和內(nèi)含子的剪接位點。
1.6 亞洲棉GaFD基因的查找
以擬南芥的1個bZIP A亞家族基因AtFD (Gen-Bank登錄號為AT4G35900)的ORF序列為query,運行TBLASTX,選擇數(shù)據(jù)庫wgs、物種G. arboreum,搜索亞洲棉FD基因,選擇比對結(jié)果中E值小于E-10的序列。利用NCBI的BlastN工具(參數(shù)設置為缺省值)比對分析GaFD基因與GenBank數(shù)據(jù)庫中其他物種FD基因的相似性,同時運用Clustal X2程序比對GaFD和其他物種 FD蛋白的氨基酸序列,并且通過進化分析和氨基酸序列的相似性將GaFD基因命名。
1.7 總RNA的提取和cDNA第1鏈的合成
采用杭州博日科技有限公司(BIOER) Biospin多糖多酚植物總RNA提取試劑盒,參照其說明書,提取亞洲棉不同組織的總RNA;利用北京百泰克公司的Supermo III M-MLV反轉(zhuǎn)錄酶,參照試劑盒說明書,合成cDNA第1鏈。
1.8 GaFD基因的組織表達分析
根據(jù)上述分析得到 GaFD基因的序列,設計實時熒光定量qRT-PCR分析的引物(表1),內(nèi)參基因為棉花的Ubiquitin7。以亞洲棉不同組織的cDNA為模板,采用北京康為世紀有限公司 FASTSYBR Mixture (With ROX)試劑盒,利用7500 Fast實時熒光定量PCR儀(Life Technologies,F(xiàn)oster City,CA,USA)檢測基因表達量。檢測每份樣品目的基因和內(nèi)參基因的 CT值(循環(huán)閾值),每份樣品 3次重復,并且進行3次獨立的實驗。
qRT-PCR總體系含cDNA 30 ng、2 × FASTSYBR混合物5.0 μL、基因特異正向引物(10 μmol L-1) 0.2 μL、反向引物(10 μmol L-1) 0.2 μL,用RNase-Free H2O補足到10.0 μL。采用二步法PCR,反應程序為95℃預熱10 min,95℃ 15 s,60℃ 1 min,共40個循環(huán),熔解曲線階段為儀器默認程序。采用2-ΔCT法分析試驗數(shù)據(jù),先分別計算出每組的 ΔCT= CT目的基因-CT內(nèi)參基因,再根據(jù) ΔCT值求出 2-ΔCT及標準誤,使用Microsoft Excel 2010軟件處理數(shù)據(jù)。
2.1 亞洲棉bZIP家族的鑒定
通過比對分析亞洲棉基因組數(shù)據(jù)庫,共獲得159個GabZIPs基因,它們分布于94個基因組鳥槍序列(shotgun contigs)上,被命名為GabZIP1~GabZIP94,由相同 shotgun contigs編碼的不同的bZIP蛋白共享一個基因名(用額外的小數(shù)部分區(qū)分),比如GabZIP1.1~GabZIP1.3。159個GabZIPs基因分布于13條染色體上,其中第1染色體上有6條序列,第2染色體上有6條序列,第3染色體上有12條序列,第4染色體上有11條序列,第5染色體上有19條序列,第6染色體上有13條序列,第7染色體上有9條序列,第8染色體上有18條序列,第9染色體上有11條序列,第10染色體上有23條序列,第11染色體上有13條序列,第12染色體上有6條序列,第 13染色體上有 8條序列;Gabzip28、Gabzip49.1、Gabzip49.2和Gabzip75這4條序列的染色體定位情況未知。
表1 本研究所用的引物Table 1 PCR primers used in this study
2.2 亞洲棉bZIP家族的進化分析
由進化分析可以看出(圖 1),除 GabZIP64外,其余182條bZIP序列分為A、B、C、D、E、F、G、H、I、S、U、V、W 13個亞家族,其中A~S 10個亞家族同擬南芥和水稻 bZIP家族分類一致。AtbZIP62、AtbZIP72和AtbZIP60在擬南芥bZIP家族不屬于任何亞家族,GabZIP74.1和GabZIP74.2與AtbZIP62和OsbZIP80蛋白劃分為同一個進化分支,把它們歸為一個新的亞家族,命名為 U亞家族;GabZIP12和GabZIP66與AtbZIP72蛋白劃分為同一個進化分支,歸為一個新的亞家族,命名為 V亞家族;GabZIP19.1、GabZIP19.2、GabZIP19.3 和GabZIP83與AtbZIP60蛋白劃分為同一個進化分支,歸為一個新的亞家族,命名為W亞家族。
亞洲棉 bZIP A亞家族是最大的一個進化分支,包括38條GabZIPs蛋白序列。B亞家族和H亞家族的成員最少,分別只有1條GabZIP蛋白序列。C亞家族有11個成員,D亞家族有29個成員,E亞家族有8個成員,F(xiàn)亞家族有5個成員,G亞家族有14個成員,I亞家族有17個成員,S亞家族有26個成員,U亞家族有2個成員,V亞家族有2個成員,W亞家族有4個成員。
2.3 亞洲棉bZIP家族保守結(jié)構(gòu)的分析
亞洲棉 bZIPs蛋白一共有 25個保守基序(E-value < 1E-1.0),包括保守的bZIP基序(motif 6),不同亞家族 bZIP蛋白的保守基序具有一定的分布規(guī)律(圖2)。motif 8存在于除了D亞家族外的所有亞家族中,但有些基序僅共存于個別亞家族中,比如motif 1只存在于A、S亞族中,motif 4存在于D 和E亞族中,motif 5存在于A和D亞族中,motif 7存在于A、C和S亞族中,motif 14存在于A和G亞族中,motif 17存在于E和I亞族中,motif 18存在于D、S和W亞族中,motif 22存在于D和I亞族中,motif 24存在于E、I和V亞家族中。此外,還有一些保守基序只存在于特殊的亞家族中,比如,motif 2、3、9和27只存在于A亞族中,motif 10、11、12、13、15和16只存在于D亞族中,motif 23只存在于F亞族中,motif 19只存在于G亞族中,motif 20和25只存在于 I亞族中。這一現(xiàn)象表明每個亞家族中存在的特殊基序決定了該亞家族中成員的功能。
2.4 亞洲棉bZIP家族基因結(jié)構(gòu)分析
Intron和exon的數(shù)量和分布情況暗示了亞洲棉bZIP家族基因的進化印記,同一個亞家族中的成員具有相似的基因結(jié)構(gòu),不同亞家族和成員之間intron-exon的數(shù)量和位置是不同的(圖 2)。其中有19條基因序列沒有內(nèi)含子,占整個 GabZIP基因的11.95%,這種現(xiàn)象出現(xiàn)在 A、F和 S亞族,分別占7.69%、20.00%和 57.69%。剩余的 140個 GabZIP基因有內(nèi)含子,內(nèi)含子的數(shù)量在 1~12之間變化,D 和G亞家族中的成員內(nèi)含子數(shù)目變化程度最大,分別在 5~12和 6~11之間變動,其余亞家族內(nèi)含子的數(shù)量存在小范圍的變化,一般在1~4之間變動。
bZIP區(qū)域的堿性區(qū)(Basic region)和鉸鏈區(qū)(Hinge region)是最保守的(圖 3),根據(jù) Basic region 和Hinge region中內(nèi)含子的數(shù)目、位置和拼接位點,將GabZIP基因劃分為7種模式∶ a、b、c、d、e、f 和g (圖4)。其中模式a (包含31個基因)和b (包含39個基因)是最普遍的,模式a在Hinge region 的-5位置有一個內(nèi)含子(P0),只有A亞家族的31個基因。模式b在Basic region的-22位置有一個內(nèi)含子(P2),它出現(xiàn)在C、E、I和W亞家族中。模式c有2個內(nèi)含子(都在P0),1個在Basic region的-22位置,另一個在Hinge region的-6位置,只出現(xiàn)在D亞家族。模式d在Hinge region的-6位置有一個內(nèi)含子(P0),只存在于G亞家族。模式e在Basic region的-19位置有1個內(nèi)含子(P2),只包含I亞家族的1個基因。模式f在Basic region的-20位置有一個內(nèi)含子(P0),只出現(xiàn)在V亞家族。模式g在Basic region和Hinge region都沒有內(nèi)含子,有 42個基因?qū)儆谶@個模式,這42個基因分別包含在A、B、F、H、S和U亞家族中。由圖4可以看出在Hinge region內(nèi)含子只出現(xiàn)在P0處,在Basic region內(nèi)含子出現(xiàn)在P0/P2處。由于bZIP基因結(jié)構(gòu)中Basic region和Hinge region中的重要性和保守性,使 GabZIP與 OsbZIP和ZmbZIP蛋白的功能可能相一致。
圖1 亞洲棉bZIP家族蛋白進化分析Fig. 1 Phylogenetic analysis of the GabZIP family proteins in G. arboreum
2.5 亞洲棉GaFD基因的鑒定
通過對比對分析亞洲棉bZIP基因的序列,共得到3個GaFD基因,它們分別位于第1、第4和第10染色體上(表2)。根據(jù)與擬南芥AtFD基因的進化關(guān)系和蛋白氨基酸序列的比對分析,將亞洲棉GabZIP13命名為 GaFD1,將 GabZIP47命名為GaFD2,將GabZIP70命名為GaFD3。Blast比對分析這 3個 GaFDs基因的 CDS序列,其中亞洲棉GaFD1與雷蒙德氏棉預測GrFD (GenBank登錄號為XM_012613834.1)基因的相似性為97.1%,GaFD2與預測GrFD (GenBank登錄號為XM_012632374.1)基因的相似性為97.4%,GaFD3與預測GrFD (Gen-Bank登錄號為 XM_012586433.1)基因的相似性為97.3%。比較亞洲棉3個GaFD基因的ORF及ORF ORF相對應基因組區(qū)域的序列,分析這3個基因的外顯子和內(nèi)含子結(jié)構(gòu),結(jié)果顯示和擬南芥 AtFD基因結(jié)構(gòu)相似,均由3個外顯子和2個內(nèi)含子組成(圖5)。將3個GaFD蛋白與其他6種物種的FD蛋白,即擬南芥AtFD (GenBank登錄號為BN000021)、葡萄(Vitis vinifera) VvFD (GenBank登錄號 XP_ 003635259.1)、歐洲山楊和河北楊的雜交品種(Populus tremula × Populusalba) PtFD (GenBank登錄號 AGM48561.1)、馬鈴薯(Solanum tuberosum)StFD (GenBank登錄號為AGM48561.1)、大豆GmFD (GenBank登錄號為 XP_006573542.1)和野草莓(Fragaria vesca) (GenBank登錄號為 XP_ 004289074.1)的氨基酸序列比對分析,發(fā)現(xiàn)亞洲棉GaFD蛋白中都存在A、LSL和SAP這3個保守基序(圖6),表明這3個序列是GaFD基因。
圖2 亞洲棉bZIP家族結(jié)構(gòu)分析Fig. 2 Structural characterization of GabZIP family in G. arboreum
圖3 亞洲棉bZIP蛋白堿性區(qū)域和鉸鏈區(qū)的比對Fig. 3 Alignment of basic and hinge regions of GabZIP protein in G. arboreum
圖4 亞洲棉bZIP基因堿性區(qū)域和鉸鏈區(qū)內(nèi)含子的分布模式Fig. 4 Intron distribution patterns within the basic and hinge regions of the GabZIP genes in G. arboreum
表2 亞洲棉GaFD基因信息Table 2 Information for GaFD in G. arboreum
圖5 亞洲棉GaFD基因外顯子及內(nèi)含子分析Fig. 5 Exons and introns analysis of GaFD genes in G. arboreum
2.6 亞洲棉GaFD基因的組織表達分析
qRT-PCR分析表明,3個GaFD基因在中亞1號A的根、莖、葉、SAM、開花當天的花、雌蕊、雄蕊和20 d的胚珠這8個組織中的表達模式存在差異(圖7)。GaFD1在SAM中的表達量最高,其次在莖中表達,在葉片和根中的表達量很弱,在雌蕊和胚珠中幾乎不表達(圖7-A);GaFD2在SAM中的表達量最高,在葉片、花和雌蕊中表達很弱,在根中幾乎不表達(圖 7-B);GaFTD3在莖中表達量最高,在SAM中也有較高的表達,在花和雄蕊中表達量很弱,在葉片和雌蕊中幾乎不表達(圖7-C)。
圖6 亞洲棉與其他物種FD蛋白氨基酸序列比對Fig. 6 Amino acid sequences alignment of FD proteins from G. arboreum and other plant species
圖7 亞洲棉GaFD基因在不同組織中的表達特征Fig. 7 Expression patterns of GaFD genes in different tissues of G. arboreum
本研究通過信息學手段分析亞洲棉全基因組序列,獲得了159個亞洲棉bZIP基因,它們分別位于第1~第13染色體上。通過與擬南芥和水稻bZIP基因家族聚類分析[9-10],將亞洲棉bZIP基因分為13個亞家族(圖1),其中A~S 10個亞家族同擬南芥分類一致[9],U亞家族與大麥(Hordeum vulgare)和玉米(Zea mays)分類一致[42-43],V和W屬于新的亞家族。在擬南芥、水稻和玉米中,bZIP亞家族成員最多的分別是S (17個AtbZIP),A (17個OsbZIP)和D (40個ZmbZIP),成員最少的分別是H、E、U (每個亞家族有 2個 AtbZIP),U (1個 OsbZIP)和 U (2個ZmbZIP)[9,10,43];在亞洲棉中,A 亞家族是最大的一個進化分支,包括38條GabZIP蛋白序列,B亞家族和H亞家族的成員是最少的,分別只有1條GabZIP蛋白序列。與擬南芥 bZIP基因比對發(fā)現(xiàn)與 AtbZIP基因同源的 GabZIP基因,在進化上可能與 AtbZIP基因功能相近,如,A亞家族有38個GabZIP,其中GabZIP31.3、GabZIP68.3和 GabZIP90.1是擬南芥AtABF的同源基因,主要參與ABA和逆境脅迫的調(diào)控表達[18];B亞家族只有一個基因,GabZIP86;C亞家族有 11個 GabZIP基因,其中 GabZIP46.1和GabZIP18分別是AtbZIP10和AtbZIP25的同源基因,AtbZIP10和AtbZIP25的功能是調(diào)控特定種子基因的表達[44],而GabZIP46.1和GabZIP18是否同樣具有此功能還有待于驗證;D亞家族有29個GabZIP基因,該家族通過與 TGACG (TGA)蛋白序列結(jié)合發(fā)揮它的作用[23,25],其中GabZIP53.3、GabZIP82和GabZIP87是AtTGA的同源基因;E和F亞家族分別有 8個和 5個 GabZIPs基因;G亞家族有 14個GabZIPs成員,由于該家族成員與 G-box序列結(jié)合而命名,GabZIP29、GabZIP44.3、GabZIP49.1是AtGBF的同源基因,參與響應光啟動子的調(diào)控[28,45];H 亞家族只有一個成員,GabZIP59,它是擬南芥AtHY5的同源基因,AtHY5基因調(diào)控在刺激誘導下下胚軸和根的發(fā)育[17];I亞家族有17個GabZIP成員;S亞家族有26個GabZIP成員,由于S亞家族成員的蛋白序列長度較短,它可能需要與其它因子相互作用來完成轉(zhuǎn)錄激活[33]。
保守結(jié)構(gòu)分析表明,亞洲棉 GabZIPs家族成員共有25個保守基序(圖2),這些保守基序可能與蛋白的功能有關(guān),也可能參與bZIP蛋白功能的激活。擬南芥、水稻和玉米的bZIP家族蛋白保守基序的鑒定都已經(jīng)完成[9-10,43]。擬南芥 A亞家族的保守基序中有酪蛋白激酶(CKII)磷酸化位點(S/TxxD/E),ABA能引起AtAREB1/2蛋白在此位點磷酸化進而誘導下游基因的表達,在亞洲棉 A亞家族的保守基序中也包含這個序列。擬南芥G亞族中有3個保守基序是富含脯氨酸激活結(jié)構(gòu)域的一部分,在亞洲棉 G亞族中同樣包含這一保守基序。說明不同物種bZIP家族之間具有一定的結(jié)構(gòu)保守性,這也是基因功能相似的原因。此外,不同物種bZIP亞家族保守基序之間也存在著差異,這也是物種之間保持特異性的原因。基因結(jié)構(gòu)分析表明(圖 2),亞洲棉有 19條 GabZIPs基因序列沒有內(nèi)含子,這個現(xiàn)象出現(xiàn)在A、F、S和U亞族中,D和G亞族中內(nèi)含子變化的數(shù)目最大,在玉米[43]中,沒有內(nèi)含子的序列出現(xiàn)在F和S亞族中,內(nèi)含子變化數(shù)目最大的也是D和G亞族,說明在單雙子葉植物中bZIP家族的基因結(jié)構(gòu)具有相似性。在亞洲棉中,bZIP的Basic region和Hinge region是最保守的,一般認為在這個區(qū)域中內(nèi)含子的位置和拼接位點相對于其它區(qū)域?qū)μ剿?bZIP基因的同源進化更有意義[10,46],根據(jù)這個區(qū)域中內(nèi)含子的數(shù)目、位置和拼接位點將bZIP基因劃分為7種模式(圖4),其中內(nèi)含子的數(shù)量與水稻[10]、玉米[43]、大麥[42]bZIP家族的分類基本一致,拼接位點有所差異,但和蓖麻[47]內(nèi)含子拼接位點比較相似,可能是單雙子葉物種的差異所致。
bZIP A亞家族中的FD蛋白通過與FT基因編碼的 Florigen蛋白相互作用,促進下游開花身份相關(guān)基因表達,進而促進植物開花。亞洲棉GabZIP A亞家族有3個GaFDs基因,分別位于第1、第4和第10染色體(表2)。結(jié)構(gòu)分析表明,亞洲棉3個FD基因與擬南芥FD基因的結(jié)構(gòu)相同(圖5),并且蛋白序列中含有FD蛋白的3個保守基序(圖6)。研究表明,擬南芥fd-1突變體是明顯晚花的,在fd-1突變體中過量表達FD可以恢復它的正常表型[20],說明FD基因具有促進開花的作用。但是亞洲棉3個FD基因是否也具有促進開花的功能,或者各自起著不同的作用還需要進一步的驗證。對擬南芥[10]和水稻[14]FD基因的研究表明,成花素FT基因在子葉的維管組織和葉片中轉(zhuǎn)錄為mRNA并合成FT蛋白,F(xiàn)T蛋白再由韌皮部經(jīng)過長距離運輸?shù)巾敹朔稚M織,與在SAM合成的FD蛋白相互作用激活下游信號,促進植物開花,在本研究中,3個GaFD基因均在SAM中的表達量很高,在葉片中只有微弱的表達,或者不表達(圖7),這符合FD蛋白與FT蛋白的作用模式。但是,GaFD1和GaFD2在SAM中的表達量最高,而GaFD3在莖中的表達量最高,其次在SAM中表達,這個現(xiàn)象說明GaFD3與GaFD1和GaFD2可能存在功能上的差異,推測除具促進開花的作用外,還有其他重要的功能。
總之,在二倍體棉花 G. arboreum (A2)和 G. raimondii (D5)基因組中均存在bZIP家族基因,四倍體陸地棉由A與D基因組進化而來,四倍體棉花也可能具有A與D兩套bZIP家族基因,同時也不排除四倍體棉花 bZIP基因家族在進化過程中由于重復基因間的相互作用只有一組二倍體基因組(A或 D)來源的bZIP基因表達。隨著陸地棉[38-39]和海島棉[40]基因組測序的完成,為我們對四倍體棉花中究竟存在多少個bZIP基因,相應的基因序列與二倍體有什么不同提供了數(shù)據(jù)支持,對它們在棉花發(fā)育過程中的具體功能還需要進一步的深入研究。本研究獲得的有關(guān)亞洲棉bZIP家族基因的信息,為進一步分析棉花bZIP轉(zhuǎn)錄因子特別是棉花FD同源基因的功能和作用機制積累了有價值的資料。
基于亞洲棉(G. arboreum)全基因組數(shù)據(jù)庫,發(fā)掘出159個bZIP家族基因,屬于13個亞家族,分布在13條染色體上。bZIP A亞家族存在3個GaFD基因,GaFD1和GaFD2在SAM中表達最高,GaFD3在莖中表達最高,不同的表達特征表明它們可能具有不同的功能。
References
[1] Hurst H C. Transcription factors∶ 1. bZIP proteins. Protein Profile,1994,1∶ 123-168
[2] Izaw T,F(xiàn)oster R,Chua N H. Plant bZIP protein DNA binding specificity. J Mol Biol,1993,230∶ 1131-1144
[3] Landschulz W H,Johnson P F,McKnight S L. The leucine zipper∶a hypothetical structure common to a new class of DNA binding proteins. Science,1988,240∶ 1759-1764
[4] Ellenberger T E,Brandl C J,Struhl K,Harrison S C. The GCN4 basic region leucine zipper binds DNA as a dimer of uninterrupted alpha helices∶ crystal structure of the protein-DNA complex. Cell,1992,71∶ 1223-1237
[5] Fernandes L,Rodrigues-Pousada C,Struhl K. Yap,a novel family of eight bZIP proteins in Saccharomyces cerevisiae with distinct biological functions. Mol Cell Biol,1997,17∶ 6982-6993
[6] Estes K A,Dunbar T L,Powell J R,Ausubel F M,Troemel E R. bZIP transcription factor zip-2 mediates an early response to Pseudomonas aeruginosa infection in Caenorhabditis elegans. Proc Natl Acad Sci USA,2010,107∶ 2153-2158
[7] Fassler J,Landsman D,Acharya A,Moll J R,Bonovich M,Vinson C. B-ZIP proteins encoded by the Drosophila genome∶evaluation of potential dimerization partners. Genome Res,2002,12∶ 1190-1200
[8] Vinson C,Myakishev M,Acharya A,Mir A A,Moll J R,Bonovich M. Classification of human B-ZIP proteins based on dimerization properties. Mol Cell Biol,2002,22∶ 6321-6335
[9] Jakoby M,Weisshaar B,Dr?ge-Laser W,Vicente-Carbajosa J,Tiedemann J,Kroj T. bZIP transcription factors in Arabidopsis. Trends Plant Sci,2002,7∶ 106-111
[10] Nijhawan A,Jain M,Tyagi A K,Khurana J P. Genomic survey and gene expression analysis of the basic leucine zipper transcription factor family in rice. Plant Physiol,2008,146∶ 333-350
[11] Wang J,Zhou J,Zhang B,Vanitha J,Ramachandran S,Jiang S Y. Genome-wide expansion and expression divergence of the basic leucine zipper transcription factors in higher plants with an emphasis on sorghum. J Integr Plant Biol,2011,53∶ 212-231
[12] Liao Y,Zou H F,Wei W,Hao Y J,Tian A G,Huang J,Liu Y F,Zhang J S,Chen S Y. Soybean GmbZIP44,GmbZIP62 and GmbZIP78 genes function as negative regulator of ABA signaling and confer salt and freezing tolerance in transgenic Arabidopsis. Planta,2008,228∶ 225-240
[13] Lopez-Molina L,Mongrand S,Chua N H. Postgermination developmental arrest checkpoint is mediated by abscisic acid and requires the ABI5 transcription factor in Arabidopsis. Proc Natl Acad Sci USA,2001,98∶ 4782-4787
[14] Tsuji H,Nakamura H,Taoka K,Shimamoto K. Functional diversification of FD transcription factors in rice,components of florigen activation complexes. Plant Cell Physiol,2013,54∶385-397
[15] Uno Y,F(xiàn)urihata T,Abe H,Yoshida R,Shinozaki K,Yamaguchi-Shinozaki K. Arabidopsis basic leucine zipper transcription factors involved in an abscisic acid-dependent signal Transduction pathway under drought and high-salinity conditions. Proc Natl Acad Sci USA,2000,97∶ 11632-11637
[16] Dr?ge-Laser W,Kaiser A,Lindsay W P,Halkier B A,Loake G J,Doerner P,Dixon R A,Lamb C. Rapid stimulation of a soybean protein-serine kinase that phosphorylates a novel bZIP DNA-binding protein,G/HBF-1,during the induction of early transcription-dependent defenses. EMBO J,1997,16∶ 726-738
[17] Ang L H,Chattopadhyay S,Wei N,Oyama T,Okada K,Batschauer A,Deng X W. Molecular interaction between COP1 and HY5 defines a regulatory switch for light control of Arabidopsis development. Mol Cell,1998,1∶ 213-222
[18] Choi H,Hong J,Ha J,Kang J,Kim S Y. ABFs,a family of ABA-responsive element binding factors. J Biol Chem,2000,275∶1723-1730
[19] Finkelstein R R,Lynch T J. The Arabidopsis abscisic acid response gene ABI5 encodes a basic leucine zipper transcription factor. Plant Cell,2000,12∶ 599-609
[20] Abe M,Kobayashi Y,Yamamoto S,Daimon Y,Yamaguchi A,Ikeda Y,Ichinoki H,Notaguchi M,Goto K,Araki T. FD,a bZIP protein mediating signals from the floral pathway the shoot apex. Science,2005,309∶ 1052-1056
[21] Taoka K,Ohki I,Tsuji H,F(xiàn)uruita K,Hayashi K,Yanase T,Yamaguchi M,Nakashima C,Purwestri Y A,Tamaki S,Ogaki Y,Shimada C,Nakagawa A,Kojima C,Shimamoto K. 14-3-3 proteins act as intracellular receptors for rice Hd3a florigen. Nature,2011,476∶ 332-335
[22] Vicente-Carbajosa J,Moose S P,Parsons R L,Schmidt R J. A maize zinc-finger protein binds the prolamin box in zein gene promoters and interacts with the basic leucine zipper transcriptional activator Opaque2. Proc Natl Acad Sci USA,1997,94∶7685-7690
[23] Després C,DeLong C,Glaze S,Liu E,F(xiàn)obert P R. The Arabidopsis NPR1/NIM1 protein enhances the DNA binding activity of a subgroup of the TGA family of bZIP transcription factors. Plant Cell,2000,12∶ 279-290
[24] Katagiri F,Lam E,Chua N H. Two tobacco DNA-binding proteins with homology to the nuclear factor CREB. Nature,1989,340∶ 727-730
[25] Singh K,F(xiàn)oley R C,O?ate-Sánchez L. Transcription factors in plant defense and stress responses. Curr Opin Plant Biol,2002,5∶430-436
[26] Chuang C F,Running M P,Williams R W,Meyerowitz E M. The PERIANTHIA gene encodes a bZIP protein involved in the determination of floral organ number in Arabidopsis thaliana. Genes Dev,1999,13∶ 334-344
[27] Walsh J,F(xiàn)reeling M. The liguleless2 gene of maize functions during the transition from the vegetative to the reproductive shoot apex. Plant J,1999,19∶ 489-495
[28] Schindler U,Menkens A E,Beckmann H,Ecker J R,Cashmore A R. Heterodimerization between light-regulated and ubiquitously expressed Arabidopsis GBF bZIP proteins. EMBO J,1992,11∶1261-1273
[29] Chern M S,Bobb A J,Bustos M M. The regulator of MAT2 (ROM2) protein binds to early maturation promoters and represses PvALF-activated transcription. Plant Cell,1996,8∶305-321
[30] Fukazawa J,Sakai T,Ishida S,Yamaguchi I,Kamiya Y,Takahashi Y. REPRESSION OF SHOOT GROWTH,a bZIP transcriptional activator,regulates cell elongation by controlling the level of gibberellins. Plant Cell,2000,12∶ 901-915
[31] Ringli C,Keller B. Specific interaction of the tomato bZIP transcription factor VSF-1 with a non-palindromic DNA sequence that controls vascular gene expression. Plant Mol Biol,1998,37∶977-988
[32] Rook F,Gerrits N,Kortstee A,van Kampen M,Borrias M,Weisbeek P,Smeekens S. Sucrose-specific signaling represses translation of the Arabidopsis ATB2 bZIP transcription factor gene. Plant J,1998,15∶ 253-263
[33] Martínez-García J F,Moyano E,Alcocer M J,Martin C. Two bZIP proteins from Antirrhinum flowers preferentially bind a hybrid C-box/G-box motif and help to define a new sub-family of bZIP transcription factors. Plant J,1998,13∶ 489-505
[34] Strathmann A,Kuhlmann M,Heinekamp T,Dr?ge-Laser W. BZI-1 specifically heterodimerises with the tobacco bZIP transcription factors BZI-2,BZI-3/TBZF and BZI-4,and is functionally involved in flower development. Plant J,2001,28∶ 397-408
[35] Chen Z J,Scheffler B E,Dennis E,Triplett B A,Zhang T,Guo W,Chen X,Stelly D M,Rabinowicz P D,Town C D,Arioli T,Brubaker C,Cantrell R G,Lacape J M,Ulloa M,Chee P,Gingle A R,Haigler C H,Percy R,Saha S,Wilkins T,Wright R J,Van Deynze A,Zhu Y,Yu S,Abdurakhmonov I,Katageri I,Kumar P A,Mehboob-Ur-Rahman,Zafar Y,Yu J Z,Kohel R J,Wendel J F,Paterson A H. Toward sequencing cotton (Gossypium) genomes. Plant Physiol,2007,145∶ 1303-1310
[36] Li F,F(xiàn)an G,Wang K,Sun F,Yuan Y,Song G,Li Q ,Ma Z,Lu C,Zou C,Chen W,Liang X,Shang H,Liu W,Shi C,Xiao G,Gou C,Ye W,Xu X,Zhang X,Wei H,Li Z,Zhang G,Wang J,Liu K,Kohel R J,Percy R G,Yu J Z,Zhu Y X,Wang J,Yu S. Genome sequence of the cultivated cotton Gossypium arboreum. Nat Genet,2014,46∶ 567-572
[37] Wang K,Wang Z,Li F,Ye W,Wang J,Song G,Yue Z,Cong L,Shang H,Zhu S,Zou C,Li Q,Yuan Y,Lu C,Wei H,Gou C,Zheng Z,Yin Y,Zhang X,Liu K,Wang B,Song C,Shi N,Kohel R J,Percy R G,Yu J Z,Zhu Y X,Wang J,Yu S. The draft genome of a diploid cotton Gossypium raimondii. Nat Genet,2012,44∶1098-1103
[38] Li F,F(xiàn)an G,Lu C,Xiao G,Zou C,Kohel R J,Ma Z,Shang H,Ma X,Wu J,Liang X,Huang G,Percy R G,Liu K,Yang W,Chen W,Du X,Shi C,Yuan Y,Ye W,Liu X,Zhang X,Liu W,Wei H,Wei S,Huang G ,Zhang X,Zhu S ,Zhang H,Sun F,Wang X,Liang J,Wang J,He Q,Huang L,Wang J,Cui J,Song G,Wang K,Xu X,Yu J Z,Zhu Y,Yu S. Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution. Nat Biotechnol,2015,33∶ 524-530
[39] Zhang T,Hu Y,Jiang W,F(xiàn)ang L,Guan X,Chen J,Zhang J,Saski C A,Scheffler B E,Stelly D M,Hulse-Kemp A M,Wan Q,Liu B,Liu C,Wang S,Pan M,Wang Y,Wang D,Ye W,Chang L,Zhang W,Song Q,Kirkbride R C,Chen X,Dennis E,Llewellyn D J,Peterson D G,Thaxton P,Jones D C,Wang Q,Xu X,Zhang H,Wu H,Zhou L,Mei G,Chen S,Tian Y,Xiang D,Li X,Ding J,Zuo Q,Tao L,Liu Y,Li J,Lin Y,Hui Y,Cao Z,Cai C,Zhu X,Jiang Z,Zhou B,Guo W,Li R,Chen Z J. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement. Nat Biotechnol,2015,33∶531-537
[40] Liu X,Zhao B,Zheng H J,Hu Y,Lu G,Yang C Q,Chen J D,Chen J J,Chen D Y,Zhang L,Zhou Y,Wang L J,Guo W Z,Bai Y L,Ruan J X,Shangguan X X,Mao Y B,Shan C M,Jiang J P,Zhu Y Q,Jin L,Kang H,Chen S T,He X L,Wang R,Wang Y Z,Chen J,Wang L J,Yu S T,Wang B Y,Wei J,Song S C,Lu X Y,Gao Z C,Gu W Y,Deng X,Ma D,Wang S,Liang W H,F(xiàn)ang L,Cai C P,Zhu X F,Zhou B L,Jeffrey Chen Z,Xu S H,Zhang G,Wang S Y,Zhang T Z,Zhao G P,Chen X Y. Gossypium barbadense genome sequence provides insight into the evolution of extra-long staple fiber and specialized metabolites. Sci Rep,2015,5∶ 14139
[41] Tamura K,Peterson D,Peterson N,Stecher G,Nei M,Kumar S. MEGA5∶ molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods. Mol Biol Evol,2011,28∶ 2731-2739
[42] Pourabed E,Ghane Golmohamadi F,Soleymani Monfared P,Razavi S M,Shobbar Z S. Basic leucine zipper family in barley∶genome-wide characterization of members and expression analysis. Mol Biotechnol,2015,57∶ 12-26
[43] Wei K,Chen J,Wang Y,Chen Y,Chen S,Lin Y,Pan S,Zhong X,Xie D. Genome-wide analysis of bZIP-encoding genes in maize. DNA Res,2012,19∶ 463-476
[44] Lara P,O?ate-Sánchez L,Abraham Z,F(xiàn)errándiz C,Díaz I,Carbonero P,Vicente-Carbajosa J. Synergistic activation of seed storage protein gene expression in Arabidopsis by ABI3 and two bZIPs related to OPAQUE2. J Biol Chem,2003,278∶ 21003-21011
[45] Weisshaar B,Armstrong G A,Block A,da Costa e Silva O,Hahlbrock K. Light-inducible and constitutively expressed DNA-binding proteins recognizing a plant promoter element with functional relevance in light responsiveness. EMBO J,1991,10∶1777-1786
[46] Suckow M,von Wilcken-Bergmann B,Müller-Hill B. Identification of three residues in the basic regions of the bZIP proteins GCN4,C/EBP and TAF-1 that are involved in specific DNA binding. EMBO J,1993,12∶ 1193-1200
[47] Jin Z,Xu W,Liu A. Genomic surveys and expression analysis of bZIP gene family in castor bean (Ricinus communis L.). Planta,2014,239∶ 299-312
Identification of bZIP Protein Family in Gossypium arboreum and Tissue Expression Analysis of GaFDs Genes
ZHANG Yan-Nan,CAI Da-Run,and HUANG Xian-Zhong*
Plant Genomics Laboratory / College of Life Sciences,Shihezi University,Shihezi 832003,China
Abstract:The basic leucine zipper (bZIP) is one of the largest and most diverse transcription factors in eukaryotes,and is involved in various processes of plant growth and development and in response to biotic and abiotic stresses. In this study,159 bZIP family genes were identified and their complete gene sequences were obtained by using bioinformatics analysis method,based on Gossypium arboreum whole genome database,and 159 bZIP genes were loaded on 13 chromosomes. The 159 bZIP genes were categorized into 13 groups based on their phylogenetic relationships,gene structures and conserved motifs. In addition,three GaFD homologous genes GaFD1,GaFD2,and GaFD3 were identified,which belongs to A subfamily in G. arboretum. The expression patterns of GaFD genes in different tissues were determined by using quantitative Real-time reverse transcription PCR (qRT-PCR) method. The results showed that GaFD1 and GhFD2 were preferentially expressed in the shoot apical meristem (SAM),whereas GaFD3 was preferentially expressed in stem. The results revealed that a number of bZIP family members exist in cotton genome,and FD genes with different structures and expression patterns play different roles in the development of cotton,which provides valuable information for dissecting the function and mechanism of bZIPs in cotton.
Keywords:Basic leucine zipper;Gossypium arboreum;FD;Phylogenetic analysis;Gene expression
DOI:10.3724/SP.J.1006.2016.00832
*通訊作者(
Corresponding author)∶ 黃先忠,E-mail∶ xianzhongh106@163.com,Tel∶ 0993-2057262
收稿日期Received()∶ 2015-11-13;Accepted(接受日期)∶ 2016-01-11;Published online(網(wǎng)絡出版日期)∶ 2016-03-14.