齊 曉,張正社,閔學(xué)陽(yáng),孫啟忠,劉文獻(xiàn)
(1.中國(guó)農(nóng)業(yè)科學(xué)院草原研究所,內(nèi)蒙古 呼和浩特 010010;2.全國(guó)畜牧總站 全國(guó)草品種審定委員會(huì)辦公室,北京 100125;3.草地農(nóng)業(yè)生態(tài)系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室 蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,甘肅 蘭州 730020)
紫花苜蓿bZIP基因家族的鑒定、進(jìn)化及表達(dá)分析
齊 曉1,2,張正社3,閔學(xué)陽(yáng)3,孫啟忠1,劉文獻(xiàn)3
(1.中國(guó)農(nóng)業(yè)科學(xué)院草原研究所,內(nèi)蒙古 呼和浩特 010010;2.全國(guó)畜牧總站 全國(guó)草品種審定委員會(huì)辦公室,北京 100125;3.草地農(nóng)業(yè)生態(tài)系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室 蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,甘肅 蘭州 730020)
堿性亮氨酸拉鏈(bZIP)轉(zhuǎn)錄因子是真核生物轉(zhuǎn)錄因子中分布最廣泛、最保守的一類蛋白。目前在許多植物中已發(fā)現(xiàn)大量的bZIP轉(zhuǎn)錄因子,這些bZIP轉(zhuǎn)錄因子成員廣泛參與種子貯藏基因的表達(dá)、植物的生長(zhǎng)發(fā)育、光信號(hào)傳導(dǎo)、病害防御、生物和非生物脅迫應(yīng)答以及ABA的敏感性等各種信號(hào)的反應(yīng)。本研究首次從紫花苜蓿(Medicagosativa)全轉(zhuǎn)錄組水平鑒定出bZIP轉(zhuǎn)錄因子家族共包含138個(gè)基因,根據(jù)bZIP蛋白序列進(jìn)行系統(tǒng)進(jìn)化分析可以將其分為10類;對(duì)MsbZIP基因的系統(tǒng)進(jìn)化分析表明該基因家族在分類上有很高的保守性。該轉(zhuǎn)錄因子家族的基因密碼子偏好性分析表明,MsbZIP基因密碼子偏好使用A/T堿基。此外,MsbZIP基因GO功能注釋分析結(jié)果顯示,138個(gè)MsbZIP基因最終分為23個(gè)GO分類,總體包括分子功能和生物學(xué)過(guò)程兩類。相關(guān)性分析結(jié)果表明,共有372對(duì)基因表達(dá)相關(guān)性極顯著(P<0.01)。本研究可為紫花苜蓿bZIP轉(zhuǎn)錄因子功能特性、進(jìn)化歷程和生物功能的深入研究奠定基礎(chǔ)。
bZIP轉(zhuǎn)錄因子;紫花苜蓿;系統(tǒng)進(jìn)化分析;密碼子偏好性
轉(zhuǎn)錄因子對(duì)植物眾多重要的生物學(xué)過(guò)程起關(guān)鍵性調(diào)控作用[1-2]。研究轉(zhuǎn)錄因子的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)及其生物學(xué)過(guò)程是了解轉(zhuǎn)錄因子功能特性的本質(zhì)。截至目前,植物中至少有64個(gè)轉(zhuǎn)錄因子家族被鑒定[3]。作為植物中最大的轉(zhuǎn)錄因子家族之一,堿式亮氨酸拉鏈有多個(gè)不同的分類[4]。bZIP蛋白具有一個(gè)40~60個(gè)氨基酸組成的保守結(jié)構(gòu)域,其包含1個(gè)堿性DNA結(jié)合域,可通過(guò)一個(gè)固定的N-x7-R/K結(jié)構(gòu)與特異DNA序列結(jié)合;還包含一個(gè)亮氨酸拉鏈二聚體結(jié)構(gòu)域與堿性區(qū)緊密結(jié)合,每7個(gè)氨基酸的第7位有一個(gè)亮氨酸以及其它疏水性殘基位第3和第4位,亮氨酸拉鏈形成一個(gè)兩親性的α螺旋,可影響bZIP蛋白與DNA結(jié)合之前的二聚化[5]。該轉(zhuǎn)錄因子家族除了bZIP結(jié)構(gòu)域外還包含其它具有轉(zhuǎn)錄活化功能的結(jié)構(gòu)域,例如,R/KxxS/T和S/TxxD/E結(jié)構(gòu)域,分別是Ca+獨(dú)立蛋白激酶和酪蛋白激酶Ⅱ的磷酸化位點(diǎn)[6]。此外,脯氨酸富集區(qū)、谷氨酰胺富集區(qū)以及酸性結(jié)構(gòu)域在bZIP基因的轉(zhuǎn)錄活化過(guò)程中也具有重要作用[7]。
截至目前,bZIP基因家族在多種植物全基因組水平得到了綜合鑒定和預(yù)測(cè)。例如,在擬南芥(Arabidopsisthalianna)中鑒定出75個(gè)基因[5],葡萄(Vitisvinifera)中55個(gè)[8],水稻(Oryzasativa)中89個(gè)[9],大豆(Glycinemax)中131個(gè)[7],高粱(Sorghumvulgare)中92個(gè)[10],玉米(Zeamays)中125個(gè)[11],蒺藜苜蓿(Medicagotruncatula)中75個(gè)[12]。研究證明,bZIP可以通過(guò)與啟動(dòng)子區(qū)域的順式作用元件相互作用,抑制或激活多個(gè)下游基因表達(dá),從而參與轉(zhuǎn)錄調(diào)控過(guò)程。bZIP轉(zhuǎn)錄因子參與多個(gè)生物學(xué)過(guò)程,包括種子萌發(fā)與成熟、植物衰老、光形態(tài)建成、糖代謝等,特別是在非生物脅迫的抗逆反應(yīng)中起重要作用,例如鹽脅迫、干旱脅迫、低溫脅迫、熱激反應(yīng)和生物脅迫等[13-16]。
豆科植物是第三大開(kāi)花植物,包含了大約650屬18 000種。就經(jīng)濟(jì)價(jià)值而言,豆科作物僅次于禾本科作物,排行第二,占世界作物總產(chǎn)值的27%[17]。紫花苜蓿(M.sativa)是全球栽培面積最大的牧草,大約有3 000萬(wàn)hm2[18]。近年來(lái),由于高通量測(cè)序技術(shù)及生物信息學(xué)的快速發(fā)展,可以高效率、低成本的獲取大量紫花苜蓿轉(zhuǎn)錄組數(shù)據(jù)[19-20],從而使得在轉(zhuǎn)錄組水平對(duì)紫花苜蓿基因家族進(jìn)行分析成為可能,彌補(bǔ)了紫花苜蓿全基因組測(cè)序尚未完成這一實(shí)際問(wèn)題。盡管bZIP蛋白的功能其它植物中已經(jīng)有相關(guān)報(bào)道,但在紫花苜蓿中尚未見(jiàn)報(bào)道。本研究在紫花苜蓿全轉(zhuǎn)錄組范圍內(nèi)鑒定出bZIP轉(zhuǎn)錄因子家族共包含138個(gè)基因,并對(duì)該基因家族的系統(tǒng)進(jìn)化、蛋白結(jié)構(gòu)、表達(dá)譜進(jìn)行了系統(tǒng)分析,通過(guò)CodonW等軟件分析MsbZIP的CDS序列及其密碼子偏好性規(guī)律,以期為紫花苜蓿bZIP基因功能的深入研究奠定基礎(chǔ)。
1.1 紫花苜蓿bZIP轉(zhuǎn)錄因子的鑒定
112 262條紫花苜蓿unigene序列獲取自AGED數(shù)據(jù)庫(kù)(http://plantgrn.noble.org/AGED/)[20]。利用已鑒定出的75條蒺藜苜蓿bZIP轉(zhuǎn)錄因子cDNA序列同紫花苜蓿unigene序列進(jìn)行BLAST(E-value=1e-005),搜索潛在的包含bZIP轉(zhuǎn)錄因子的紫花苜蓿unigene[12]。利用NCBI-CDD在線工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)對(duì)搜索出的unigene進(jìn)行保守蛋白結(jié)構(gòu)域鑒定。利用ORF Finder在線工具(http://www.ncbi.nlm.nih.gov/orffinder/)從unigene中獲取CDS序列。經(jīng)過(guò)去冗余后,最終共鑒定出138個(gè)假定的MsbZIP轉(zhuǎn)錄因子基因。
1.2 多序列比對(duì),保守結(jié)構(gòu)域鑒定及進(jìn)化分析
利用MUSCLE在線工具(http://www.ebi.ac.uk/Tools/msa/muscle/)進(jìn)行多序列比對(duì),系統(tǒng)進(jìn)化樹利用MEGA 7.0(http://www.megasoftware.net/)鄰接法構(gòu)建,并對(duì)構(gòu)建的進(jìn)化樹進(jìn)行自舉評(píng)估(Boot-strap),迭代次數(shù)為1 000,其它參數(shù)使用系統(tǒng)默認(rèn)值。利用蒺藜苜蓿和紫花苜蓿的bZIP蛋白序列進(jìn)行聚類分析。MsbZIP蛋白結(jié)構(gòu)域通過(guò)MEME在線工具(http://meme-suite.org/tools/meme)查詢。
1.3 密碼子使用偏好性分析
利用CodonW軟件計(jì)算有效密碼子數(shù)(Enc)、CDS區(qū)的GC含量、密碼子中第3位堿基的GC含量(GC3s)和相對(duì)同義密碼子使用度RSCU(Relative synonymous codon usage)。
1.4 基因表達(dá)譜數(shù)據(jù)分析
紫花苜?;虮磉_(dá)譜數(shù)據(jù)下載自AGED數(shù)據(jù)庫(kù)(http://plantgrn.noble.org/AGED/index.jsp)。利用WEGO在線工具(http://wego.genomics.org.cn/cgi-bin/wego/index.pl)進(jìn)行GO分類。MsbZIP基因組織表達(dá)相關(guān)性利用R語(yǔ)言包分析作圖。
2.1 蒺藜苜蓿bZIP轉(zhuǎn)錄因子的鑒定和命名
bZIP保守結(jié)構(gòu)域有兩個(gè)特征結(jié)構(gòu)(堿性區(qū)域和亮氨酸拉鏈),這在擬南芥[5]、水稻[9]、葡萄[8]、高粱[10]、玉米[11]和蒺藜苜蓿[12]中都已得到系統(tǒng)的分析。本研究通過(guò)構(gòu)建本地BLAST數(shù)據(jù)庫(kù),與蒺藜苜蓿bZIP蛋白序列進(jìn)行tblastn比對(duì),共鑒定出138個(gè)非冗余bZIP基因。通常bZIP基因按照每個(gè)基因在染色體上的位置順序命名[5],但由于紫花苜蓿缺乏染色體數(shù)據(jù),因此利用blast得到的contig先后順序?qū)⒆匣ㄜ俎ZIP基因命名為MsbZIP1-MsbZIP138(表1)。利用在線工具ExPASy對(duì)紫花苜蓿bZIP蛋白質(zhì)大小、分子量、理論等電點(diǎn)及平均親水性等理化性質(zhì)進(jìn)行分析發(fā)現(xiàn),最長(zhǎng)的蒺藜苜蓿bZIP蛋白(MsbZIP93)包含766個(gè)氨基酸殘基,最短的蒺藜苜蓿bZIP蛋白(MsbZIP138)僅有76個(gè)氨基酸殘基;分子量在8 789.3(MsbZIP138)~84 011.8 D(MsbZIP93);其理論等電點(diǎn)范圍為4.67(MsbZIP126)~11.34(MsbZIP44);所有bZIP蛋白均表現(xiàn)為親水性(表1)。
2.2 紫花苜蓿bZIP轉(zhuǎn)錄因子系統(tǒng)進(jìn)化分析
為了研究bZIP轉(zhuǎn)錄因子在紫花苜蓿和蒺藜苜蓿中的系統(tǒng)進(jìn)化關(guān)系,利用紫花苜蓿中的138條蛋白序列和蒺藜苜蓿中的75條蛋白序列用于系統(tǒng)進(jìn)化樹的構(gòu)建?;诜治觯瑢⑦M(jìn)化樹分為10個(gè)分支(A-J)(圖1)。在這10個(gè)分類中,A類中所包含的紫花苜蓿bZIP基因數(shù)目最多,有31個(gè);J類僅包含3個(gè)紫花苜蓿bZIP基因,在所有分類中最少。本研究的分類結(jié)果同以前在蒺藜苜蓿中的研究有所不同[12]。例如,MsbZIP56、MsbZIP60、MsbZIP68和MsbZIP20、MsbZIP39、MsbZIP48、MsbZIP52在以前的研究中都在同一分類,本研究中被分到A類和I類。
2.3 MsbZIP轉(zhuǎn)錄因子其它保守結(jié)構(gòu)域分析
bZIP結(jié)構(gòu)域是bZIP轉(zhuǎn)錄因子家族的核心結(jié)構(gòu)域,它可以優(yōu)先地結(jié)合特異性順式作用元件來(lái)調(diào)控基因的表達(dá)。然而,bZIP基因家族的功能多樣性也由bZIP蛋白的其它保守結(jié)構(gòu)域所影響[21]。本研究運(yùn)用MEME在線分析工具對(duì)MsbZIP轉(zhuǎn)錄因子家族中其它保守結(jié)構(gòu)域進(jìn)行了搜索。如圖2所示,結(jié)構(gòu)域a和b擁有R/KxxS/T和S/TxxD/E位點(diǎn),已有研究表明,這兩個(gè)位點(diǎn)分別是Ca2+獨(dú)立蛋白激酶和酪蛋白激酶Ⅱ的磷酸化關(guān)鍵位點(diǎn)[6,22]。擁有這兩種結(jié)構(gòu)域的MsbZIP蛋白分別有42和10個(gè)。結(jié)構(gòu)域c中富含脯氨酸,是個(gè)典型的脯氨酸富集結(jié)構(gòu)域。類似的結(jié)構(gòu)域在擬南芥bZIP轉(zhuǎn)錄因子中已被鑒定,并且研究表明其具有轉(zhuǎn)錄激活的潛能[23]。
2.4 有效密碼子數(shù)(ENc)和GC含量分析
ENc值(effective number of codons)為基因的密碼子偏好性程度提供了一個(gè)客觀的評(píng)判標(biāo)準(zhǔn),代表特定基因中同義密碼子非均衡使用的偏好程度。該值在20(每個(gè)氨基酸只使用1個(gè)密碼子的極端情況)到61(各個(gè)密碼子均被平均使用)之間,越靠近20偏好性越強(qiáng)。GC3s則表示密碼子的第3位堿基中G+C的含量在第3位堿基總量中所占的比率[24]。本研究應(yīng)用CodonW程序計(jì)算紫花苜蓿bZIP基因的ENc值、GC含量和GC3s值分別為50.71、0.438和0.340,ENc值大于50,表明紫花苜蓿bZIP基因各密碼子在編碼氨基酸時(shí)出現(xiàn)的頻率比較一致;紫花苜蓿bZIP基因編碼區(qū)GC含量較低,而GC3s值則更低,表明紫花苜蓿偏好使用以A、T結(jié)尾的密碼子,且在整個(gè)編碼區(qū)序列中A+T含量大于G+C。
表1 紫花苜蓿bZIP轉(zhuǎn)錄因子家族信息Table 1 Information of bZIP transcription factor family in Medicago sativa
續(xù)表1(1)
Contig名Contigname基因名Gene蛋白長(zhǎng)度Proteinlength分子量Molecularweight/D理論等電點(diǎn)Isoelectricpoint親水性GRAVYcontig_37902/contig_92921MsbZIP4626728998.56.32-0.676contig_10672MsbZIP4752057438.46.40-0.931contig_39771/contig_93602MsbZIP4825528538.65.49-0.646contig_37917/contig_43971/contig_9341MsbZIP4915617791.96.12-0.682contig_40634MsbZIP5016619031.49.56-1.035contig_44720MsbZIP512302529.68.88-0.774contig_44856MsbZIP5240043153.46.15-0.946contig_44857MsbZIP5340343104.46.28-0.890contig_100487MsbZIP5446651703.56.82-0.644contig_46814MsbZIP5566273152.55.35-0.663contig_4516MsbZIP5625227731.49.95-0.706contig_47473MsbZIP5733637342.56.77-0.691contig_47102/contig_93945MsbZIP5846851778.26.72-0.484contig_4843MsbZIP5924727567.05.21-0.747contig_44719MsbZIP6014516639.510.24-0.786contig_52156MsbZIP6139542344.66.47-0.898contig_52224MsbZIP6232235902.46.93-0.768contig_5187MsbZIP6332335440.86.28-1.068contig_525MsbZIP6443247444.66.33-0.797contig_524MsbZIP6543247461.76.33-0.792contig_54258MsbZIP6635939931.18.25-1.086contig_55177MsbZIP6717119464.47.91-1.249contig_51512MsbZIP6835240039.15.55-1.058contig_56382MsbZIP6914517063.39.29-0.821contig_56231MsbZIP7034837309.38.48-0.820contig_56702MsbZIP7115617389.59.39-0.571contig_58014MsbZIP7243046799.65.96-0.877contig_54246/contig_83980MsbZIP7336040517.85.88-0.813contig_58458MsbZIP74778899.59.52-0.064contig_109831MsbZIP7519222223.75.78-0.904contig_57604MsbZIP7633936991.75.23-0.581contig_60077MsbZIP7749955934.07.39-0.661contig_6033MsbZIP7831234775.55.78-0.727contig_56701MsbZIP7915617347.49.04-0.565contig_60073MsbZIP8031436294.68.87-0.520contig_60411MsbZIP8134438445.45.44-0.802contig_61320MsbZIP8236940210.35.84-0.737contig_62358MsbZIP8315016948.15.94-0.673contig_6004MsbZIP8415117379.59.45-1.032contig_63247MsbZIP8524428281.98.50-0.759contig_63540MsbZIP8612914830.69.57-0.847contig_65298MsbZIP8716418834.29.56-1.002contig_60352MsbZIP8834739611.15.84-0.388contig_65372/contig_83801MsbZIP8920121918.69.51-0.708contig_65299MsbZIP9016619039.59.17-0.916contig_65715MsbZIP9126729034.56.15-0.702
續(xù)表1(2)
Contig名Contigname基因名Gene蛋白長(zhǎng)度Proteinlength分子量Molecularweight/D理論等電點(diǎn)Isoelectricpoint親水性GRAVYcontig_66497MsbZIP9249655028.96.45-0.486contig_62304MsbZIP9376684011.85.48-0.642contig_66599MsbZIP9445350077.06.70-0.608contig_66878MsbZIP95469531557.89-0.701contig_69119MsbZIP9632035575.66.85-0.86contig_69861/contig_65646/contig_81601MsbZIP9715417563.76.12-0.645contig_70814MsbZIP9835240035.15.55-1.061contig_70815MsbZIP9933137900.85.64-1.119contig_740MsbZIP10031534894.08.65-0.788contig_75506MsbZIP10121323402.16.50-0.827contig_75507MsbZIP10234837239.28.48-0.841contig_71488MsbZIP10332236061.66.94-0.769contig_78410MsbZIP10425227681.39.91-0.696contig_785MsbZIP10515517200.45.49-0.801contig_7875MsbZIP10642145366.28.42-0.864contig_79144MsbZIP10738542572.19.47-0.638contig_80132MsbZIP10832434921.65.39-0.823contig_81598MsbZIP10913415810.86.41-0.785contig_17510MsbZIP11043046813.75.96-0.877contig_8344MsbZIP11131034956.17.91-0.866contig_82666MsbZIP11226429432.65.51-0.640contig_83802MsbZIP11337440047.48.99-0.836contig_84103MsbZIP11419022010.55.91-0.891contig_884MsbZIP11515117035.25.94-0.674contig_89122MsbZIP11623125131.96.76-0.773contig_9156MsbZIP11742245102.75.99-0.849contig_20780MsbZIP11839242468.16.94-0.737contig_92255MsbZIP11926930652.05.04-0.375contig_91658/contig_99266MsbZIP12043547583.49.26-0.768contig_93527MsbZIP12132535962.18.65-0.790contig_937MsbZIP12226929736.48.96-0.657contig_93936MsbZIP12337641550.99.47-0.689contig_9494MsbZIP12435840986.65.91-0.424contig_92447MsbZIP12514116040.28.82-0.494contig_95175MsbZIP12624526035.84.67-0.678contig_95174MsbZIP12721122790.49.01-0.883contig_96886MsbZIP12830432688.19.28-0.935contig_9793MsbZIP1292362792.29.16-0.779contig_9775MsbZIP13015718441.89.81-0.916contig_99960MsbZIP13157665547.76.10-0.350contig_95173MsbZIP13211312150.95.00-0.263contig_8996MsbZIP13336341229.86.57-0.508contig_63119MsbZIP13434939621.36.56-0.310contig_59936MsbZIP13546352009.36.52-0.552contig_6681MsbZIP13643146699.88.90-0.735contig_13727/contig_57971MsbZIP13737742550.97.87-1.020contig_99993MsbZIP138768789.39.39-0.032
圖1 紫花苜蓿和蒺藜苜蓿bZIP基因的系統(tǒng)進(jìn)化樹Fig. 1 The phylogenetic tree of bZIP genes of Medicago sativa and Medicago truncatula
2.5 紫花苜?;蛳鄬?duì)同義密碼子使用度分析
相對(duì)同義密碼子使用度(relative synonymous codon usage,RSCU)是指對(duì)于某一特定的密碼子在編碼對(duì)應(yīng)氨基酸的同義密碼子中的相對(duì)概率。RSCU值與氨基酸的使用及密碼子的豐度無(wú)關(guān),它能直觀地反映出密碼子使用的偏好性程度[25]。如果密碼子的使用沒(méi)有偏好,則該密碼子的RSCU=1。當(dāng)某一密碼子的RSCU值大于1,則表明該密碼子的使用頻率相對(duì)較高,反之亦然。CodonW程序計(jì)算結(jié)果(表2)表明,在紫花苜蓿bZIP基因的密碼子中,有偏好性(RSCU>1)的密碼子共計(jì)27個(gè),其中以G/C結(jié)尾的2個(gè),以A/T結(jié)尾的25個(gè)。各氨基酸RSCU值最高的密碼子分別是:TTT(Phe)、TTG(Leu)、ATT(Ile)、GTT(Val)、TCA(Ser)、CCT(Pro)、ACT(Thr)、GCT(Ala)、TAT(Tyr)、CAT(His)、CAA(Gln)、AAT(Asn)、AAA(Lys)、GAT(Asp)、GAA(Glu)、TGT(Cys)、AGA(Arg)、GGT/GGA(Gly)、TGA(終止密碼子)。這20個(gè)密碼子以G/C結(jié)尾的1個(gè),以A/T結(jié)尾的19個(gè)。以上結(jié)果同樣表明,紫花苜蓿偏好于以A/T結(jié)尾的密碼子。
2.6 紫花苜蓿bZIP基因的功能分類
為了預(yù)測(cè)MsbZIP基因潛在的功能,利用MsbZIP基因的GO數(shù)據(jù)通過(guò)WEGO在線程序?qū)ψ匣ㄜ俎ZIP基因進(jìn)行功能注釋(圖3)。MsbZIP基因總體包括分子功能和生物學(xué)過(guò)程兩類。138個(gè)MsbZIP基因最終分為23個(gè)GO分類。在分子功能分類中,具有分子結(jié)合功能的基因最多,有127個(gè),占92%。其次是具有轉(zhuǎn)錄調(diào)節(jié)活性的基因,有119個(gè),占86.2%。僅有1個(gè)基因具有分子結(jié)構(gòu)功能,所占比例最少?;谏镞^(guò)程,這些基因共分為18類。其中有129個(gè)基因具有代謝過(guò)程和細(xì)胞過(guò)程功能,所占比例最高,為93.5%;具有生長(zhǎng)功能的基因僅有1個(gè),所占比例最少,為0.7%。
2.7MsbZIP基因組織表達(dá)相關(guān)性分析
為了研究MsbZIP基因間的共表達(dá)關(guān)系,基于MsbZIP基因的轉(zhuǎn)錄組數(shù)據(jù)計(jì)算了皮爾遜相關(guān)系數(shù)(PCC)。結(jié)果表明,共有372對(duì)基因表達(dá)相關(guān)性極顯著(P<0.01,雙尾檢驗(yàn)),其中有355對(duì)(95.43%)基因表達(dá)極顯著正相關(guān)(r>0.9),17對(duì)(4.57%)基因表達(dá)極顯著負(fù)相關(guān)(r<-0.9)。這表明這些基因可能參與同一生物過(guò)程的調(diào)控。進(jìn)一步對(duì)40對(duì)同源基因(MsbZIP56/MsbZIP104,MsbZIP106/MsbZIP113,MsbZIP25/MsbZIP89,MsbZIP16/MsbZIP19,MsbZIP117/MsbZIP11,MsbZIP126/MsbZIP41,MsbZIP28/MsbZIP108,MsbZIP42/MsbZIP52,MsbZIP32/MsbZIP61,MsbZIP75/MsbZIP114,MsbZIP35/MsbZIP85,MsbZIP118/MsbZIP116,MsbZIP14/MsbZIP22,MsbZIP76/MsbZIP112,MsbZIP48/MsbZIP08,MsbZIP09/MsbZIP129,MsbZIP10/MsbZIP34,MsbZIP49/MsbZI-P97,MsbZIP71/MsbZIP79,MsbZIP62/MsbZIP103,MsbZIP83/MsbZIP115,MsbZIP36/MsbZIP46,MsbZIP107/MsbZIP123,MsbZIP68/MsbZIP98,MsbZIP73/MsbZIP81,MsbZIP04/MsbZIP23,MsbZIP50/MsbZIP47,MsbZIP72/MsbZIP110,MsbZIP40/MsbZIP119,MsbZIP63/MsbZIP66,MsbZIP55/MsbZIP93,MsbZIP31/MsbZIP77,MsbZIP26/MsbZIP54,MsbZIP58/MsbZIP92,MsbZIP06/MsbZIP86,MsbZIP88/MsbZIP124,MsbZIP34/MsbZIP18,MsbZIP64/MsbZIP65,MsbZIP100/MsbZIP121,MsbZIP59/MsbZIP105)進(jìn)行了相關(guān)性分析,如圖4所示。從對(duì)角線的方塊區(qū)域可以看出這40個(gè)同源基因?qū)梢苑譃?組。除了旁系同源基因?qū)sbZIP56/104,MsbZIP49/97,MsbZIP36/46,MsbZIP63/66,MsbZIP31/77,MsbZIP26/54,MsbZIP58/92和MsbZIP134/18分布在不同的組,其它旁系同源基因?qū)谕唤M中(圖4)。相關(guān)性分析表明,分布在同一組的旁系同源基因?qū)ν瑯右簿哂泻芨叩南嚓P(guān)性。例如,MsbZIP106與MsbZIP113(r=0.991,P<0.01)正相關(guān),MsbZIP25與MsbZIP89(r=0.979,P<0.01)正相關(guān)。相反,非旁系同源基因之間也有相關(guān)性很高的情況。例如,MsbZIP88與MsbZIP16(r=-0.898,P<0.05)負(fù)相關(guān),MsbZIP92與MsbZIP19(r=-0.831,P<0.05)負(fù)相關(guān),MsbZIP28與MsbZIP41(r=0.815,P<0.05)負(fù)相關(guān)。
圖2 紫花苜蓿bZIP蛋白的保守結(jié)構(gòu)域Fig. 2 The conserved domain logo of Medicago sativa bZIP proteins
表2 紫花苜蓿bZIP基因的密碼子用法Table 2 Codon usage of Medicago sativa coding sequences
Note: SRCU, relative synonymous codon usage.
圖3 紫花苜蓿bZIP基因的GO分類Fig. 3 GO classifications of MsbZIP genes
bZIP蛋白家族廣泛存在于真核生物中,響應(yīng)多種生物和非生物脅迫反應(yīng),能調(diào)控生物的生長(zhǎng)發(fā)育過(guò)程。bZIP基因在植物中分布廣泛,通過(guò)多種植物研究發(fā)現(xiàn),該類蛋白種類及數(shù)量在物種間存在差異[26]。隨著大量紫花苜蓿轉(zhuǎn)錄組測(cè)序結(jié)果的公布,利用生物信息學(xué)技術(shù)可對(duì)紫花苜蓿bZIP蛋白家族進(jìn)行全面系統(tǒng)地分析[27-29]。
本研究首次通過(guò)生物信息學(xué)手段對(duì)紫花苜蓿的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比對(duì)分析,從中鑒定出138個(gè)紫花苜蓿bZIP基因,比蒺藜苜蓿所鑒定的bZIP基因(75個(gè))多一倍,這可能是紫花苜?;蚪M發(fā)生加倍所造成的。通過(guò)聚類分析與蒺藜苜蓿bZIP基因家族相比較,可將紫花苜蓿bZIP基因分為10個(gè)亞類。在這些亞類中,A和I類所擁有基因數(shù)目最多,分別有31個(gè)和25個(gè)基因,J組僅有3個(gè)基因,分別是MsbZIP55、MsbZIP93和MsbZIP128。在所有分類中,都包含了蒺藜苜?;颍f(shuō)明紫花苜蓿和蒺藜苜蓿具有較高的同源性。同源性較高的基因,其功能也可能具有相似性。例如MsbZIP61與MsbZIP137具有較高同源性,而MsbZIP61基因與鹽脅迫相關(guān),推測(cè)MsbZIP137基因也可能與鹽脅迫相關(guān)。MsbZIP23與MsbZIP38同源性較高,而MsbZIP47與MsbZIP132同源性較高,MsbZIP23和MsbZIP47基因受干旱脅迫誘導(dǎo),推測(cè)MsbZIP38和MsbZIP132也可能與干旱脅迫相關(guān)[12]。
通過(guò)motif比對(duì)分析發(fā)現(xiàn),在bZIP蛋白家族中除了主要結(jié)構(gòu)域外還含有其它一些結(jié)構(gòu)域。這些結(jié)構(gòu)域中,最典型的R/KxxS/T和S/TxxD/E與磷酸化相關(guān)。本研究中發(fā)現(xiàn)紫花苜蓿有42個(gè)bZIP蛋白包含R/KxxS/T,有10個(gè)蛋白包含S/TxxD/E。結(jié)合前人研究結(jié)果可知,ABA的調(diào)控與磷酸化密切相關(guān),從而推測(cè)具有這些結(jié)構(gòu)域的基因可能與植物的抗逆性有關(guān)。在蒺藜苜蓿bZIP基因家族的研究中也發(fā)現(xiàn)類似結(jié)果[12]。 密碼子偏好性在蛋白質(zhì)的結(jié)構(gòu)功能、生物信息學(xué)等研究中具有重要意義,受到了廣泛的關(guān)注。研究發(fā)現(xiàn),密碼子使用偏好性受多種因素影響,例如基因堿基組成、表達(dá)水平等[30]。前人研究表明,禾本科植物少用或避免使用以A或T結(jié)尾的密碼子,偏好于使用以G或C結(jié)尾的密碼子,而雙子葉植物則相反[31-32]。這與紫花苜蓿bZIP基因的密碼子偏好性結(jié)果相一致(表2)。
圖4 紫花苜蓿bZIP基因的相關(guān)性分析Fig. 4 Correlation analysis of MsbZIP genes
GO功能分類是在某一功能層次上統(tǒng)計(jì)蛋白或基因數(shù)目及其組成的方法。通過(guò)GO分類發(fā)現(xiàn),共有138個(gè)MsbZIP基因與23個(gè)GO分類匹配。其中生物學(xué)過(guò)程的GO分類數(shù)多于分子功能的,共有18個(gè)分類。說(shuō)明紫花苜蓿bZIP轉(zhuǎn)錄因子在參與多個(gè)生物學(xué)過(guò)程調(diào)控中起著較為重要的作用。
表達(dá)具有正相關(guān)的基因在生物學(xué)過(guò)程中相互之間可能具有相互促進(jìn)作用,而負(fù)相關(guān)則預(yù)示著基因間可能相互抑制[33]。MsbZIP基因的轉(zhuǎn)錄組數(shù)據(jù)相關(guān)性分析表明,這些相關(guān)性很高的基因可能共同參與調(diào)控相關(guān)的生物過(guò)程,類似結(jié)果在葡萄bZIP轉(zhuǎn)錄因子中也曾被報(bào)道[8]。紫花苜蓿40對(duì)同源基因組織相關(guān)性結(jié)果表明,大多數(shù)同源基因的功能具有相似性,可能主要是因?yàn)檫@些旁系同源基因?qū)χg具有很高的相關(guān)性,但有少數(shù)同源基因的功能也表現(xiàn)出不同。
本研究首次在全轉(zhuǎn)錄組水平對(duì)MsbZIP基因的系統(tǒng)進(jìn)化、蛋白保守結(jié)構(gòu)域、密碼子偏好性及基因表達(dá)等方面進(jìn)行了系統(tǒng)分析,這也是首次對(duì)紫花苜?;蚣易暹M(jìn)行系統(tǒng)分析。研究結(jié)果顯示,該轉(zhuǎn)錄因子家族可被劃分為10類,序列相對(duì)保守的基因分到同一類。蛋白保守結(jié)構(gòu)域分析表明,特定的結(jié)構(gòu)域具有特定的功能。密碼子偏好性分析表明MsbZIP基因密碼子更偏向于使用A/T堿基。基因的轉(zhuǎn)錄組數(shù)據(jù)分析表明,MsbZIP基因在功能上具有較高的相關(guān)性。本研究結(jié)果可對(duì)紫花苜蓿bZIP基因家族基因功能的深入研究奠定一定基礎(chǔ)。
References:
[1] 賈喜濤,劉文獻(xiàn),謝文剛,劉志鵬,劉志敏,王彥榮.蒺藜苜蓿LBD轉(zhuǎn)錄因子基因家族全基因組分析.西北植物學(xué)報(bào),2014,34(10):2176-2187. Jia X T,Liu W X,Xie W G,Liu Z P,Liu Z M,Wang Y R.Genome-wide analysis of the LBD transcription factor family inMedicagotruncatula.Acta Botanica Boreali-occidentalia Sinica,2014,34(10):2176-2187.(in Chinese)
[2] 劉志敏,劉文獻(xiàn),賈喜濤,張正社,王彥榮.蒺藜苜蓿LEA基因家族全基因組分析.草業(yè)科學(xué),2015,32(3):382-391. Liu Z M,Liu W X,Jia X T,Zhang Z S,Wang Y R.Genome-wide analysis ofLEAgene family inMedicagotruncatula.Pratacultural Science,2015,32(3):382-391.(in Chinese)
[3] Perez-Rodriguez P,Riano-Pachon D M,Correa L G G,Rensing S A,Kersten B,Mueller-Roeber B.PInTFDB:Updated content and new features of the plant transcription factor database.Nucleic Acids Research,2010,381:822-827.
[4] 張計(jì)育,渠慎春,郭忠仁,杜小麗,都貝貝,章鎮(zhèn).植物bZIP轉(zhuǎn)錄因子的生物學(xué)功能.西北植物學(xué)報(bào),2011,31(5):1066-1075. Zhang J Y,Qu S C,Guo Z R,Du X L,Du B B,Zhang Z.Biology function of bZIP transcription factors in plants.Acta Botanica Boreali-occidentalia Sinica,2011,31(5):1066-1075.(in Chinese)
[5] Jakoby M,Weisshaar B,Droge-Laser W,Vicente-Carbajosa J,Tiedemann J,Kroj T,Parcy F.bZIP transcription factors inArabidopsis.Trends in Plant Science,2002,7(3):106-111.
[6] Furihata T,Maruyama K,Fujita Y,Umezawa T,Yoshida R,Shinozaki K,Yamaguchi-Shinozaki K.Abscisic acid-dependent multisite phosphorylation regulates the activity of a transcription activator AREB1.Proceedings of the National Academy of Sciences of the United States of America,2006,103(6):1988-1993.
[7] Liao Y,Zou H,Wei W,Hao Y,Tian A,Huang J,Liu Y,Zhang J,Chen S.SoybeanGmbZIP44,GmbZIP62 andGmbZIP78 genes function as negative regulator of ABA signaling and confer salt and freezing tolerance in transgenic Arabidopsis.Planta,2008,228(2):225-240.
[8] Liu J,Chen N,Chen F,Cai B,Dal Santo S D,Tornielli G B,Pezzotti M,Cheng Z M.Genome-wide analysis and expression profile of the bZIP transcription factor gene family in grapevine (Vitisvinifera).BMC Genomics,2014,15(281):1-18.
[9] Nijhawan A,Jain M,Tyagi A K,Khurana J P.Genomic survey and gene expression analysis of the basic leucine zipper transcription factor family in rice.Plant Physiology,2008,146(2):333-350.
[10] Wang J,Zhou J,Zhang B,Vanitha J,Ramachandran S,Jiang S.Genome-wide expansion and expression divergence of the basic leucine zipper transcription factors in higher plants with an emphasis on sorghum.Journal of Integrative Plant Biology,2011,53(3):212-231.
[11] Wei K,Chen J,Wang Y,Chen Y,Chen S,Lin Y,Pan S,Zhong X,Xie D.Genome-wide analysis ofbZIP-encoding genes in maize.DNA Research,2012,19(6):463-476.
[12] Zhang Z S,Liu W X,Qi X,Liu Z P,Xie W G,Wang Y R.Genome-wide identification,expression profiling,and SSR marker development of the bZIP transcription factor family inMedicagotruncatula.Biochemical Systematics and Ecology,2015,61:218-228.
[13] Huang X,Ouyang X,Yang P,Lau O S,Li G,Li J,Chen H,Deng X W.ArabidopsisFHY3 and HY5 positively mediate induction ofCOP1 transcription in response to photomorphogenic UV-B light.Plant Cell,2012,24(11):4590-4606.
[14] Abe M,Kobayashi Y,Yamamoto S,Daimon Y,Yamaguchi A,Ikeda Y,Ichinoki H,Notaguchi M,Goto K,Araki T.FD,a bZIP protein mediating signals from the floral pathway integrator FT at the shoot apex.Science,2005,309:1052-1056.
[15] Guan Y,Ren H,Xie H,Ma Z,Chen F.Identification and characterization of bZIP-type transcription factors involved in carrot (DaucuscarotaL.) somatic embryogenesis.Plant Journal,2009,60(2):207-217.
[16] Izawa T,Foster R,Nakajima M,Shimamoto K,Chua N H.The rice bZIP transcriptional activator RITA-1 is highly expressed during seed development.Plant Cell,1994,6(9):1277-1287.
[17] Graham P H,Vance C P.Legumes:Importance and constraints to greater use.Plant Physiology,2003,131(3):872-877.
[18] Mouttet R,Escobar-Gutiérrez A,Esquibet M,Gentzbittel L,Mugniéry D,Reignault P,Sarniguet C,Castagnone-Sereno P.Banning of methyl bromide for seed treatment:Could Ditylenchus dipsaci again become a major threat to alfalfa production in Europe.Pest Management Science,2014,70(7):1017-1022.
[19] Liu W X,Zhang Z S,Chen S Y,Ma L C,Wang H C,Dong R,Wang Y R,Liu Z P.Global transcriptome profiling analysis reveals insight into saliva-responsive genes in alfalfa.Plant Cell Reports,2016,35(3):561-571.
[20] O’Rourke J A,Fu F,Bucciarelli B,Yang S S,Samac D A,Lamb J F S,Monteros M J,Graham M A,Gronwald J W,Krom N,Li J,Dai X,Zhao P X,Vance C P.TheMedicagosativagene index 1.2:A web-accessible gene expression atlas for investigating expression differences betweenMedicagosativasubspecies.BMC Genomics,2015,16:1-17.
[21] Fujita Y,Yoshida T,Yamaguchi-Shinozaki K.Pivotal role of the AREB/ABF-SnRK2 pathway in ABRE-mediated transcription in response to osmotic stress in plants.Physiologia Plantarum,2013,147(1):15-27.
[22] Choi H I,Hong J H,Ha J O,Kang J Y,Kim S Y.ABFs,a family of ABA-responsive element binding factors.Journal of Biological Chemistry,2000,275(3):1723-1730.
[23] Tamai H,Iwabuchi M,Meshi T.ArabidopsisGARP transcriptional activators interact with the pro-rich activation domain shared by G-box-binding bZIP factors.Plant and Cell Physiology,2002,43(1):99-107.
[24] 李平,白云鳳,馮瑞云,王原媛,張維鋒.籽粒莧蘋果酸酶(NAD-ME)基因密碼子偏好性分析.應(yīng)用與環(huán)境生物學(xué)報(bào),2011,17(1):12-17. Li P,Bai Y F,Feng R Y,Wang Y Y,Zhang W F.Analysis of codon bias ofNAD-MEgene inAmaranthushypochondriacus.Chinese Journal of Applied & Environmental Biology,2011,17(1):12-17.(in Chinese)
[25] Sharp P M,Li W H.An evolutionary perspective on synonymous codon usage in unicellular organisms.Journal of Molecular Evolution,1986,24(1-2):28-38.
[26] 張珍珠,陳秀玲,王沛文,戚飛,謝瑩,王傲雪.番茄bZIP基因家族的系統(tǒng)進(jìn)化分析.東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2014,45(9):47-55. Zhang Z Z,Chen X L,Wang P W,Qi F,Xie Y,Wang A X.Phyletic evolution analysis ofbZIPfamily in tomato.Journal of Northeast Agricultural University,2014,45(9):47-55.(in Chinese)
[27] Tu M X,Wang X H,Huang L,Guo R R,Zhang H J,Cai J S,Wang X P.Expression of a grape bZIP transcription factor,VqbZIP39,in transgenicArabidopsisthalianaconfers tolerance of multiple abiotic stresses.Plant Cell Tissue and Organ Culture,2016,125(3):537-551.
[28] 秦玉海,張小紅,馮露,李微微,徐兆師,李連城,周永斌,馬有志,刁現(xiàn)民,賈冠清,陳明,閔東紅.谷子轉(zhuǎn)錄因子基因SibZIP42在擬南芥中對(duì)高鹽和ABA的響應(yīng).中國(guó)農(nóng)業(yè)科學(xué),2016,49(17):3276-3286. Qin Y H,Zhang X H,Feng L,Li W W,Xu Z S,Li L C,Zhou Y B,Ma Y Z,Diao X M,Jia G Q,Chen M,Min D H.Response of millet transcription factor geneSibZIP42 to high salt and ABA treatment in transgenicArabidopsis.Scientia Agricultura Sinica,2016,49(17):3276-3286.(in Chinese)
[29] 李月,許朋斐,陳全家,代培紅,劉超,曲延英,劉曉東.棉花bZIP轉(zhuǎn)錄因子基因GhbZIP15的克隆與表達(dá)分析.棉花學(xué)報(bào),2015,27(6):515-523. Li Y,Xu P F,Chen Q J,Dai P H,Liu C,Qu Y Y,Liu X D.Molecular cloning and expression of a bZIP transcription factor geneGhbZIP15 on cotton (GossypiumhirsutumL.).Cotton Science,2015,27(6):515-523.(in Chinese)
[30] Karlin S,Campbell A M,Mrazek J.Comparative DNA analysis across diverse genomes.Annual Review of Genetics,1998,32:185-225.
[31] 劉慶坡,馮英,董輝.20個(gè)物種同義密碼子偏性的比較分析.西北農(nóng)林科技大學(xué)學(xué)報(bào):自然科學(xué)版,2004,32(7):67-71. Liu Q P,Feng Y,Dong H.Comparative studies on synonymous codon usage bias in twenty species.Journal of Northwest A & F University:Natural Science Edition,2004,32(7):67-71.(in Chinese)
[32] Wang L,Roossinck M J.Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants.Plant Molecular Biology,2006,61(4-5):699-710.
[33] 王俞程,何瑞萍,彭獻(xiàn)軍,沈世華.WOX轉(zhuǎn)錄因子家族研究進(jìn)展.草業(yè)科學(xué),2015,32(5):760-769. Wang Y C,He R P,Peng X J,Shen S H.The research progress of WOX transcription factor family.Pratacultural Science,2015,32(5):760-769.(in Chinese)
(責(zé)任編輯 王芳)
The identification, evolutionary characterization and expression analysis of thebZIPtranscription factor family inMedicagosativa
Qi Xiao1,2, Zhang Zheng-she3, Min Xue-yang3, Sun Qi-zhong1, Liu Wen-xian3
(1.Institute of Grassland Research of Chinese Academy of Agricultural Sciences, Huhhot 010010, China;2.National Animal Husbandry Service, Office of the Chinese Herbage Cultivar Registration Board, Beijing 100125, China;3.State Key Laboratory of Grassland Argo-ecosystems, College of Pastoral Agriculture Science and Technology, Lanzhou University, Lanzhou 730020, China)
Basic leucine zipper transcription factors are one of the most extensive and conserved transcription factors in the eukaryote proteins. Currently, several bZIP transcription factors have been identified in many plants. bZIP transcription factors participate extensively in the regulation of seed storage gene expression, development, photomorphogenesis, pathogen defense, biotic and abiotic stress responses, ABA signalling, and more. In this study, 138 bZIP transcription factor-encoding genes were identified by a comprehensive computational analysis of theMedicagosativatranscriptome databases. Phylogenetic analysis of the bZIP protein sequences permits classification of the genes into 10 groups inM.sativa. The codon bias results showed that the alfalfaMsbZIPgene was biased toward the synonymous codons with A and T. Moreover, the gene ontology (GO) term annotations of the 138MsbZIPwere annotated and classified into 23 categories according to biological processes and molecular function. The co-expression relationship betweenMsbZIPgenes showed that significant correlations existed between 372 pairs ofMsbZIPgenes at the 0.01 level. These results will be important for the functional characterization of bZIP transcription factors inM.sativa, and facilitate further research on thebZIPgene family regarding their evolutionary history and biological functions.
bZIP transcription factors;Medicagosativa; phylogenetic analysis; codon bias
Sun Qi-zhong E-mail:sunqz@126.com Liu Wen-xian E-mail:liuwx@lzu.edu.cn
10.11829/j.issn.1001-0629.2016-0520
2016-10-17 接受日期:2016-11-29
現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng)資金國(guó)家牧草產(chǎn)業(yè)技術(shù)體系項(xiàng)目(CARS-35);中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程牧草栽培與加工利用團(tuán)隊(duì)項(xiàng)目(CAAS-ASTIP-IGR 2015-02);國(guó)家自然科學(xué)基金青年科學(xué)基金(31502000);蘭州大學(xué)中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金(lzujbky-2016-8);國(guó)家草品種區(qū)域試驗(yàn)項(xiàng)目(21301060001);巴彥淖爾肉羊優(yōu)質(zhì)飼草高效生產(chǎn)關(guān)鍵技術(shù)集成與研究應(yīng)用
齊曉(1982-),男,河北泊頭人,農(nóng)藝師,在讀博士生,主要從事草品種管理和推廣工作。E-mail:tq07mms@sina.com共同第一作者:張正社(1990-),男,甘肅靖遠(yuǎn)人,在讀博士生,主要從事牧草育種及牧草種子分子生物學(xué)研究。E-mail:zhangzhsh16@lzu.edu.cn
孫啟忠(1959-),男,內(nèi)蒙古五原人,研究員,博士,主要從事飼草栽培利用研究。E-mail:sunqz@126.com 劉文獻(xiàn)(1981-),男,河南開(kāi)封人,副教授,博士,主要從事牧草育種與分子生物學(xué)研究。E-mail:liuwx@lzu.edu.cn
S541+.1;Q786
A
1001-0629(2017)08-1635-14
齊曉,張正社,閔學(xué)陽(yáng),孫啟忠,劉文獻(xiàn).紫花苜蓿bZIP基因家族的鑒定、進(jìn)化及表達(dá)分析.草業(yè)科學(xué),2017,34(8):1635-1648.
Qi X,Zhang Z S,Min X Y,Sun Q Z,Liu W X.The identification, evolutionary characterization and expression analysis of thebZIPtranscription factor family inMedicagosativa.Pratacultural Science,2017,34(8):1635-1648.
植物生產(chǎn)層