宋 剛,方志剛,王玉龍,蔡慶生,徐 彬
(1. 江蘇農林職業(yè)技術學院茶與食品科技學院, 江蘇 句容 212400;2. 南京農業(yè)大學生命科學學院, 江蘇 南京 210095;3. 喀什大學生命與地理科學學院, 新疆 喀什 844099;4. 南京農業(yè)大學草業(yè)學院, 江蘇 南京 210095)
熱激蛋白(heat shock proteins, Hsps)是一類受環(huán)境脅迫誘導表達的蛋白[1],其中Hsp70 家族(分子量在68~78 kDa)是在生物體內分布最廣和研究最多的一類熱激蛋白,具有典型的Hsps 的結構特征[2],也是Hsps 中結構和功能最保守的蛋白家族[3]。Hsp70s 結構上主要由核苷酸結合結構域(nucleotide binding domain, NBD)、底物結合結構域(substrate binding domain, SBD)與可變C 端區(qū)組成,其可變C端區(qū)柔韌、有利于底物與SBD 結合[4]。
當植物遭遇非生物脅迫時,能夠快速激活特定的Hsp70s。作為分子伴侶,Hsp70s 能幫助蛋白質在不利環(huán)境中正確折疊,阻止蛋白質聚集或失活,在細胞蛋白質量控制和降解系統(tǒng)中起著中心作用,以促進細胞耐受脅迫環(huán)境[5-6]。一些Hsp70s 在條件適宜時也發(fā)揮著“管家”蛋白的關鍵作用[7]。例如,定位于內質網(endoplasmic reticulum, ER)上部分Hsp70s基因編碼的BiPs (binding proteins),具有執(zhí)行重要蛋白合成、折疊和裝配的功能[8]。研究表明,Hsp70基因表達水平與植物耐熱性之間存在顯著的正相關關系[9],這已經在辣椒(Capsicum annuum)[1,3]、擬南芥(Arabidopsis thaliana)[10]、水稻(Oryza sativa)[11]中得到證實。植物基因組中Hsp70基因通常具有多拷貝,模式植物擬南芥[12]基因組有19 個Hsp70基因,其中3 個編碼BiP,且3 個AtBiPs 表達均受干旱、冷、病蟲害等環(huán)境脅迫的調控[13-14]。水稻含有32 個Hsp70基因,5 個是BiP[15]。其中,OsBiP1主要在種子成熟過程中表達,影響種子的表型和胚乳細胞的胞內結構,參與種子發(fā)育調控[16];OsBiP3參與調 控Xa21 介導的植物抗病免疫力[17];OsBiP4和OsBiP5與內質網脅迫響應高度關聯(lián)[18]。大豆(Glycinemax)[19]中鑒定出61 個Hsp70基因,玉米(Zea mays)[20]中是35 個,芝麻(Sesamum indicum)[21]為21 個,馬鈴薯(Solanum tuberosum)[22]中則有20 個。
柳枝稷(Panicum virgatum)是一種多年生禾本科C4草本植物,原產于北美洲20°~60° N,適應性強。柳枝稷根系發(fā)達,可在邊際土地和污染土地生長,其生物量所含纖維素能用于生產乙醇和丁醇等生物燃料[23-25],早在1992 年柳枝稷就被美國能源部確立為生物能源模式植物[26]。此外,由于柳枝稷生物產量大,根系發(fā)達,且能夠耐受中低濃度鎘污染[27-29],因此柳枝稷也可作為鎘污染土地修復的重要植物物種[30-31]。目前,柳枝稷全基因組測序已經完成[32],但關于柳枝稷Hsp70基因家族(PvHsp70s)研究尚未有報道。本文通過生物信息學方法鑒定出PvHsp70家族基因成員,分析了基因結構、染色體分布、進化和表達模式,以期挖掘柳枝稷逆境響應基因,為研究PvHsp70基因功能與柳枝稷分子改良提供理論依據。
柳枝稷基因組與蛋白數(shù)據下載自Phytozome(Panicum virgatumv4.1, http://phytozome.jgi.doe.gov/)數(shù)據庫網站。從Pfam (http://pfam.xfam.org)下載Hsp70 蛋白結構域的隱馬爾可夫模型(hidden markov modle,HMM) 種子文件PF00012,用于本地基因庫的PvHsp70基因鑒定。通過HMMER 軟件(http://hmmer.org)在柳枝稷全基因組蛋白序列中搜索含有該保守結構域的序列,設置E-value < 0.001。候選序列提交SMART (http://smart.embl.de)、Pfam 蛋白數(shù)據庫進行Hsp70 結構域驗證,并從柳枝稷基因組數(shù)據中提取驗證確認的蛋白和基因編碼序列(coding sequence, CDS)。使用在線軟件WOLFPSORT (https://www.genscript.com/wolf-psort.html)預測分析氨基酸序列大小、分子量、等電點等理化特征。
從擬南芥TAIR 數(shù)據庫(http://www.arabidopsis.org)和RGAP 數(shù)據庫(http://rice.plantbiology.msu.edu)下載擬南芥和水稻Hsp70 蛋白序列,通過MEGA7.0中clustalw (http://www.megasoftware.net)進行多序列比對,比對結果采用鄰接法[13]構建系統(tǒng)發(fā)育進化樹,Bootstrap 值設置1 000,其余參數(shù)使用默認值。通過在線工具GSDS2.0 (http://gsds.cbi.pku.edu.cn/),分析PvHsp70基因的外顯子-內含子結構。利用MEME在線軟件(http://meme.nbcr.net/meme/) 鑒定保守基序(motif),motif 的最大數(shù)目設定為10,長度6 到100個氨基酸,其余參數(shù)默認。在CDD 數(shù)據庫(https://www.ncbi.nlm.nih.gov/cdd)分析motif 結構特征。
使用PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html)數(shù)據庫分析PvHsp70基因上游2 kb 啟動子序列中順式作用元件(cis-acting element)。使用Mapchart 軟件(https://www.wur.nl/en/show/Mapchart.html)繪制基因染色體定位圖。參照Gu 等[33]比對條件(a.比對的短序列占較長的序列的70%以上;b.兩序列比對相似性大于70%),使用makeblastdb 和blastall 命令篩選復制基因。通過MCsacnx 軟件(http://chibba.pgml.uga.edu/mcscan2/MC ScanX.zip)分析PvHsp70基因共線性關系,并繪制circos 圈圖。
分別在柳枝稷microarray 數(shù)據庫網站(https://switchgrassgenomics.noble.org)中下載PvHsp70s基因在柳枝稷的根、莖、葉、花等不同組織的14 個不同發(fā)育階段以及授粉后不同發(fā)育天數(shù)(days after pollination, DAP) 7 個階段的表達量數(shù)據(FPKM 值),并從鎘脅迫柳枝稷根系RNA-seq 結果[34]中提取PvHsp70s的表達量數(shù)據(FPKM 值)。利用TBtools 軟件(https://github.com/CJ-Chen/TBtools/releases)分析上述基因表達并繪制表達量熱圖。
經HMMER 搜索和SMART、PFAM 數(shù)據庫結構域確認,除去冗余和缺失序列,存在可變剪切的僅選取1 個最長的轉錄本,并剔除分子量預測小于60 kDa 的轉錄本,共在柳枝稷基因組中鑒定出41 個PvHsp70基因。由于柳枝稷為四倍體(2n= 4x= 36),有兩個亞基因組K 和N,基本染色體數(shù)為9[35],因此,按轉錄本信息中染色體序號從小到大、亞基因組先K 后N 及基因組位置從小到大的規(guī)則將33 個分子量在60~80 kDa 之間的命名為PvHsp70-1~PvHsp70-33。參照擬南芥[13]和水稻[16]中分類,將其余8 個分子量大于80 kDa 的Hsp70s,歸為Hsp110/SSE 亞家族成員,命名為PvHsp110-1~PvHsp110-8。PvHsp基因的CDS 序列長度在1 626 (PvHsp70-24)~2 694 bp (PvHsp110-1、PvHsp110-2) 之 間,氨 基 酸數(shù)量范圍在548 (PvHsp70-23)~897 aa (PvHsp110-1、PvHsp110-2),分子量介于60.55 (PvHsp70-23)~98.95(PvHsp110-1)。PvHsp70-4、PvHsp70-21、PvHsp70-24和PvHsp70-33 這4 個蛋白預測等電點大于7.0,剩余蛋白等電點都小于7.0。亞細胞定位預測顯示,PvHsp70s 中有22 個定位在細胞質(cyto)、7 個定位于內質網(ER)、6 個定位于質體(plasto)、6 個定位在線粒體(mito)上(表1)。
表1 柳枝稷PvHsp70 基因鑒定、序列特征和亞細胞定位Table 1 List of PvHsp70 genes identified in switchgrass, their sequence characteristics and subcellular localization
續(xù)表1Table 1 (Continued)
BiP 蛋白序列包含一個C 端ER 駐留信號,植物中這個信號序列通常是“HDEL”[36]。 41 個PvHsp70中有6 個符合此特征,且亞細胞定位預測均在ER上。經CDD 在線工具數(shù)據庫(KOGv1.0) 進行序列分析,其中2 個含有KOG0104 (Molecular chaperones GRP170/SIL1, HSP70 superfamily)結構域,另4 個含有BiP基因結構域特征KOG0100 (Molecular chaperones GRP78/BiP/KAR2, HSP70 superfamily) (表2)。
表2 柳枝稷PvHsp70 基因家族中BiP 基因分析Table 2 Analysis of BiP genes in the PvHsp70 family of switchgrass (Database: KOGv1.0)
PvHsp70 系統(tǒng)進化樹(圖1A)顯示,41 個成員一共聚類成6 個組。組1 含有16 個(占39%)成員,數(shù)量最多;組5 僅含2 個成員(4.9%),數(shù)量最少。相同組內PvHsp70 成員基因結構和保守基序(motif)的類型、數(shù)量與順序分布基本相似,不同組之間則有明顯區(qū)別(圖1B、C)。組1 中,PvHsp70-12和PvHsp70-16具有2 個內含子,其他14 個基因都含有1 個內含子。組2 成員基因內含子數(shù)為0、1 和7 三種類型,組3 中是7 和8,組4 中為4 和5,組5 中則是0 和2,組6 中為8、9、13 和14 四種結構形式。同組內成員基因內含子數(shù)量差異較大,預示著同組基因在功能上可能具有多樣性特征。MEME 網站分析出的10個motif 長度在21~80 aa (表3),motif 1、2、4、5、6、7 和10 屬于Hsp70 核苷酸結構域(NBD of the sugar inase/HSP70/actin superfamily),PvHsp70 成員都具有上述motif 中的全部或大部。motif 9 為分子伴侶Dank (molecular chaperone DnaK)結構域,只存在1~5 組成員(PvHsp70-1~PvHsp70-33) 中,因此可把這5 組成員劃為分子伴侶Dank 亞家族。組6 中成員(PvHsp110-1~PvHsp110-8) 都不含motif 9,也沒有motif 3 或8 [ 均為Hsp70 蛋白結構域(heat shock 70 kDa protein)]存在,并非分子伴侶Dank 亞家族成員,這與2.1 中依據分子量將其劃分為Hsp110/SSE 亞家族的結果是吻合的。綜上可知,PvHsp70 家族成員分屬于分子伴侶Dank 亞家族(PvHsp70-1~PvHsp70-33)和Hsp110/SSE 亞家族(PvHsp110-1~PvHsp110-8)。
表3 柳枝稷PvHsp70 蛋白的基序序列組成Table 3 Basic sequence composition of motifs of PvHsp70 proteins in switchgrass
圖1 柳枝稷PvHsp70 成員系統(tǒng)進化、基因結構與保守基序組成Figure 1 Phylogenetic relationships, motif composition, and gene structure of PvHsp70 proteins of switchgrass
將柳枝稷(41 個)、擬南芥(18 個)、水稻(32個)的Hsp70s 構建了系統(tǒng)發(fā)育進化樹(圖2),結果顯示:91 個Hsp70 蛋白可聚成4 類,根據2.1 亞細胞定位預測結果,分別是細胞質Hsp70 蛋白(CⅠ和CⅡ區(qū))、內質網Hsp70 蛋白(ERⅠ和ERⅡ區(qū))、線粒體Hsp70 蛋白(M 區(qū))和質體Hsp70 蛋白(PⅠ和PⅡ區(qū))。細胞質Hsp70 蛋白數(shù)量達到47 個(柳枝稷22 個,水稻16 個,擬南芥9 個),占總數(shù)的51.6%,表明細胞質是Hsp70 的主要功能區(qū)域。此外,54 個Hsp70基因有同源關系,3 對為直系同源基因(AT3G12580與Os03g60620,PvHsp110-2與Os02g48110,PvHsp70-20與Os03g50250),24 對屬于旁系同源基因(柳枝稷內17 對,擬南芥內4 對,水稻內3 對)。
圖2 柳枝稷、水稻及擬南芥Hsp70 蛋白系統(tǒng)進化樹Figure 2 Phylogenetic tree of Hsp70 proteins from switchgrass, rice, and Arabidopsis
柳枝稷PvHsp70基因上游2 kb 啟動子區(qū)主要存在兩類順式作用元件,即響應非生物脅迫相關作用元件和激素應答順式作用元件(表4)。響應非生物脅迫相關作用元件主要有:響應熱脅迫的HSE 和CCAAT-box 元件、響應低溫脅迫的LTR 元件、響應干旱脅迫的相關作用元件MBS、與機械損傷有關的WUN-motif 元件、植物響應脅迫的TC-rich repeats元件。激素應答順式作用元件主要有:生長素響應元件(AuxRR-core)、乙烯反應作用元件(ERE)、脫落酸作用反應元件(ABRE,motif IIb)、水楊酸作用反應元件(TCA-element)、 赤霉素作用響應元件(GARE-motif, TATC-box)、茉莉酸甲酯作用元件(CGTCA-motif)和植物激素反應作用元件(TGA-box)。上述結果表明PvHsp70基因與多種脅迫密切相關。
續(xù)表4Table 4 (Continued)
PvHsp70基因在染色體上分布顯示,柳枝稷18 條染色體(K 和N 亞基因組各9 條)中12 條上有PvHsp70基因,且分布不均衡(圖3)。其中,09K 染色體上PvHsp70數(shù)量最多(11 個,占基因總數(shù)的26.8%),其次是03N 染色體(6 個),03K、09N 染色體各有5 個,01K、01N、02K、02N、05K、05N 染色體各有2 個,04K、04N 染色體只含1 個。MCsacnx 查找和circos 圖呈現(xiàn)出柳枝稷染色體上PvHsp70基因的共線性關系(圖4),有32 個PvHsp70基因具有共線性關系,形成21 對具有復制關系基因(PvHsp70-1和PvHsp70-2、PvHsp110-6和PvHsp110-7等)。多條紅色線連接基因可能經歷多次復制事件,如PvHsp-16與PvHsp70-8、PvHsp70-12、PvHs70-18、PvHs70-25四個基因。此外,MCsacnx 查找發(fā)現(xiàn)03N 染色體上PvHsp110-4和PvHsp110-5為一對串聯(lián)復制基因。
圖3 柳枝稷PvHsp70 基因在染色體上的分布Figure 3 Chromosomal distribution of PvHsp70 genes of switchgrass
圖4 柳枝稷PvHsp70 基因共線性Circos 圖Figure 4 Circos diagram of collinearity relationships of PvHsp70 genes in switchgrass
從PvHsp70基因在生長和發(fā)育21 個階段的表達量熱圖(圖5) 可看出,PvHsp70家族基因的不同成員之間表達量具有差異。其中,PvHsp70-2和PvHsp70-10在各個階段表達量均很高,PvHsp70-22和PvHsp70-31明顯在種子發(fā)育階段中具有更高的表達。PvHsp70-5和PvHsp70-21在花器官中表達量明顯高于其他階段。PvHsp70-18在根中表達量較高,葉中表達量較高的有PvHsp70-4、PvHsp70-7、PvHsp70-9和PvHsp70-13等??傮w上,在種子發(fā)育形成過程中,多個PvHsp70的表達量要高于其他生長階段,說明其可能參與種子發(fā)育調控。
此外,根據CdCl2處理(0、6、24 h)后的柳枝稷根系RNA-seq 數(shù)據,共發(fā)現(xiàn)41 個PvHsp70基因中有29 個在鎘脅迫后發(fā)生上調表達,其中PvHsp70-16、PvHsp70-18、PvHsp70-32和PvHsp70-27四個基因上調表達倍數(shù)較高,而PvHsp70-15是唯一在經6 h、24 h 鎘脅迫下表達量持續(xù)上升的基因。另外,有4 個基因在鎘處理下持續(xù)下調表達(PvHsp70-3、PvHsp70-5、PvHsp110-6和Hsp110-7),還有7 個基因(PvHsp70-9、PvHsp70-26、PvHsp70-24、PvHsp70-20、PvHsp70-17、PvHsp70-25和PvHsp70-23) 表 達 量 較低,基本不受鎘誘導表達(圖6)。
圖6 柳枝稷根系PvHsp70 基因在鎘脅迫下的表達量熱圖Figure 6 Heatmap of expression of PvHsp70 genes in switchgrass roots under cadmium stress
Hsp70基因是在生物體內分布最廣和研究最多的一類基因家族。本研究在柳枝稷基因組中共鑒定命名了41 個PvHsp70基因,通過分子量大小以及motif 結構域特征分析,33 個成員(PvHsp70-1~PvHsp70-33)被歸于分子伴侶Dank 亞家族,其余8 個成員(PvHsp110-1~PvHsp110-8)被劃為HSP110/SSE 亞家族,在擬南芥[12]和水稻[15]中也存在類似劃分。無或僅有1 個內含子的基因通過可變剪切實現(xiàn)單個基因多個蛋白質翻譯的可能性較小,在進化中其功能會較保守和單一[37]。PvHsp70基因中無內含子或含1 個內含子的成員共19 個,占基因總數(shù)的46.3%。在玉米[20]、大豆[19]、芝麻[21]及辣椒[38]中此比例分別是37.1%、34.4%、42.8%和33.3%,與本研究中基本接近,說明柳枝稷與其他物種中具有相似比例且高度保守的Hsp70基因。不同物種間進化分析發(fā)現(xiàn),同一進化枝的柳枝稷、水稻直系同源基因(PvHsp110-2、Os02g48110) 又與擬南芥AT4G16660聚為一枝(圖2),既表明單子葉植物柳枝稷與水稻間親緣關系比雙子葉的擬南芥更近,更能揭示出起源于共同祖先的直系同源基因在單/雙子葉植物分離前就已形成的進化特征[20]。此外,17 對旁系同源PvHsp70基因是兩兩分別位于柳枝稷K 和N 亞基因組中同源染色體上(圖2、圖3),在柳枝稷PvHsp20基因研究中也有相同結果[39],加之32 個PvHsp70基因存在共線性關系(圖4),揭示出柳枝稷進化過程中的基因組復制與加倍,有助于對柳枝稷異源四倍體形成機制的深入研究?;虮磉_分析表明(圖5),PvHsp70基因間在不同組織、發(fā)育階段和鎘處理下表達呈現(xiàn)差異。其中,PvHsp70-2和PvHsp70-10在各組織發(fā)育階段的表達量都較高,可能在柳枝稷生長發(fā)育過程中具有重要調節(jié)作用。PvHsp70-4、PvHsp70-5、PvHsp70-7、PvHsp70-9、PvHsp70-13 、PvHsp70-18、PvHsp70-21、PvHsp70-22、PvHsp70-31和PvHsp70-32在特定生長發(fā)育階段中表達量較高,暗示這些基因可能功能上有差異。
圖5 柳枝稷PvHsp70 基因在21 個組織的表達量熱圖Figure 5 Heatmap of expression of Hsp70 genes of switchgrass in 21 tissues
研究表明,Hsp70在適應各類植物脅迫中發(fā)揮著重要的作用[40],可提高植物對逆境的抵御能力,如高溫和干旱[41-42]、高鹽[43]和重金屬[44]。41 個PvHsp70基因中有29 個在鎘脅迫下上調表達(圖6),馬鈴薯在4 種非生物脅迫(鹽、干旱、冷和熱) 時,20 個StHsp70基因共有14 個基因全部處理或部分處理時上調,都反映出Hsp70基因能夠響應非生物脅迫,調控植物的耐受能力[22]。植物遭受非生物脅迫(如高溫、干旱、鹽害等)時,植物細胞內會積累大量未折疊蛋白或錯誤折疊蛋白,造成內質網脅迫,此時細胞會啟動蛋白監(jiān)控信號通路-未折疊蛋白應答響應(UPR)[45-46]。分子伴侶BiP 是響應UPR 的重要成員,能幫助蛋白質正確折疊或遷移,從而起到穩(wěn)定蛋白質的功能[5]。PvHsp70-15是鎘脅迫下唯一持續(xù)上調表達的PvHsp70基因,其編碼BiP 蛋白已被證實具有提升擬南芥耐鎘的能力[34]。油菜(Brassica campestris)BiP同源基因BnA7Hsp70超表達后使油菜在缺水、滲透脅迫以及衣霉素處理后表現(xiàn)較強的耐受性[47]。由此可見,PvHsp70-15 在響應脅迫時可能提升柳枝稷逆境耐受能力,柳枝稷Hsp70家族中有4 個BiP基因(PvHsp70-1、PvHsp70-2、PvHsp70-15、PvHsp70-17) (表2),深入開展其逆境功能研究將對挖掘柳枝稷耐逆基因資源具有重要意義。
本研究在柳枝稷基因組中共鑒定了41 個PvHsp70基因,分屬分子伴侶Dank 亞家族(33 個)和HSP110/SSE 亞家族(8 個)。41 個基因不均衡分布在柳枝稷12 條染色體上,位于09K 染色體上分布數(shù)量最多(11 個)?;蚬簿€性研究發(fā)現(xiàn),32 個基因有共線性關系且1 對是串聯(lián)復制基因。所有PvHsp70基因均為組成型表達,大部分具有組織特異性,參與柳枝稷生長與發(fā)育的調控。PvHsp70-15為分子伴侶BiP 編碼基因,鎘脅迫下持續(xù)上調表達,可作為耐逆基因深入開展功能研究。