劉 營, 尹 澤, 江姚蘭, 周定港,3*
(1. 湖南科技大學 生命科學學院, 湖南 湘潭 411201; 2. 經(jīng)濟作物遺傳改良與綜合利用湖南省重點實驗室, 湖南 湘潭 411201; 3. 福建農(nóng)林大學農(nóng)業(yè)農(nóng)村部福建甘蔗生物學與遺傳育種重點實驗室, 福州 350002 )
甘蔗(Saccharumspp.)是重要的一年生或多年生糖料作物,屬于單子葉植物綱(Monocotyledoneae)禾本科(Poaceae)甘蔗屬(SaccharumL.)(Irvine, 1999)。甘蔗是一種高光合效率的C4植物,具有生物量大、CO2補償點低、耐干旱、適應性廣和產(chǎn)量高等特點(方靜平等, 2014)。甘蔗是異源多倍體,其倍性水平從5×到16×不等,其基因組大小約為10 Gb(陳如凱, 2011)。現(xiàn)代栽培甘蔗是世界上最重要的食糖來源,占全世界食糖總量的80%(Liu et al., 2020)。
NRAMP轉(zhuǎn)運體在離子穩(wěn)態(tài)的維持,尤其是在二價金屬離子的轉(zhuǎn)運上發(fā)揮著重要作用,并且該蛋白家族在進化過程中高度保守(Nevo & Nelson, 2006)。哺乳動物NRAMP基因的氨基酸序列與酵母、水稻和果蠅NRAMP基因的氨基酸序列相似性分別為46%、58%和73%(Belouchi et al., 1995)。在植物吸收重金屬的過程中,NRAMP蛋白等膜轉(zhuǎn)運蛋白發(fā)揮著重要作用(Cellier et al., 1995)。M?ser等(2001)對擬南芥的6個NRAMP基因進行克隆和系統(tǒng)進化分析發(fā)現(xiàn),6個家族成員被分為2個亞家族,其中AtNRAMP1和AtNRAMP6位于第一亞家族,AtNRAMP2至AtNRAMP5屬于第二亞家族。AtNRAMP1蛋白是模式生物擬南芥中的主要高親和性錳轉(zhuǎn)運蛋白,定位于質(zhì)膜,其功能是將重金屬轉(zhuǎn)運至細胞質(zhì)(Cailliatte et al., 2010)。Pottier等(2015)研究發(fā)現(xiàn)誘導表達AtNRAMP4的酵母株突變會導致其鎘和鋅的吸收下降,而對于鐵的吸收量沒有改變,此研究提示人為誘導NRAMP轉(zhuǎn)運蛋白的突變可用于降低動植物對Cd的吸收和轉(zhuǎn)運。不同植物的NRAMP家族成員具有組織表達特異性,如AtNRAMP1在根中高表達(Castaings et al., 2016),而AtNRAMP2則主要在根表皮和根尖區(qū)域表達(Gao et al., 2018);OsNRAMP1在營養(yǎng)生長階段的根部以及在生殖生長期時的葉片和莖中均為高表達(Takahashi et al., 2011)。
甘蔗是重要的經(jīng)濟作物,與其他植物一樣也面臨著重金屬污染問題。重金屬對于植物的生長起著十分重要的作用,一些二價重金屬離子如Cu2 +、Zn2 +和Mn2 +等是植物生長必需的微量元素,而有些重金屬如Cd2+和Pb2+等的過度吸收則會造成植物的重金屬毒害甚至影響產(chǎn)量(Rosa-Santos et al., 2020)。植物NRAMP蛋白的功能研究在擬南芥(Thomine et al., 2000)、水稻(Luo et al., 2018)、土豆(Tian et al., 2021)、大豆(Qin et al., 2017)和油菜(Meng et al., 2017)等植物中雖有廣泛報道,但關(guān)于甘蔗NRAMP蛋白的研究目前還沒有報道。本研究基于甘蔗割手密種的全基因組序列,利用生物信息學的方法篩選甘蔗ScNRAMP基因家族成員,并對其進行進化樹構(gòu)建、染色體定位、基因結(jié)構(gòu)分析和蛋白特性分析等,以期為后續(xù)該基因家族的研究提供參考。
AtNRAMP基因家族的蛋白序列來源于擬南芥TAIR數(shù)據(jù)庫,甘蔗全基因組和基因注釋文件來源于http://www.life.illinois.edu/ming/downloads/Spontaneum_genome/ (Zhang et al., 2018)。
1.2.1 甘蔗ScNRAMP基因家族的鑒定 以擬南芥NRAMP蛋白序列作為種子序列,在TBtools(版本號為v1.0971,Chen et al., 2020)進行第一次Blastp,在NCBI進行第二次Blastp;結(jié)合SMART(http://smart.embl-heidelbreg.de/)對候選基因的氨基酸序列結(jié)構(gòu)域進行鑒定,手動剔除不含NRAMP保守結(jié)構(gòu)域的序列,保留下的即為甘蔗ScNRAMP基因家族成員。
1.2.2 編碼蛋白理化特性 利用ExPASy在線軟件(https://us.expasy.org/tools/protparam.html/)對ScNRAMP基因家族編碼蛋白的等電點、分子量、序列長度、總平均疏水性、不穩(wěn)定系數(shù)和脂溶指數(shù)等理化性質(zhì)進行分析預測;利用SignalP v4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)和CELLO v2.5(http://cello.life.nctu.edu.tw/)分別對29條蛋白序列進行信號肽預測和亞細胞定位分析。
1.2.3 蛋白二級結(jié)構(gòu)和跨膜結(jié)構(gòu)的分析 利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)分析NRAMP蛋白的二級結(jié)構(gòu),利用TMHMM Server v2.0(http://www.cbs.dtu.dk/services/TMHMM/)分析該蛋白家族的跨膜結(jié)構(gòu)。
1.2.4 甘蔗ScNRAMP基因保守基序、結(jié)構(gòu)域及基因結(jié)構(gòu)的分析 首先,利用MEME(https://meme-suite.org/meme/)和NCBI-CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)檢測甘蔗ScNRAMP家族基因中所存在相似度較高的基序(motif)和保守結(jié)構(gòu)域(domain);然后,利用基因組注釋文件,獲得家族成員內(nèi)含子及外顯子分布情況;最后,利用TBtools軟件對其進行可視化分析。
1.2.5 甘蔗ScNRAMP基因家族順式作用元件的分析 提取ScNRAMP基因上游3 000 bp序列作為甘蔗NRAMP基因的啟動子;利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對啟動子區(qū)域順式作用元件進行分析。
1.2.6 甘蔗ScNRAMP基因的染色體定位 運用TBtools軟件,結(jié)合甘蔗基因組注釋文件和家族成員IDlist,將結(jié)果可視化。
1.2.7 甘蔗ScNRAMP家族進化樹的構(gòu)建 使用本地軟件MEGAX完成多序列比對并采用鄰接法(neighbor joining)構(gòu)建系統(tǒng)進化樹,其中校驗參數(shù)(bootstrap)設(shè)置為1 000次,其余均設(shè)置為默認參數(shù);利用在線Evolview軟件(https://evolgenius.info//evolview-v2/#login )對進化樹進行繪制編輯。
1.2.8 甘蔗ScNRAMP基因的表達分析 利用割手密的RNA-seq轉(zhuǎn)錄組表達數(shù)據(jù)進行甘蔗ScNRAMP基因的表達分析。割手密的轉(zhuǎn)錄組RNA-seq表達譜下載自割手密基因組數(shù)據(jù)庫(Li et al., 2020)。篩選得到ScNRAMP基因家族成員在不同時期不同組織中的表達量(FPKM值),并用TBtools進行聚類,繪制熱圖。
從甘蔗割手密基因組中共鑒定到29個甘蔗ScNRAMP基因家族成員,其一級結(jié)構(gòu)和理化性質(zhì)如表1所示。甘蔗ScNRAMP基因家族成員的氨基酸總數(shù)在334~1 272個之間,氨基酸長度平均為563,分子量維持在55 000 Da左右;等電點跨度較大,在4.77~9.43之間;家族成員的不穩(wěn)定系數(shù)大部分低于40%,只有7個成員不穩(wěn)定系數(shù)在40%~48%之間;家族成員平均親水系數(shù)在0.015~0.949之間;29個甘蔗ScNRAMP蛋白均無信號肽,亞細胞定位分析表明成員均定位在質(zhì)膜上。
表 1 甘蔗NRAMP蛋白理化特性Table 1 Physicochemical properties of sugarcane NRAMP proteins
甘蔗NRAMP蛋白二級結(jié)構(gòu)和跨膜結(jié)構(gòu)分析如表2所示。ScNRAMP基因家族的二級結(jié)構(gòu)主要由α-螺旋、無規(guī)則卷曲、延伸鏈和β-轉(zhuǎn)角組成,其中α-螺旋比例最高,為36.71%~64.32%,β-轉(zhuǎn)角所占比例最小,為1.62%~5.06%;蛋白家族的二級結(jié)構(gòu)較為整齊,除在Sspon.03G0024310-2B和Sspon.03G0024310-1A中所占比例是無規(guī)則卷曲>α-螺旋>延伸鏈>β-轉(zhuǎn)角外,其余家族成員均為α-螺旋>無規(guī)則卷曲>延伸鏈>β-轉(zhuǎn)角;29個甘蔗NRAMP家族成員均有跨膜結(jié)構(gòu),其數(shù)量為6~12個不等。這表明甘蔗NRAMP蛋白為跨膜蛋白,可能與其轉(zhuǎn)運重金屬離子的功能相適應。
對甘蔗ScNRAMP基因的保守基序、結(jié)構(gòu)域及基因結(jié)構(gòu)分析如圖1所示。通過對保守基序分析發(fā)現(xiàn)motif 1基序高度保守,在割手密29個NARAMP家族成員中均存在; 個別家族成員存在2個motif 9,如Sspon.02G002160-2C、Sspon.02G0057810-1D、Sspon.02G002160-1A和Sspon.02G0021270-1A等;大部分家族成員中有9個保守基序,而成員Sspon.02G0029680-1A、Sspon.05G0038800-1D和Sspon.02G0057180-1D中最少,僅有6個保守基序(圖1,表3)。保守基序的差異可能暗示該基因家族成員之間在功能上存在差異。
表 3 甘蔗ScNRAMP基因保守基序logoTable 3 Conservative motif logo of sugarcane ScNRAMP genes
A. ScNRAMP基因的保守基序(motif)分布,10個motif用不同顏色的方框表示; B. ScNRAMP基因保守結(jié)構(gòu)域(domain)分布;C. ScNRAMP基因內(nèi)含子和外顯子分布。綠色方框表示外顯子;黑色線條表示內(nèi)含子;黃色框表示基因的上下游區(qū)域。A. Distributions of conserved motifs in ScNRAMP genes, ten putative motifs are indicated in different colored boxes; B. Distributions of domains in ScNRAMP genes; C. Exon and intron organizations of ScNRAMP genes. Green boxes represent exons; Black lines represent introns; The upstream and downstream regions of ScNRAMP genes are indicated in yellow boxes.圖 1 甘蔗ScNRAMP基因保守基序、結(jié)構(gòu)域及基因結(jié)構(gòu)Fig. 1 Conserved motif, domain and gene structure analysis of sugarcane ScNRAMP genes
通過對基因結(jié)構(gòu)分析發(fā)現(xiàn)ScNRAMP基因家族全都含有內(nèi)含子,并且內(nèi)含子數(shù)目差異較大(為2~11個不等);部分基因成員在5′末端和3′末端不含非翻譯區(qū)(untranslated region,UTR)。
通過對保守結(jié)構(gòu)域分析發(fā)現(xiàn),除Sspon.02G0057810-1D、Sspon.05G0038800-1D、Sspon.01G0025840-2B、Sspon.01G0061080-1D和Sspon.01G0025840-1A這5位成員的保守結(jié)構(gòu)域為Nramp superfamily外,其余24位家族成員的結(jié)構(gòu)域均為Nramp。
ScNRAMP基因起始密碼子上游3 000 bp啟動子區(qū)域順式作用元件分析結(jié)果如圖2所示。在ScNRAMP基因啟動子上含有與生長發(fā)育有關(guān)的作用元件,即CAT-box(分生組織調(diào)控元件)、RY-element(種子特異調(diào)控元件);與激素響應相關(guān)的順式作用元件,即ABRE(脫落酸響應元件)、TGACG-motif(茉莉酸響應元件)、TCA-element(水楊酸響應元件)、TGA-element(生長素響應元件)和TATC-box/P-box(赤霉素響應元件);與非生物脅迫相關(guān)的作用元件,即TC-rich(防御和應激響應元件)、MBS(干旱響應元件)、 LTR (低溫響應元件)、GT1-motif/G-box、MRE和I-box(光響應元件)和ARE(厭氧反應元件);與蛋白相關(guān)元件,即MBSI和MYBHv1(MYB轉(zhuǎn)錄因子結(jié)合位點)及O2-site(玉米醇溶蛋白代謝調(diào)節(jié))。進一步分析發(fā)現(xiàn),G-box、MRE、TGACG-motif、ABRE等元件存在于所有成員。以上結(jié)果表明,ScNRAMP基因家族很有可能通過TC-rich motif 和MRE motif等元件參與甘蔗的激素代謝,進而影響其對重金屬脅迫的響應。
圖 2 甘蔗ScNRAMP基因啟動子區(qū)域順式作用元件預測結(jié)果Fig. 2 Prediction result of cis-acting elements in the promoters of sugarcane ScNRAMP genes
染色體定位結(jié)果如圖3所示。甘蔗ScNRAMP基因的29個家族成員不均地分布在19條染色體上;染色體Chr2A上有4個基因,染色體Chr1B、染色體Chr2C和染色體Chr2D上各有3個基因,染色體Chr1A上有2個基因,其余14條染色體上各含有1個基因。
圖 3 甘蔗ScNRAMP基因在染色體上的位置Fig. 3 Positions of sugarcane ScNRAMP genes on chromosomes
為了解甘蔗割手密和其他禾本科植物NRAMP基因家族的進化關(guān)系,構(gòu)建了水稻、擬南芥、割手密、玉米和高粱5個物種NRAMP家族成員的進化樹(圖4)。由圖4可知,進化樹有3個分支,分為3個亞家族。亞家族Ⅰ中,甘蔗ScNRAMP有14位成員(Sspon.05G0038800-1D、Sspon.04G0018970-3C、Sspon.04G0018970-1A、Sspon.04G0018970-2B、Sspon.04G0018970-4D、Sspon.02G0021260-1A、Sspon.02G0021260-2C、Sspon.02G0057810-1D、Sspon.02G0021270-1A、Sspon.02G0021270-2C、Sspon.08G0003780-2B、Sspon.08G0003780-1A、Sspon.08G0003780-3C和Sspon.08G0003780-4D),與高粱14位成員、玉米15位成員、擬南芥2位成員和水稻4位成員聚為一支。亞家族Ⅱ中,甘蔗ScNRAMP有9位成員(Sspon.01G0005860-2B、Sspon.01G0005860-1A、Sspon.02G0029680-2B、Sspon.02G0029680-1A、Sspon.02G0029680-3C、Sspon.02G0029680-4D、Sspon.02G0029690-1A、Sspon.02G0029690-2D和Sspon.01G0005860-1P),與高粱3位成員、玉米5位成員、擬南芥4位成員和水稻2位成員聚為一支。亞家族Ⅲ中,甘蔗ScNRAMP有6位成員(Sspon.03G0024310-3C、Sspon.03G0024310-2B、Sspon.03G0024310-1A、Sspon.01G0025840-2B、Sspon.01G0061080-1D和Sspon.01G0025840-1A),與高粱5位成員和玉米7位成員聚為一支,并且在此分枝上沒有擬南芥和水稻的家族成員。水稻、擬南芥、高粱、玉米和甘蔗NRAMP家族成員之間均有同源基因,相比之下玉米與甘蔗的NRAMP基因家族成員之間親緣關(guān)系更近。
黑色星號表示甘蔗ScNRAMP; 綠色方框表示玉米ZmNRAMP; 黃色圓圈表示水稻OsNRAMP; 紅色三角形表示擬南芥AtNRAMP; 粉色對號表示高粱SbNRAMP。Black asterisks represent sugarcane ScNRAMP; Green boxes represent corn ZmNRAMP; Yellow circles represent rice OsNRAMP; Red triangles represent Arabidopsis AtNRAMP; Pink ticks represent sorghum SbNRAMP.圖 4 甘蔗ScNRAMP的系統(tǒng)發(fā)育樹Fig. 4 Phylogenetic tree of sugarcane ScNRAMP
為了解甘蔗ScNRAMP基因家族成員的功能與時空表達模式,本文以公開發(fā)表的割手密基因表達數(shù)據(jù)分析了ScNRAMP基因在不同組織和不同發(fā)育時期的表達情況(圖5)。圖5結(jié)果顯示,甘蔗ScNRAMP基因的表達呈現(xiàn)組織特異性。其中,Sspon.04G0018970-2B、Sspon.04G0018970-4D、Sspon.04G0018970-1A、Sspon.04G0018970-3C等基因在莖成熟期(M-s-3、6、9)表達量較高,在前成熟期和發(fā)芽期表達量較低;Sspon.03G0024310-3C、Sspon.03G0024310-2B、Sspon.03G0024310-1A、Sspon.01G0025840-2B和Sspon.01G0061080-1D5個成員在發(fā)育期葉中的表達量高于前成熟期和成熟期。另外,29個家族成員中僅有1個成員Sspon.05G0038800-1D的表達量FPKM值為0,表明其在各發(fā)育時期和組織部位均未表達。
S. 實生苗期; P. 成熟前期; M. 成熟期; s. 莖; l. 葉; 3. 甘蔗莖第3節(jié); 6. 甘蔗莖第6節(jié); 9. 甘蔗莖第9節(jié)。S. Seedling stage; P. Early maturity stage; M. Mature stage; s. Steam; l. Leaf; 3. Section 3 of sugarcane stem; 6. Section 6 of sugarcane stem; 9. Section 9 of sugarcane stem.圖 5 甘蔗ScNRAMP基因表達模式分析Fig. 5 Expression pattern analysis of sugarcane ScNRAMP genes
本研究對甘蔗ScNRAMP基因家族成員進行理化特性分析發(fā)現(xiàn),不同的NRAMP蛋白序列有較大的差異,氨基酸長度為334~1 272 aa,等電點跨度較大(4.77~9.43),表明其編碼蛋白能適應不同的酸堿環(huán)境。本研究中,甘蔗NRAMP蛋白不穩(wěn)定系數(shù)均小于40%,表明其穩(wěn)定性較好;蛋白的平均親水系數(shù)介于0.015~0.949之間,表明其是一類相對疏水的蛋白;29個家族成員分布在19條染色體上,染色體Chr2A上最多,有4個家族成員;割手密NRAMP蛋白所有成員均有6~12個跨膜結(jié)構(gòu)域,均分布在質(zhì)膜上,可能與其具有轉(zhuǎn)運重金屬離子的功能相適應?;蚪Y(jié)構(gòu)分析顯示,所有家族成員均具有內(nèi)含子。
甘蔗割手密基因組中共鑒定出29個ScNRAMP基因,與水稻(6個成員)和擬南芥(6個成員)相比,ScNRAMP基因家族成員的數(shù)量明顯要多,推測可能與甘蔗是多倍體且基因組龐大有關(guān),尤其是甘蔗作為多倍體植物,其在多倍化進程中的全基因組復制促進了甘蔗基因組含量的提高及其基因家族的擴張,這與相關(guān)研究茄科植物高度變異的基因家族在全基因組復制和基因的串聯(lián)重復引起基因組的含量增加和基因家族擴張的觀點一致(M?ser et al., 2001;Zhang et al., 2018;Tian et al., 2021;Wang et al., 2021)。擬南芥和水稻的基因組大小分別為125 Mb和466 Mb,而甘蔗割手密的基因組大小則達到了3.36 Gb。此外,擬南芥和水稻均為二倍體,甘蔗為八倍體,而測序的甘蔗品種割手密AP85-441則是甘蔗八倍體SES208單花粉培育得到的整倍體(四倍體),理論上現(xiàn)代甘蔗栽培種(多為異源八倍體且為非整倍體)具有的ScNRAMP家族成員應多于29個(陳如凱, 2011; Zhang et al., 2018)。
基因結(jié)構(gòu)和基序組成的分析,可為基因家族的進化關(guān)系提供重要依據(jù)(Boudet et al., 2001)。對ScNRAMP基因結(jié)構(gòu)分析發(fā)現(xiàn)的同一亞家族的大多數(shù)基因在外顯子、基序或非翻譯區(qū)具有類似的結(jié)構(gòu)特征,這一現(xiàn)象與其他物種的NRAMP蛋白家族相似(Belouchi et al., 1997;Lanquar et al., 2005),如AtNRAMP3和AtNRAMP4的基因結(jié)構(gòu)相似,并且對Fe2+都有極高運輸能力(Lanquar et al., 2005);OsNramp1、OsNramp2和OsNramp3序列的相似性為64%~75%(Belouchi et al., 1997),推測甘蔗NRAMP蛋白同一亞家族的成員在功能上可能相似。通過對甘蔗割手密、水稻、高粱、玉米4種單子葉植物和擬南芥1種雙子葉植物的系統(tǒng)進化分析,可將29個ScNRAMP家族成員分為3個亞家族。在亞家族Ⅲ中,進化樹分支上只有高粱(5位成員)、玉米 (7位成員) 和割手密(6位成員)的家族成員,沒有水稻和擬南芥的成員,推測甘蔗割手密NRAMP亞家族Ⅲ中的這6位成員可能存在著與水稻和擬南芥的NRAMP蛋白家族不一樣的特殊功能,而這個亞家族的特殊功能在高粱和玉米中卻可能存在。
植物啟動子作為植物功能基因表達調(diào)控的最重要順式元件之一,啟動子分析有助于闡明基因表達的調(diào)控和響應機制。通過對啟動子區(qū)域的順式作用元件分析,可以得到植物關(guān)于響應特定生物脅迫或非生物脅迫的重要元件,并由此推測甘蔗割手密種可能通過光響應因子、 激素響應元件和抗逆響應因子(TC-rich motif)等元件間的相互作用形成復雜的代謝調(diào)控網(wǎng)絡(luò)來響應和應對重金屬脅迫。這與水稻NRAMP基因受到JA、ABA等激素的調(diào)控來應對病原菌侵染、外界防御信號和金屬離子,從而參與植物的防御反應一致(Zhou et al., 2004)。在對甘蔗ScNRAMP基因上游3 000 bp區(qū)域研究發(fā)現(xiàn),成員中大部分均含有茉莉酸響應元件(TGACG-motif)和生長素響應元件(TGA-element),推斷該基因家族在進化過程中可能具有與植物生長和逆境脅迫相關(guān)的功能。甘蔗ScNRAMP基因的表達具有組織特異性,甘蔗ScNRAMP基因主要在特定組織和器官中表達,Sspon.01G0025840-2B和Sspon.01G0061080-1D2位成員在種子發(fā)芽期的葉和莖中的表達量明顯高于其他時期。對各時期和各組織高表達的基因分析發(fā)現(xiàn),家族成員均具有MBS、ABRE和TCA-element等與激素響應相關(guān)的作用元件,推測其參與激素代謝過程進而影響甘蔗對重金屬脅迫的響應。
目前,NRAMP基因家族在菜豆(Ishida et al., 2018)、大豆(Qin et al., 2017)和甘藍型油菜(Meng et al., 2017)等經(jīng)濟作物上已被廣泛研究。由于甘蔗作為重要的糖料作物和能源作物,關(guān)系著我國乃至世界人民的食糖安全,因此降低重金屬脅迫對甘蔗產(chǎn)量及含糖量的影響,了解ScNRAMP等基因家族轉(zhuǎn)運重金屬離子的分子機制尤其必要。本文通過對甘蔗割手密中29個ScNRAMP基因家族成員的全基因組分析,有利于闡明甘蔗ScNRAMP基因家族的功能,并為甘蔗的分子育種尤其是應對重金屬脅迫的研究提供了重要的候選基因。