張帥,林科運,侯純樸,方玉潔,王幼平
(揚州大學(xué)生物科學(xué)與技術(shù)學(xué)院,江蘇 揚州,225009)
質(zhì)體藍(lán)素(phytocyanin,PC)是一類植物特異性I型藍(lán)銅蛋白(blue copper proteins,BCP),包括plastocyanin 和PC 相關(guān)蛋白[1,2]。盡管PC 蛋白家族成員之間的序列一致性通常并不高,但該家族所有成員的蛋白質(zhì)序列均具有兩個保守的能形成二硫鍵的半胱氨酸(cysteine,Cys),其中部分成員具有4 個保守的銅離子結(jié)合位點,由2 個組氨酸(histidine,His)、1個Cys和1個甲硫氨酸(methionine,Met)或谷氨酰胺(glutamine,Gln)組成[2,3]。PC 蛋白有4 個結(jié)構(gòu)域(IIV),包括1 個必要的類質(zhì)體藍(lán)素域(plastocyaninlike domain,PLCD)(結(jié)構(gòu)域II)和3 個可選結(jié)構(gòu)域(結(jié)構(gòu)域I、III和IV)[4]。
根據(jù)銅配體殘基的特性和蛋白結(jié)構(gòu)組分等特征,PC 家族可分為4 個亞家族:類質(zhì)體藍(lán)素蛋白(plantacyanin-like protein,PLCL)、類花青素苷蛋白(uclacyanin-like protein,UCL)、類漆樹藍(lán)蛋白(stellacyanin-like protein,SCL)和類早期結(jié)瘤素蛋白(early nodulin-like protein,ENODL)[5,6]。其中UCL與PLCL 的銅配體殘基相同,由2個His、1個Cys和1個Met 組成,而UCL 則屬于嵌合型糖蛋白,PLCL 為非糖蛋白[7]。與UCL 和PLCL 不同,SCL 銅配體殘基中的Gln被Met所取代,但SCL與作為嵌合型糖蛋白的UCL 相似,它們不僅包含銅結(jié)合結(jié)構(gòu)域,而且其蛋白質(zhì)骨架中還包含糖蛋白樣結(jié)構(gòu)域,SCL 和UCL通過Asn-X-Thr/Ser 中的Asn 殘基提供N-糖基化位點,部分SCL 和UCL 通過Ser 和羥脯氨酸(Hyp)殘基提供O-糖基化位點[8]。與另外三個亞家族不同,ENODL 家族成員的蛋白骨架缺乏完整的銅離子結(jié)合位點,銅配體中的4 個氨基酸殘基部分或全部被其它氨基酸殘基取代[9]。研究發(fā)現(xiàn),在擬南芥(Arabidopsis thaliana)和水稻(Oryza sativa)中,大部分PC中存在類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR),因此PC基因家族也被歸為AGP超家族中的一個亞家族[9,10]。
在已有的研究報道中,PLCL、SCL、UCL 蛋白功能研究較少。在擬南芥中,過表達(dá)plantacyanin抑制花粉粒萌發(fā),破壞花粉管的定向生長,并導(dǎo)致種子結(jié)實率降低[11]。在辣椒中,SCL 參與了被野油菜黃單胞菌葉斑病無毒菌株感染的葉片的超敏反應(yīng)[12]。過表達(dá)OsUCL8導(dǎo)致花粉管的生長和授粉出現(xiàn)明顯異常,影響水稻結(jié)實率;相反,敲除OsUCL8和過表達(dá)miR408 的植株花粉萌發(fā)率顯著提高[13]。與功能研究較少的PLCL、SCL、UCL 相比,ENODL 蛋白的功能研究更為廣泛和全面,且在根中的研究居多。豆科植物中的研究表明,大豆中的GmENODL55[14],豌豆中的VsENODL5、VsENODL12和VsENODL40[15],以及苜蓿中的MtENODL16和MtENODL20[16]在根瘤中高表達(dá),參與了豆科植物的結(jié)瘤過程。已有研究證實,VsENOD5在受根瘤菌侵染前的根瘤原基中并不表達(dá),而在受侵染后攜帶侵染線的豌豆根皮層細(xì)胞和被侵染的根瘤細(xì)胞中表達(dá)[15,17]。大豆GmENOD55也顯示出相似的表達(dá)模式,僅在受慢生型大豆根瘤菌侵染后的大豆根瘤細(xì)胞中表達(dá)[14]。MtENOD20是一個在根皮層細(xì)胞激活過程中受結(jié)瘤因子誘導(dǎo)的標(biāo)志基因,該基因的轉(zhuǎn)錄激活起始于對應(yīng)根瘤原基形成位置處于分裂狀態(tài)的內(nèi)皮層細(xì)胞,隨后該基因在含有侵染線的根毛細(xì)胞中表達(dá)[18]。最近的研究顯示,蒺藜苜蓿MtENODL27和MtENODL28 在根瘤中特異表達(dá),且在被侵染的根中表達(dá)上調(diào);抑制MtENODL27和MtENODL28表達(dá)會阻礙根瘤菌的侵染和根瘤形成,說明MtENODL27/28 是根瘤菌侵染和根瘤發(fā)育的必需因子[4]。除了在根系中表達(dá)之外,ENODL基因也被發(fā)現(xiàn)在水稻的高蛋白淀粉層中表達(dá)[19]。ENODL家族中的Pn14基因在牽牛花(Pharbitis nil)的分生組織、原形成層、莖尖周圍的葉原基表皮毛以及根尖的分生組織和原形成層中表達(dá),暗示其可能參與植物的細(xì)胞壁重建和器官分化[20]。此外,擬南芥中At3g20570編碼的ENODL 蛋白在篩管分子的細(xì)胞膜中積聚,并參與調(diào)控擬南芥的生殖能力[21]。這些研究表明ENODL 不僅在根中發(fā)揮作用,而且可能在植物發(fā)育的其它階段發(fā)揮功能。
前人的研究表明,PC也參與植物對非生物脅迫的應(yīng)答過程。厚葉蛛毛苣薹(Boea crassifolia)中BcBCP1受干旱脅迫和鹽脅迫誘導(dǎo)上調(diào)表達(dá),在煙草中異源過表達(dá)BcBCP1使轉(zhuǎn)基因煙草的抗旱性增強(qiáng),在滲透脅迫下表現(xiàn)出更高的存活率和更高的光合速率[22]。玉米中的PC基因家族也參與對鹽脅迫和干旱脅迫的響應(yīng),在鹽處理條件下,玉米中9 個PC基因(ZmUC10、ZmUC16、ZmUC19、ZmSC2、ZmUC21、ZmENODL10、ZmUC22、ZmENODL13和ZmENODL15)表達(dá)下調(diào);在干旱處理條件下,5個PC基因(ZmUC19、ZmSC2、ZmENODL10、ZmUC22和ZmENODL13)的表達(dá)下調(diào),而ZmUC16表達(dá)顯著增強(qiáng)[23]。早期的研究證實,擬南芥藍(lán)銅結(jié)合蛋白基因AtBCB的表達(dá)受光負(fù)調(diào)節(jié),其編碼的藍(lán)銅結(jié)合蛋白可能作為電子載體參與細(xì)胞膜區(qū)的電子傳遞反應(yīng)[24]。AtBCB/AtSC3受鋁脅迫和氧化脅迫誘導(dǎo)表達(dá)[25,26]。后續(xù)研究表明,AtBCB蛋白主要定位于細(xì)胞膜上,與野生型植株相比,過表達(dá)AtBCB的轉(zhuǎn)基因擬南芥在根中積累更多的木質(zhì)素,過表達(dá)AtBCB的酵母轉(zhuǎn)化子對鋁的抗性增強(qiáng),說明AtBCB 能夠抑制鋁的吸收和鋁毒害造成的氧化脅迫[27]。
全基因組系統(tǒng)分析能夠為鑒定基因家族成員并闡明其生物學(xué)作用提供有效的途徑和依據(jù)。目前研究者們已經(jīng)對擬南芥[10]、水稻[9]、大白菜(Brassica rapa)[28]、玉米(Zea mays)[23]、蝴蝶蘭(Phalaenopsis equestris)[29]和蒺藜苜蓿(Medicago truncatula)[4]中的PC 家族基因進(jìn)行了全基因組鑒定和分析。甘藍(lán)型油菜(Brassica napus)是一種由白菜和甘藍(lán)自然雜交形成的異源四倍體植物[30],作為集食用、飼用和觀賞價值于一身的常見農(nóng)作物,該物種中PC基因家族的功能尚不明確。本研究對甘藍(lán)型油菜PC基因(BnPC)家族進(jìn)行了全基因組范圍內(nèi)的鑒定、生物信息學(xué)分析和表達(dá)分析,旨在了解BnPC基因家族成員的組成、分類和表達(dá)特征,為揭示該家族成員的生物學(xué)功能提供線索。
本研究利用HMMER 軟件和PLCD 的HMM 在甘藍(lán)型油菜全基因組范圍內(nèi)對PC 家族成員進(jìn)行鑒定,并進(jìn)一步利用SMART 和UniProt 數(shù)據(jù)庫對這些潛在的PC 蛋白進(jìn)行PLCD 結(jié)構(gòu)域的確認(rèn)。在Pfam 33.1 數(shù)據(jù)庫(http://pfam. xfam. org/)中利用關(guān)鍵詞“phytocyanin”和“plastocyanin”進(jìn)行搜索,并利用PLCD 的隱馬爾可夫模型(Hidden-Markov Model,HMM)PF02298(Plastocyanin-like domain)和HMMER 軟件對甘藍(lán)型油菜數(shù)據(jù)庫(http://www. genoscope.cns.fr/brassicanapus/)全基因組蛋白序列進(jìn)行檢索(E-value ≤1e-5),獲得潛在的BnPC 家族成員信息。進(jìn)一步利用SMART(http://smart. embl-heidelberg. de)和UniProt(http://www. uniprot. org/)數(shù)據(jù)庫對獲得的假定PC 成員的PLCD 結(jié)構(gòu)域進(jìn)行鑒定,篩選確認(rèn)具有完整PLCD 結(jié)構(gòu)域的序列,即為BnPC家族成員。
從甘藍(lán)型油菜數(shù)據(jù)庫獲取各BnPC基因相應(yīng)的染色體位置等信息,利用TBtools(https://github.com/CJ-Chen/TBtools/releases)軟件[31]中的基因可視化工具繪制BnPC基因在甘藍(lán)型油菜19條染色體上的定位圖。采用MCSCANX(http://chibba.pgml.uga.edu/mcscan2/)分析甘藍(lán)型油菜(B. napus)、擬南芥(A.thaliana)、白菜(B. rapa)和甘藍(lán)(B. oleracea)之間的基因復(fù)制事件和共線性關(guān)系[32]。為了確認(rèn)BnPC之間的同源關(guān)系,以及BnPC與其它物種PC之間的同源關(guān)系,分別用TBtools 軟件中的AmazingSuper-Circos 和Dual Systeny Plotter 進(jìn)行可視化[31]。用KaKs 計算器2.0 計算各基因?qū)Φ耐x替換率(Ks)、非同義替換率(Ka)和Ka/Ks比值[33]。
首先利用Clustal W 軟件對BnPC 的PLCD 結(jié)構(gòu)域序列進(jìn)行多序列比對分析,生成軟件MEGA 可識別的比對文件(默認(rèn)參數(shù)設(shè)置)[34],然后利用MEGA5.0 軟件(https://www. megasoftware. net/),采用鄰接法(Neighbor-joining Method)基于上述多序列比對文件進(jìn)行系統(tǒng)發(fā)生分析[35]。Bootstrap 設(shè)置為1000,選用p-distance 模型,Gap 設(shè)置為Partial deletion,Site Coverage Cutoff設(shè)置為95%,生成無根樹。
將存在PLCD 結(jié)構(gòu)域的BnPC 蛋白序列文件保存為FASTA 格式,利用SignalP 5.0(http://www.cbs.dtu.dk/services/signalP/)、Big-PI Plant Predictor(http://mendel. imp. ac. at/gpi/plant_server. html)和NetNGlyc 1.0 Server 軟件(http://www. cbs. dtu. dk/services/NetNGlyc/)分別預(yù)測其N-端信號肽(NSP)、GAS 和N-糖基化位點(默認(rèn)參數(shù)設(shè)置)。依據(jù)前人研究擬南芥AtPC 蛋白序列中潛在阿拉伯半乳聚糖蛋白樣域(Arabinogalactan protein-like region,ALR)的原則[10]:以非鄰接的脯氨酸(Pro)殘基基序([Ala/Ser/Thr/Gly]-Pro-X(0, 10)-[Ala/Ser/Thr/Gly]-Pro)和([Ala/Ser/Thr/Gly]-Pro3-4)為阿拉伯半乳聚糖(AG)糖模體;Ser-Pro2-4為假定的伸展蛋白糖模體;手動分析BnPC 蛋白序列中潛在的ALR。利用軟件Clustal X 1.81(http://www. clustal. org/clustal2/)對BnPC 氨基酸序列進(jìn)行多重序列比對分析(使用默認(rèn)參數(shù))[34],手動標(biāo)記結(jié)構(gòu)域特征位點。
從甘藍(lán)型油菜數(shù)據(jù)庫獲得油菜BnPC基因的基因組序列及CDS 序列,利用基因結(jié)構(gòu)預(yù)測的可視化工具TBtools 繪制BnPC的基因結(jié)構(gòu)圖[31]。利用在線軟件MEME Suite5.1.0(http://meme. nbcr. net/meme/cgi-bin/meme. cgi)分析BnPC 蛋白的氨基酸序列,預(yù)測其中的保守模體(motif),參數(shù)設(shè)定為軟件默認(rèn)值[36]。
從甘藍(lán)型油菜數(shù)據(jù)庫獲得BnPC基因的起始密碼子上游區(qū)域2000 bp 序列,利用在線網(wǎng)站Plant-Care(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)對上述區(qū)域進(jìn)行順式元件分析[37],利用TBtools軟件對該區(qū)域的順式元件進(jìn)行可視化[31]。
根據(jù)本實驗室前期創(chuàng)建的甘藍(lán)型油菜不同發(fā)育階段各組織器官中以及不同逆境脅迫條件下的轉(zhuǎn)錄組數(shù)據(jù)(BioProject ID PRJNA687395),分析各BnPC基因的時空表達(dá)模式以及在不同逆境處理條件下的表達(dá)變化。對于時空表達(dá)模式,分別對各BnPC基因在甘藍(lán)型油菜子葉、根、莖、幼葉、莖頂端分生組織(shoot apical meristem,SAM)、成熟葉、花苞、子房以及受精后14 d、24 d、34 d、50 d 的種子和角果皮中的表達(dá)水平進(jìn)行分析。對于逆境表達(dá)模式分析,分別對各BnPC基因在干旱、鹽、冷和高溫脅迫條件下的表達(dá)變化情況進(jìn)行分析。將甘藍(lán)型油菜揚油9 號種子在濕潤濾紙上發(fā)芽后,選取生長健康且長勢一致的幼苗移栽至光照培養(yǎng)箱(22℃,16 h 光照/8 h 黑暗)進(jìn)行水培,待幼苗生長至四葉期開始脅迫處理。本研究采用15% PEG6000 模擬干旱脅迫(drought),利用150 mmol/L NaCl 處理進(jìn)行鹽脅迫(salt),分別在4℃和42℃培養(yǎng)箱中進(jìn)行冷脅迫(cold)和高溫脅迫(heat),以種植在正常條件下培養(yǎng)的植株作為對照。分別在干旱和鹽處理后24 h,冷處理后6 h,高溫處理后1 h采集處理材料的葉片,并在對應(yīng)的時間點同時采集對照植株的葉片,立即用液氮冷凍,在-80℃冰箱中保存至提取RNA。使用華中農(nóng)業(yè)大學(xué)(武漢)Illumina 測序平臺(HiSeq 3000)進(jìn)行RNA-Seq測序。
結(jié)果表明,甘藍(lán)型油菜中有183 個蛋白具有PLCD結(jié)構(gòu)域,其中10個蛋白由于保守PLCD結(jié)構(gòu)域中關(guān)鍵Cys 殘基缺失而被排除,因此,在甘藍(lán)型油菜中共鑒定得到173 個PC 蛋白(附表1,見首頁OSID二維碼),遠(yuǎn)多于前人在擬南芥中的發(fā)現(xiàn)PC 成員的數(shù)量(38個)[28]。
對BnPC 家族成員的PLCD 結(jié)構(gòu)域進(jìn)行多重序列比對分析,結(jié)果表明:140 個成員的PLCD 結(jié)構(gòu)域中含有完整的2 個Cys 殘基,其余8 個BnPC 蛋白只含有一個Cys殘基,Cys在PLCD結(jié)構(gòu)域中高度保守;49個BnPC 蛋白中含有4個完整的銅結(jié)合配體(His、Cys、His、Met/Gln),其中28 個成員的銅配體為His、Cys、His、Met 類型,21 個成員的銅配體為His、Cys、His、Gln 類型(附表1,見首頁OSID 二維碼)。根據(jù)銅結(jié)合位點以及糖基化位點的差異,可以將BnPC蛋白劃分為4 個亞家族:其中25 個成員歸屬于類花青苷蛋白(BnUCL),21 個成員歸屬于類漆樹藍(lán)蛋白(BnSCL),3 個成員歸屬于類質(zhì)體藍(lán)素蛋白(Bn-PLCL);其余99 個不含銅結(jié)合位點的BnPC 歸屬于類早期結(jié)瘤素蛋白(BnENODL)亞家族。與以往的研究結(jié)果不同,甘藍(lán)型油菜中有5 個SCL(SCL5、SCL6、SCL13、SCL15 和SCL16)不具有N-糖基化位點,這可能是由于進(jìn)化過程中蛋白序列的趨異造成的。此外,多重序列比對的結(jié)果顯示,在BnENODL亞家族成員的序列中,與其它亞家族成員銅結(jié)合位點相對應(yīng)的位置上有一些氨基酸取代His、Cys、His、Met/Gln從而形成了其它形式的保守模體,其功能可能與結(jié)合銅有關(guān)。
對BnPC基因在甘藍(lán)型油菜19條染色體上的分布進(jìn)行分析。如圖1 所示,在173 個BnPC基因中,有25個BnPC基因由于甘藍(lán)型油菜基因組組裝信息不全而未被定位到特定染色體上,其余148 個BnPC基因在19條染色體上分布不均。共有67個和81個BnPC基因分別位于A 和C 亞基因組上,每條染色體上的BnPC基因數(shù)目從4到15不等,C07染色體上包含的BnPC基因最多(15 個),其次是C03、A03 和C04 染色體,分別有13、12 和10 個BnPC。A08 和A07 染色體上的BnPC基因數(shù)目最少(分別有4 個),各條染色體上BnPC基因的數(shù)目與染色體長度不存在明顯相關(guān)關(guān)系。
圖1 BnPC基因在甘藍(lán)型油菜染色體上的分布Fig.1 Distribution of BnPC genes on Brassica napus chromosomes
基因復(fù)制是物種進(jìn)化過程中產(chǎn)生新基因的一種重要途徑,主要是在多個基因非常接近的情況下通過串聯(lián)復(fù)制,或者通過片段復(fù)制來實現(xiàn)[38]。為了研究BnPC 家族基因在進(jìn)化過程中的擴(kuò)增情況,本研究對BnPC 家族中的基因復(fù)制事件進(jìn)行了分析。結(jié)果表明,137 個BnPC基因是復(fù)制事件的產(chǎn)物(附表2,見首頁OSID二維碼),其中123個BnPC來自全基因組復(fù)制(whole genome duplication,WGD)或片段復(fù)制(segmental duplication),另外14 個BnPC基因來自分散復(fù)制(dispersed duplication)。利用MCScanX 軟件在BnPC 家族中共鑒定出120 對基因具有共線性。為了解甘藍(lán)型油菜和擬南芥以及蕓薹屬植物BnPC基因家族間的進(jìn)化關(guān)系,本研究進(jìn)一步對甘藍(lán)型油菜與自身、擬南芥以及兩種二倍體祖先(白菜和甘藍(lán))基因之間的共線性關(guān)系進(jìn)行了分析。如圖2 和圖3 所示,甘藍(lán)型油菜與擬南芥、白菜、甘藍(lán)中存在大量的同源PC基因。在148 個BnPC中,有118 個(79.73%)與其它物種的PC具有共線性關(guān)系,其中92 個BnPC基因(87 個來源于WGD 或片段復(fù)制,占94.57%)與擬南芥PC基因具有共線性關(guān)系,118 個BnPC(112 個來源于WGD 或片段復(fù)制,占94.92%)與白菜PC基因具有共線性關(guān)系,96 個Bn-PC(86個來源于WGD 或片段復(fù)制,占89.58%)與甘藍(lán)PC基因具有共線性關(guān)系。上述結(jié)果表明,基因復(fù)制在很大程度上促進(jìn)了甘藍(lán)型油菜基因組中PC基因家族的擴(kuò)張,其中WGD 或片段復(fù)制事件起主要的驅(qū)動作用。
圖2 甘藍(lán)型油菜基因組內(nèi)PC基因的共線性分析Fig.2 Syntenic relationship of PC genes in B.napus genome
圖3 甘藍(lán)型油菜與擬南芥、白菜和甘藍(lán)PC基因的共線性關(guān)系Fig.3 Syntenic relationship of PC genes in B.napus and three Cruciferae plants(Arabidopsis,B.rapa and B.oleracea)
為了評估在甘藍(lán)型油菜進(jìn)化過程中復(fù)制BnPC基因受到的選擇壓力,我們計算了甘藍(lán)型油菜中的同源基因?qū)Φ腒a、Ks和Ka/Ks比值。結(jié)果表明,大部分BnPC基因?qū)Φ腒a/Ks<0.5,表明BnPC基因家族在進(jìn)化過程中經(jīng)歷了強(qiáng)烈的純化選擇(附表3,見首頁OSID二維碼)。
為了闡明BnPC 蛋白之間的系統(tǒng)發(fā)生關(guān)系,我們利用PLCD 保守結(jié)構(gòu)域序列對BnPC 蛋白進(jìn)行無根樹的構(gòu)建。如圖4 所示,BnPC 蛋白可分為6 個進(jìn)化枝(Clade A-F)。與其它物種中的情況類似,Bn-PLCL 亞家族的成員最少,在甘藍(lán)型油菜中僅有3 個成員,3個PLCL成員在進(jìn)化關(guān)系上均與BnUCL亞家族比較接近,推測它們可能是由UCL 亞家族成員直接分化而來。有趣的是,與BnPLCL1、BnPLCL2 進(jìn)化關(guān)系上相近的BnUCL23 卻與UCL 亞家族其它成員相距較遠(yuǎn),推測BnUCL23 可能是由BnENODL 亞家族分化而來,隨后在進(jìn)化過程中進(jìn)一步分化為BnPLCL1 和BnPLCL2。成員數(shù)量最多的BnENODL亞家族,主要分布于三個進(jìn)化枝,其中50 個BnENODL 占據(jù)了全部A 進(jìn)化枝,C 進(jìn)化枝中包含了32 個BnENODL,而剩余的BnENODL 幾乎全部分布于F進(jìn)化枝中,處于同一進(jìn)化枝中的BnENODL 成員序列差異較小,可能具有類似的功能。除了BnUCL23 位于F 進(jìn)化枝中,BnUCL 亞家族其它成員全部分布于B 進(jìn)化枝中。BnSCL 亞家族成員中有3 個成員位于C 進(jìn)化枝中,其余成員則主要存在于D 和E進(jìn)化枝中,BnSCL成員分布相對分散,暗示著該亞家族成員在功能上存在分化。
對BnPC 蛋白的其它三個功能域(SP、ALR、GAS)進(jìn)行分析(附表1,見首頁OSID 二維碼),根據(jù)四種結(jié)構(gòu)域在BnPC 蛋白中的組成,BnPC 蛋白可分為10 種類型(I~X)(圖5)。除VII、VIII、IX 和X 型成員外,共有133個BnPC 蛋白具有分泌蛋白所需要的N-端信號肽。V 型、VI 型和X 型成員具有兩個PLCD 結(jié)構(gòu)域,PLCD 結(jié)構(gòu)域的重復(fù)可能來源于甘藍(lán)型油菜進(jìn)化過程中PLCD 結(jié)構(gòu)域區(qū)段的復(fù)制。此外,屬于II、IV、VIX 型的77 個BnPC 具有GAS,暗示著這些蛋白質(zhì)可能定位于細(xì)胞膜上。除了I、II、VI和VII 型的BnPC 成員,其余95 個BnPC 具有一個ALR 域,在這些成員中,同時具有N-端信號肽的蛋白可歸屬于AGP 超家族。蛋白質(zhì)結(jié)構(gòu)域組成類似的PC 成員傾向于在系統(tǒng)發(fā)生樹上聚集在一起。例如,I 型BnPC 主要聚集在E 進(jìn)化枝中,IV 型BnPC 主要聚集在A進(jìn)化枝中(圖4)。
圖4 甘藍(lán)型油菜PC家族系統(tǒng)發(fā)生分析Fig.4 Phylogenetic analysis of the PC family in B.napus
圖5 基于結(jié)構(gòu)域組成的BnPC分類Fig.5 Classification of BnPC proteins based on domain composition
外顯子-內(nèi)含子結(jié)構(gòu)的差異對于基因功能起重要作用,特別是對于重復(fù)基因[39]。本研究對148 個BnPC家族基因成員編碼區(qū)序列進(jìn)行結(jié)構(gòu)分析的結(jié)果表明,BnPC基因的外顯子數(shù)目在1 個到6 個之間,其中100個BnPC基因包含2個外顯子,20個Bn-PC基因包含3 個外顯子,9 個BnPC基因包含3 個外顯子,18 個BnPC基因(BnENODL9/12/22/27/39/61/65/71/83/98、BnSCL4/5/6/7/8/12/13/15)只有1 個外顯子,沒有內(nèi)含子,僅BnENODL42基因含有多達(dá)6 個外顯子(圖6)。此外,同一亞家族的同一系統(tǒng)發(fā)育類群的基因的外顯子-內(nèi)含子結(jié)構(gòu)更相似,例如Clade A 中大多數(shù)成員有兩個外顯子,Clade D 中大多數(shù)基因沒有內(nèi)含子。屬于相同亞家族的一些成員外顯子長度接近,而內(nèi)含子長度差異較大(例如:BnENODL30 和BnENODL87、BnUCL13 和BnUCL22、BnPLCL1和BnPLCL2),這可能與重復(fù)基因的功能分化有關(guān)。
利用MEME 分析BnPC 蛋白的模體組成,共鑒定出10 個保守模體,其長度在14~50 個氨基酸之間(圖6,附圖1,見首頁OSID二維碼),其中Motif 1/2/3/4/5/7/8 屬于PLCD 保守結(jié)構(gòu)域的一部分,Motif 6 出現(xiàn)在具有兩個PLCD 保守結(jié)構(gòu)域的蛋白中,位于兩個PLCD 結(jié)構(gòu)域之間,Motif 9/10 則是新發(fā)現(xiàn)的保守結(jié)構(gòu)域。結(jié)果表明,同一亞類中BnPC 的結(jié)構(gòu)相似。除了BnENODL58、BnENODL91 和BnSCL16 外,其他所有BnPC 都包含Motif 1,Motif 2/3/4/5 也存在于大部分BnPC 成員中,Motif 6/7/8/9 在Clade C 的成員中較為保守,部分PC成員的N端和C端包含Motif 10。
圖6 BnPC家族成員的模體組成和基因結(jié)構(gòu)分析Fig.6 Motif analysis and gene structure of the BnPC family members
順式作用元件在基因表達(dá)調(diào)控中起重要作用,基因啟動子區(qū)域包含的不同類型的順式調(diào)控元件可能介導(dǎo)基因在不同條件下表達(dá)。本研究利用PlantCARE 軟件對148 個BnPC基因的啟動子區(qū)域的順式元件進(jìn)行了分析,結(jié)果發(fā)現(xiàn)了10種順式作用元件,主要可分為以下4 類:與植物生長發(fā)育、非生物脅迫應(yīng)答、激素應(yīng)答相關(guān)的元件,以及真核生物中的基本啟動子元件(如CAAT 盒和TATA 盒)。與生長發(fā)育相關(guān)的啟動子元件主要包括參與胚乳表達(dá)的GCN4 元件和AACA 元件;與分生組織表達(dá)相關(guān)的CAT元件;以及大量的光響應(yīng)元件,如Box4、GBox 和TCT 元件(附表4,見首頁OSID 二維碼)。在BnPC啟動子中,與光反應(yīng)有關(guān)的元件是最常見的元件,此外,本研究還鑒定到一些與赤霉素(gibberellin acid,GA)、生長素(auxin)、脫落酸(abscisic acid,ABA)、MeJA 和水楊酸(salicylic acid,SA)應(yīng)答相關(guān)的順式元件,其中與ABA 應(yīng)答相關(guān)的元件最為豐富,其次是與MeJA 反應(yīng)相關(guān)的元件(表1,附表4,見首頁OSID 二維碼)。此外,在BnPC的啟動子區(qū)域還發(fā)現(xiàn)了許多與脅迫答應(yīng)相關(guān)的元件,如低溫應(yīng)答相關(guān)的低溫應(yīng)答元件(low-temperature responsiveness,LTR)、干旱誘導(dǎo)的MYB 結(jié)合位點(MBS)、與創(chuàng)傷反應(yīng)相關(guān)的創(chuàng)傷應(yīng)答元件(wound-responsive element)和厭氧誘導(dǎo)所必需的厭氧調(diào)節(jié)元件(anaerobic induction)。這些結(jié)果表明BnPC可能在調(diào)節(jié)植物生長發(fā)育、對非生物脅迫的應(yīng)答和激素應(yīng)答中發(fā)揮作用。大多數(shù)BnPC基因的啟動子區(qū)具有不同類型順式元件,暗示這些BnPC基因可能參與多種生理過程和調(diào)控途徑。
表1 BnPC基因啟動子順式元件分析Table 1 Cis-acting elements of the promoter regions of BnPC genes
基于甘藍(lán)型油菜不同發(fā)育階段各組織器官的轉(zhuǎn)錄組測序數(shù)據(jù)對BnPC基因的時空表達(dá)模式進(jìn)行分析(圖7A,各基因FPKM 值詳見附表5,首頁OSID二維碼),結(jié)果顯示,42 個BnPC基因在所有檢測的組織器官中均未表達(dá)或者表達(dá)水平極低(FPKM<0.5,圖7 中未顯示)。根據(jù)時空表達(dá)特點,BnPC基因大致可以分為四種類型。第一種類型在所有組織器官中表達(dá)水平均較低或未表達(dá)。第二種類型在幾乎所有組織器官中均有表達(dá),且在各組織器官中的表達(dá)水平差別不明顯,如BnENODL32、BnENODL38、BnENODL42和BnENODL93。第三種類型在大多數(shù)組織中表達(dá),但在特定組織中高表達(dá),如BnUCL9、BnUCL13和BnUCL22。第四種類型基因的表達(dá)表現(xiàn)出很強(qiáng)的組織器官特異性:例如BnUCL6、BnUCL17和BnUCL20只在根(Root)中表達(dá),而BnENOD31、BnENODL48、BnENODL55、BnENODL97和BnUCL23只在受精后24 d 的種子(Seed-24 DAP)和角果皮(Silique wall-24 DAP)中表達(dá)。此外,幾乎所有的BnUCL基因均在根中具有高水平的表達(dá)(除了BnUCL23),暗示著BnUCL亞家族成員可能在根的發(fā)育中起著重要作用,而BnPLCL3與BnUCL亞家族成員表現(xiàn)出非常相似的表達(dá)模式,這與上述系統(tǒng)發(fā)生分析的結(jié)果相符,BnPLCL3是由BnUCL亞家族成員進(jìn)化而來,BnPLCL3與BnUCL亞家族成員在功能上可能也極為相似;而BnPC家族中其余的2 個BnPLCL基因BnPCLC1和BnPCLC2在各個組織中均有一定程度的表達(dá)。BnENODL亞家族的成員在甘藍(lán)型油菜不同組織器官中的表達(dá)呈現(xiàn)一定程度的分化,9 個成員(例如BnENODL21/70/37/18/63/7/52/6/51)在受精后14 d 的種子(Seed-14 DAP)中特異表達(dá),9 個成員(例如BnENODL48/97/31/89/11/55/16/30/86)在受精后24 d 的種子(Seed-14 DAP)中表達(dá)水平較高,8 個成員(例如BnENODL28/73/59/3/5/14/20/69)在花苞(bud)中特異表達(dá),說明BnENODL亞家族中的這些成員可能參與了甘藍(lán)型油菜花和幼嫩種子的發(fā)育過程。
為探究BnPC基因?qū)Ω鞣N非生物逆境脅迫的應(yīng)答模式,本研究利用轉(zhuǎn)錄組數(shù)據(jù)分析了在干旱、鹽、冷和高溫處理條件下各BnPC基因的表達(dá)水平(圖7B,附表6,見首頁OSID 二維碼)。結(jié)果表明,95 個BnPC基因的表達(dá)水平在至少一種逆境處理前后發(fā)生變化,53 個基因在脅迫處理前后的表達(dá)水平?jīng)]有明顯變化。與組織器官表達(dá)數(shù)據(jù)對比發(fā)現(xiàn),前文所述的在各組織器官中未表達(dá)和弱表達(dá)的42 個BnPC基因中,除了4 個基因(BnENODL9、BnENODL62、BnENODL71和BnENODL91)在逆境處理后表達(dá)明顯上調(diào),其余38 個基因仍檢測不到表達(dá),推測這38個基因可能在甘藍(lán)型油菜的進(jìn)化過程中因為功能喪失而不表達(dá),或由于表達(dá)部位非常特異而在本文使用的數(shù)據(jù)中沒有檢測到表達(dá)量。在95 個逆境處理條件下表達(dá)水平發(fā)生變化的基因中,在干旱處理條件下,有38個基因上調(diào)表達(dá),48個基因下調(diào)表達(dá);在鹽處理條件下,24 個基因表達(dá)量上升,59 個基因表達(dá)量下降;在冷處理條件下,25 個基因上調(diào)表達(dá),58 個基因下調(diào)表達(dá);在高溫處理條件下,40 個基因表達(dá)量上升,44 個基因表達(dá)量下降。這些結(jié)果表明,相當(dāng)一部分BnPC基因?qū)Ψ巧锩{迫表現(xiàn)出明顯的響應(yīng),暗示著BnPC可能也廣泛參與甘藍(lán)型油菜對不利環(huán)境條件的適應(yīng)。
圖7 BnPC基因的表達(dá)特征Fig.7 Expression profile of BnPC genes
PC基因作為古老的藍(lán)銅蛋白基因,可能與銅原子結(jié)合,在各種生物系統(tǒng)中起電子轉(zhuǎn)運的作用,如銅的轉(zhuǎn)運和植物光合作用,因此PC基因家族成員可能受到光誘導(dǎo)廣泛參與植物的生長發(fā)育[28]。在BnPC基因啟動子中,我們也發(fā)現(xiàn)了大量的光反應(yīng)元件,表明PC基因可能對甘藍(lán)型油菜的生長發(fā)育有關(guān)鍵性作用。目前,植物中對PC基因家族的相關(guān)研究比較少,在油料作物甘藍(lán)型油菜中PC基因家族的綜合分析尚未見報道。本研究在甘藍(lán)型油菜中鑒定到173 個BnPC基因。根據(jù)銅配體殘基的特性、蛋白結(jié)構(gòu)組分的差異,將這些BnPC基因分為BnENOLD、BnUCL、BnSCL和BnPLCL4 個亞家族,其中BnENODL亞家族基因數(shù)量最多,BnUCL亞家族、BnSCL亞家族其次,BnPLCL亞家族基因數(shù)量最少,與之前在擬南芥[10]和水稻[9]中報道的結(jié)果類似。Bn-PC基因結(jié)構(gòu)的變化可能是由于在長期進(jìn)化過程中內(nèi)含子/外顯子的增加或減少所致?;贐nPC 保守模體分析的結(jié)果,推測BnPC基因家族的功能分化可能是由類特異性和亞類特異性模體引起的。此外,在BnPC 的每個亞類中,相似的模體結(jié)構(gòu)、外顯子-內(nèi)含子結(jié)構(gòu)組成模式和氨基酸組成可能預(yù)示著進(jìn)化過程中的基因復(fù)制事件。
甘藍(lán)型油菜是一種由白菜和甘藍(lán)自然雜交形成的異源四倍體植物[30]?;驈?fù)制有兩種主要機(jī)制,WGD/片段復(fù)制和串聯(lián)復(fù)制[40]。WGD/片段復(fù)制在植物基因組中很常見,許多植物在進(jìn)化過程中經(jīng)歷了多倍化事件,因此在它們的基因組中保留了許多重復(fù)的染色體片段[41,42]。前人在擬南芥[10]、水稻(O.sativa)[9]、大豆(Glycine max)[4]、大白菜[28]、玉米[23]、蝴蝶蘭[29]、蒺藜苜蓿[4]和鐵皮石斛[43]中分別鑒定到38、62、90、84、60、30、82 和38 個PC基因,甘藍(lán)型油菜中PC家族基因的數(shù)量(173 個)遠(yuǎn)遠(yuǎn)多于上述植物物種中PC基因的數(shù)量,說明在甘藍(lán)型油菜進(jìn)化過程中,基因組復(fù)制對BnPC基因的多樣性有很大貢獻(xiàn)。我們的結(jié)果表明,137 個BnPC基因是基因復(fù)制的結(jié)果,其中123 個來源于WGD 或片段復(fù)制,其余是分散復(fù)制的結(jié)果。串聯(lián)復(fù)制是另一種類型的基因復(fù)制,其特征是一個基因家族的多個成員存在于同一個或相鄰的基因間區(qū)域[40]。本研究發(fā)現(xiàn),4 個BnPC基因:BnSCL8、BnENODL81、BnENODL82和BnENODL83來源于這種復(fù)制方式。為了比較不同物種中PC基因家族擴(kuò)張機(jī)制的異同,我們也分析了其他物種中PC基因家族成員的復(fù)制類型。水稻中20 個OsPC來源于片段復(fù)制,18個來源于串聯(lián)復(fù)制[9];玉米中14 個ZmPC來源于片段復(fù)制,8 個來源于串聯(lián)復(fù)制[23];而在蒺藜苜蓿中,40 個MtPC來源于串聯(lián)復(fù)制,其余32 個來源于其他復(fù)制方式[4]。在這些物種中,片段復(fù)制和串聯(lián)復(fù)制在PC基因家族擴(kuò)張中均起著重要作用。有趣的是,擬南芥中有12 個AtPC來源于片段復(fù)制,僅有2個PC來源于串聯(lián)復(fù)制[10];白菜中63 個PC來源于片段復(fù)制,沒有PC基因來源于串聯(lián)復(fù)制[28]。與白菜和擬南芥中的情況類似,BnPC基因家族中僅有4個基因來源于串聯(lián)復(fù)制,這表明WGD/片段復(fù)制是BnPC基因家族擴(kuò)張的主要動力,該現(xiàn)象是否在蕓薹屬甚至十字花科植物中普遍存在,還有待進(jìn)一步研究。在人類基因組中,諸如轉(zhuǎn)座子插入和拷貝數(shù)變異等分散復(fù)制是非常常見的[44],但在植物中鮮有報道,已報道的植物物種中尚未發(fā)現(xiàn)有PC基因來源于這種復(fù)制方式。本研究發(fā)現(xiàn),有14 個BnPC基因來源于分散復(fù)制。在異源多倍體植物中,基因組的擴(kuò)張通常伴隨著轉(zhuǎn)座子因子的插入[45,46]。蕓薹屬植物的轉(zhuǎn)座子也很豐富[46,47],然而,這些轉(zhuǎn)座子是否是PC基因家族擴(kuò)張的原因之一還需要進(jìn)一步的研究。
PC 蛋白成員主要包含下列4 個結(jié)構(gòu)域,結(jié)構(gòu)域I 包含內(nèi)質(zhì)網(wǎng)靶向信號肽,介導(dǎo)PC 進(jìn)入分泌途徑。結(jié)構(gòu)域II 是一個保守的PLCD 結(jié)構(gòu)域,負(fù)責(zé)使PC 與銅氧化物結(jié)合,該結(jié)構(gòu)域包含天冬酰胺-X-蘇氨酸/絲氨酸(Asn-X-Thr/Ser)序列,提供潛在的N-糖基化位點,并進(jìn)一步通過內(nèi)質(zhì)網(wǎng)分泌途徑促進(jìn)蛋白分揀,所有的PC 都至少有一個PLCD 域;結(jié)構(gòu)域Ⅲ是一個類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR)[4]。含有ALR 結(jié)構(gòu)域的PC 被認(rèn)為是形成細(xì)胞壁的氧化還原活性成分,并參與防御反應(yīng)[5]。結(jié)構(gòu)域IV 具有GAS的特征,能夠?qū)C錨定在細(xì)胞膜上[5]。根據(jù)結(jié)構(gòu)域組成,我們將BnPC 蛋白分成10 類(圖5),而在蒺藜苜蓿[4]和大白菜[28]中,分為9類。在甘藍(lán)型油菜中,我們比蒺藜苜蓿[4]多鑒定到Type VI 和Type X 成員,但并未鑒定到SPPLCD-PLCD-ALR-GAS 結(jié)構(gòu)域形式組成的成員;與大白菜相比,我們多鑒定到Type VIII、Type IX 和Type X,但并未鑒定到PLCD-PLCD 和PLCD-GAS結(jié)構(gòu)域組成形式的成員。而甘藍(lán)型油菜由白菜和甘藍(lán)自然雜交形成[30],我們推測在甘藍(lán)型油菜起源過程中,PLCD-PLCD 和PLCD-GAS 結(jié)構(gòu)域組成的成員可能發(fā)生了丟失,而Type VIII、Type IX 和Type X 的成員可能在進(jìn)化過程中由Type III、Type IV 和Type V成員丟失結(jié)構(gòu)域I進(jìn)而演化而來。
BnPLCL是成員最少的亞家族,在甘藍(lán)型油菜中僅有3 個成員,其中BnPLCL3僅在根中微弱表達(dá)而BnPLCL1和BnPLCL2在所有組織中均表達(dá),推測這兩個基因?qū)χ仓甑恼0l(fā)育可能極為重要。幾乎所有的BnUCL基因均在根中具有較高水平的表達(dá)量(除了BnUCL23),特別是BnUCL3和BnUCL16在其它組織中微弱表達(dá)或者不表達(dá),但在根中的表達(dá)量非常高,暗示BnUCL亞家族成員可能在根的發(fā)育中起著重要作用;除此之外,BnUCL3/10/13/21/22在14 d、24 d和34 d角果皮中均高表達(dá),而在其它組織中幾乎不表達(dá),說明這5 個基因可能在角果發(fā)育中發(fā)揮重要作用。SCL基因表達(dá)水平普遍較低,主要在根和莖中表達(dá),有趣的是,BnSCL2基因是BnPC基因中在花苞中表達(dá)水平最高的基因,遠(yuǎn)超其它基因,且這個基因的表達(dá)受非生物脅迫影響不明顯,推測這個基因在花苞中的功能可能非常重要且穩(wěn)定。前人的研究結(jié)果表明BnENODL基因在根中高表達(dá),參與了豆科植物的結(jié)瘤[4,14,15],與前人研究結(jié)果相似,我們發(fā)現(xiàn)大部分BnENODL基因也均在根中高表達(dá),表明BnENODL基因在根中的功能可能十分關(guān)鍵。某些BnENODL基因在部分組織器官中特異性高表達(dá),比如BnENODL21/37和BnENODL31/48/55/97分別在受精后14 d 和24 d 的種子中高表達(dá),這些基因可能在種子發(fā)育過程中發(fā)揮重要功能。
本研究結(jié)果對甘藍(lán)型油菜BnPC基因家族在全基因組水平上進(jìn)行了系統(tǒng)分析,鑒定出173 個BnPC成員,并對它們的染色體分布情況、序列特征、系統(tǒng)發(fā)生關(guān)系、啟動子順式元件組成以及時空表達(dá)模式和逆境響應(yīng)情況進(jìn)行了分析,為深入研究甘藍(lán)型油菜BnPC 蛋白功能和挖掘該家族中有利于甘藍(lán)型油菜遺傳改良的基因資源提供了一定的理論依據(jù)。