李戌彥 楊忠義 紀 薇 楊明霞
(1山西農(nóng)業(yè)大學園藝學院,山西 太谷 030801;2山西農(nóng)業(yè)大學果樹研究所,山西 太谷 030801;3農(nóng)業(yè)部黃土高原作物基因資源與種質(zhì)創(chuàng)制重點實驗室,山西太原 030031;4果樹種質(zhì)創(chuàng)制和利用山西省重點實驗室,山西太原 030031)
山楂(Crataegusspp.)屬于薔薇科山楂屬落葉果樹,其果實含有大量的有機酸、黃酮類、甾體、有機胺及低聚黃烷類物質(zhì),營養(yǎng)價值極高[1]。山楂主要分布于東亞、歐洲、北美洲等北溫帶地區(qū)[2],由于我國地形氣候變化多樣,山楂種質(zhì)資源也較為豐富,現(xiàn)存的主要歐亞種山楂均與我國山楂有著直接或間接的聯(lián)系?;ㄉ侵参锘ㄆ鞴俜诸愖钪匾男誀钪籟3],也是植物花器官發(fā)育階段界定的主要性狀之一。山楂的花色主要為純白色或紅色,差異極明顯[4]。經(jīng)前期調(diào)查和研究,在開放白色花朵的山楂樹上發(fā)現(xiàn)了芽變產(chǎn)生的粉紅色花朵,該花在完全開放后顏色會轉(zhuǎn)為粉色,通過轉(zhuǎn)錄組測序、基因注釋、花青素含量測定等研究,發(fā)現(xiàn)一些基因的表達可能對花青苷的含量產(chǎn)生影響,其中包括一個MYB轉(zhuǎn)錄家族基因[5]。
MYB類轉(zhuǎn)錄因子,作為綠色植物中影響最大的轉(zhuǎn)錄因子家族之一,可以響應(yīng)外界環(huán)境變化、調(diào)節(jié)細胞周期、影響物質(zhì)代謝,參與多種生理生化過程,是目前基因家族研究的重點之一[6]。MYB類轉(zhuǎn)錄因子家族均含一個或多個保守度較高的MYB結(jié)構(gòu)域,即MYB DNA-binding結(jié)構(gòu)域,每個結(jié)構(gòu)域包含1~3個串聯(lián)且不重復(fù)的、由51~53個氨基酸組成的R基序[7]。在R基序中,每間隔18個氨基酸存在一個起疏水核心作用的色氨酸殘基,每個R基序中含有3個色氨酸殘基,其對維持螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)具有重要意義[8],可以使得形成的高級結(jié)構(gòu)特異性結(jié)合DNA大溝[9]。MYB轉(zhuǎn)錄因子蛋白參與多種生理生化反應(yīng)。目前,MYB轉(zhuǎn)錄因子已在芒果[10]、白樺[11]、黑果枸杞[12]、青蒿[13]等植物中進行了克隆表達。楊捷等[14]研究發(fā)現(xiàn)Lhsor MYB12轉(zhuǎn)錄因子可能對花器官的分化具有調(diào)節(jié)作用。趙佳等[15]研究發(fā)現(xiàn)R2R3-MYB的表達影響了月季花青苷的合成;Shang等[16]研究發(fā)現(xiàn)MYB轉(zhuǎn)錄因子與bHLH轉(zhuǎn)錄因子的表達影響了金魚草花色苷的含量,從而導(dǎo)致金魚草脈序和花色的不同。陳哲等[6]發(fā)現(xiàn)菠蘿中的MYB基因可能受到外界乙烯利的調(diào)控,并影響菠蘿的生長發(fā)育。
植物中調(diào)控花青素生物合成的轉(zhuǎn)錄因子主要有MYB、bHLH和WD40基因家族成員[17]。本研究以前期獲得的不同時期和顏色的山楂花轉(zhuǎn)錄組數(shù)據(jù)為基礎(chǔ),利用生物信息學手段,基于山楂轉(zhuǎn)錄組數(shù)據(jù)進行篩選、鑒定,從而對MYB轉(zhuǎn)錄因子進行深入挖掘,以期為研究山楂MYB轉(zhuǎn)錄因子對植物花青苷含量的影響及后期相關(guān)基因功能的研究奠定基礎(chǔ)。
試驗材料采自山西省太谷縣山西農(nóng)業(yè)科學院果樹研究所(112.58°E,37.43°N,833 m±4 m),品種為大金星山楂。根據(jù)前期研究,選擇花色苷含量具有顯著差異的時期進行采樣,常規(guī)大金星品種花朵開放初始階段(BB-1)和花朵完全開放后(BB-2)均為白色;大金星芽變品種花朵開放初始階段(BF-1)為白色,花朵完全開放后(BF-2)為粉色[5]。采集后的樣品在液氮環(huán)境中運回實驗室進行RNA提取,并送至北京百邁客生物科技有限公司進行轉(zhuǎn)錄組測序和組裝。
從Pfam(http://pfam.xfam.org/)數(shù)據(jù)庫中下載MYB保守結(jié)構(gòu)域的隱馬爾科夫模型文件PF00249,并利用Hmmer軟件在轉(zhuǎn)錄組蛋白質(zhì)數(shù)據(jù)中進行檢索。利用本地BLAST軟件(ncbi-blast-2.10.0+-win64)將檢索結(jié)果構(gòu)建成本地山楂轉(zhuǎn)錄組MYB蛋白二級數(shù)據(jù)庫,并從Plant Transcription Factor Database(http://planttfdb.cbi.pku.edu.cn/)下載擬南芥168條MYB轉(zhuǎn)錄因子序列進行本地BLAST搜索,將BLAST結(jié)果建成山楂轉(zhuǎn)錄組MYB蛋白三級數(shù)據(jù)庫。利用NCBI(https://www.ncbi.nlm.nih.gov/)網(wǎng)站的Conserved Domain Search功能依次對結(jié)構(gòu)域種類及數(shù)量進行預(yù)測,排除假陽性。
利用ExPASy-ProtParam tool(https://web.expasy.org/protparam/)對山楂MYB蛋白序列的氨基酸數(shù)、理論等電點(protein isoelectric,pI)、分子量、親水性、不穩(wěn)定性進行預(yù)測。利用WoLF PSORT(https://wolfpsort.hgc.jp/)對MYB基因編碼的蛋白進行亞細胞定位預(yù)測。利用MEME(http://meme.nbcr.net/meme/cgi-bin/meme.cgi)分別對篩選出的不同種類的山楂MYB蛋白序列進行motif結(jié)構(gòu)預(yù)測。
利用MEGA X對篩選出的2R-MYB序列及125個已有研究基礎(chǔ)的擬南芥2R-MYB序列進行多序列比對,并采用鄰接法(neighbor-joining)進行系統(tǒng)進化樹的構(gòu)建。1R-MYB系統(tǒng)進化樹僅利用篩選出的山楂1R-MYB進行構(gòu)建。
根據(jù)轉(zhuǎn)錄組測序結(jié)果,將各個基因片段的表達量利用RPKM(reads per kilobasc per million mapped reads)法進行計算,得到表達量的RPKM值,利用R對不同品種、時期MYB蛋白序列的表達量繪制熱圖進行分析。
轉(zhuǎn)錄組測序后共得到34.28 Gb有效數(shù)據(jù),經(jīng)過計算、處理后共得到18 313條蛋白質(zhì)序列。利用隱馬爾科夫模型文件PF00249進行搜索,并將所得序列建立本地BLAST數(shù)據(jù)庫,進一步利用擬南芥MYB蛋白序列作為查詢文件進行本地BLAST,共得到80條序列。利用NCBI進行結(jié)構(gòu)域預(yù)測后手動篩選,共得到73條山楂MYB家族蛋白序列,其中共含有MYB結(jié)構(gòu)域113個。根據(jù)Dubos等[7]和Stracke等[18]的分類規(guī)則對其進行分類,最終獲得35條1R-MYB蛋白、36條2R-MYB蛋白、2條3R-MYB蛋白(圖1)。由于3RMYB蛋白數(shù)量較少,因此本試驗主要研究1R-MYB蛋白和2R-MYB蛋白。
由表1可知,1R-MYB蛋白序列平均長度為303.03個氨基酸,且主要分布在50~350個氨基酸之間,長度大于700個氨基酸的僅2個,最大為786個氨基酸(CpMYB61),最小為50個氨基酸(CpMYB53)。而2R-MYB蛋白序列平均長度為328.14個氨基酸,長度主要分布在188~388個氨基酸之間,長度小于200個氨基酸的僅有3條,最大為979個氨基酸(CpMYB36),最小為88個氨基酸(CpMYB12)。相較長度而言,山楂2R-MYB蛋白長度較1R-MYB蛋白長。相對分子質(zhì)量的變化情況與氨基酸長度變化情況相似。山楂1R-MYB蛋白中有16個蛋白pI值大于7.5,15個蛋白pI值小于6.5,4個蛋白pI值介于6.5~7.5之間;而2R-MYB蛋白中有16個蛋白pI值大于7.5,16個蛋白p I值小于6.5,4個蛋白p I值介于6.5~7.5之間。2R-MYB蛋白中僅CpMYB21(不穩(wěn)定性指數(shù)為38.91)不穩(wěn)定性指數(shù)小于40,屬于穩(wěn)定蛋白,1R-MYB蛋白中只有CpMYB40(28.59)、CpMYB62(34.51)2個為穩(wěn)定蛋白,其余蛋白均為不穩(wěn)定蛋白。
根據(jù)亞細胞定位預(yù)測的結(jié)果,篩選出的所有2RMYB蛋白都分布于細胞核中,1R-MYB蛋白除CpMYB41、CpMYB55、CpMYB62、CpMYB70、CpMYB71主要分布于葉綠體中,CpMYB66主要分布在線粒體中,其余都分布在細胞核中(表1)。
表1 山楂MYB蛋白理化性質(zhì)及類型Table1 Physicochemical properties and types of MYB protein in haw thorn
表1(續(xù))
3R-MYB蛋白僅篩選出2個,氨基酸數(shù)量分別為592(CpMYB1)和1 033(CpMYB2),3R-MYB蛋白數(shù)量較少,無法與1R-MYB、2R-MYB進行比較,1 033個氨基酸長度是本研究中最長的蛋白。3R-MYB蛋白不穩(wěn)定性指數(shù)均大于40,為不穩(wěn)定蛋白。
圖2分別為1R-MYB與2R-MYB的motif結(jié)構(gòu),且2R-MYB得到的序列長度相對較長。SMATR進一步分析表明,2R motif 4為AT hook結(jié)構(gòu),2R motif 1、2R motif 2、2R motif 3、2R motif 4、2R motif 5、1R motif 1、1R motif 2、1R motif 3均含有SANT結(jié)構(gòu),其中2R motif 5和1R motif 3同時具有MYB DNA-binding結(jié)構(gòu)。
利用125個擬南芥2R-MYB轉(zhuǎn)錄因子蛋白與篩選的36個2R-MYB轉(zhuǎn)錄因子共同構(gòu)建系統(tǒng)進化樹(圖3)。根據(jù)Dubos等[7]針對擬南芥2R-MYB轉(zhuǎn)錄因子家族的系統(tǒng)進化樹分析結(jié)果對研究已相對明確的亞組進行編號,共找到23組,其中,共有19個山楂2RMYB轉(zhuǎn)錄因子匹配到了14個亞組中。同時,根據(jù)系統(tǒng)進化樹,發(fā)現(xiàn)7個山楂2R-MYB轉(zhuǎn)錄因子系統(tǒng)進化關(guān)系較遠,且具有一定的聚集性,根據(jù)距離遠近,將其分為3個新的亞組,分別為NS1(CpMYB16、CpMYB34、AtMYB91)、NS2(CpMYB29、CpMYB32、CpMYB35、CpMYB36)和NS3(CpMYB5),其中NS1包含一個擬南芥MYB轉(zhuǎn)錄因子蛋白AtMYB91。
由圖4可知,山楂1R-MYB轉(zhuǎn)錄因子可分為6個亞組,其中R1S5亞組包含的蛋白數(shù)量最少,僅有2條;R1S6亞組包含的轉(zhuǎn)錄因子數(shù)量最多,包含13條。
根據(jù)山楂轉(zhuǎn)錄組數(shù)據(jù)分析(圖5),發(fā)現(xiàn)CpMYB73只在BF-1中表達,其余轉(zhuǎn)錄因子在2種花完全開放前后均有表達。在白色花分組BB-1 vs BB-2中,有42個轉(zhuǎn)錄因子在BB-2時期的表達量高于BB-1時期,30個轉(zhuǎn)錄因子表達量低于BB-1時期。在花色芽變分組BF-1 vs BF-2中,共有34個轉(zhuǎn)錄因子在BF-2時期表達量高于BF-1時期,39個轉(zhuǎn)錄因子表達量低于BF-1時期。在山楂花完全開放前的分組BB-1 vs BF-1中,有36個轉(zhuǎn)錄因子在BF-1時期的表達量高于BB-1時期,37個轉(zhuǎn)錄因子表達量低于BB-1時期。在山楂花完全開放后的BB-2 vs BF-2中,有28個轉(zhuǎn)錄因子在BF-2時期的表達量高于BB-2時期,45個轉(zhuǎn)錄因子表達量低于BB-2時期。
將山楂轉(zhuǎn)錄組數(shù)據(jù)按不同分組進行差異表達分析,共找到16個具有表達差異的MYB轉(zhuǎn)錄因子(圖6)。4個分組中,BB-1 vs BB-2中具有10個差異表達的轉(zhuǎn)錄因子,在4個分組中最多;BF-1 vs BF-2中只有4個具有差異表達的轉(zhuǎn)錄因子。僅CpMYB5在4個分組中都具有差異表達,且在BB-1 vs BB-2和BB-1 vs BF-1兩組中均上調(diào)表達,在BF-1 vs BF-2和BB-2 vs BF-2兩組中均下調(diào)表達。只在BB-2 vs BF-2中出現(xiàn)的差異表達基因數(shù)為3個,分別為CpMYB6、CpMYB41、CpMYB45,且 均 上 調(diào) 表 達。CpMYB42和CpMYB58只在BB-2 vs BF-2和BF-1 vs BF-2中出現(xiàn),且這2個基因均在BF-2中上調(diào)表達。
研究表明,MYB轉(zhuǎn)錄因子可以調(diào)控植物花青苷的生物合成,影響植物花、果、葉等多種器官的顏色[19]。曹雨薇等[20]研究發(fā)現(xiàn)LhMYB12和LhMYB6基因可以調(diào)控百合花被片花青素苷的含量,從而使百合花被片呈現(xiàn)不同的顏色。Liu等[21]發(fā)現(xiàn)在光誘導(dǎo)基因的調(diào)節(jié)下,蘋果MdMYB16和MdMYB308啟動子活性被抑制,調(diào)節(jié)了蘋果中的花色苷積累。本研究前期也發(fā)現(xiàn),MYB家族的表達可以調(diào)控花青苷的積累[5],但未對MYB家族成員進行深度挖掘。本研究通過對轉(zhuǎn)錄組數(shù)據(jù)的深度挖掘,共發(fā)掘出73個MYB基因家族成員,其中35個1R-MYB,占比47.95%;36個2R-MYB,占比49.32%;2個3R-MYB,占比2.74%。其中1R-MYB占比明顯高于前人對亞洲百合[22]、小蘭嶼蝴蝶蘭[23]的研究結(jié)果,且在具有差異表達的MYB轉(zhuǎn)錄因子中也以1R-MYB為主,因此推測這些1R-MYB轉(zhuǎn)錄因子可能在花青苷的生物合成中具有一定的調(diào)控作用。
目前,擬南芥MYB轉(zhuǎn)錄因子功能的研究較為明晰。為了探究山楂2R-MYB轉(zhuǎn)錄因子的生物學功能,以擬南芥2R-MYB轉(zhuǎn)錄因子蛋白為參考進行研究,系統(tǒng)進化樹分析發(fā)現(xiàn),36個2R-MYB蛋白中僅有19個進入了擬南芥中已被確定功能的14個亞組。一些亞組的主要作用是利于植物響應(yīng)外界生物與非生物脅迫,如CpMYB23所在的S1可以響應(yīng)脫落酸信號調(diào)控,并激活細胞程序化死亡[24];CpMYB24、CpMYB30所在的S11可以應(yīng)對昆蟲咬傷,在傷后防止脫水[25];CpMYB22所在的S20可以調(diào)節(jié)細胞的電解質(zhì)平衡;CpMYB19、CpMYB15所在的S22可在脫落酸的調(diào)節(jié)下影響氣孔的關(guān)閉[26]。還有一些亞組主要用于調(diào)控細胞的生長和發(fā)育,如CpMYB37所在的S9和CpMYB17所屬的S14,可以控制花瓣、花序以及種子的發(fā)育[27];CpMYB12所屬的S4,CpMYB20、CpMYB27所屬的S13,以及CpMYB26、CpMYB31、CpMYB38所在的S21,都具有調(diào)節(jié)木質(zhì)素或纖維素生物合成的功能,影響植物細胞壁的發(fā)育[28-30]。還有諸如CpMYB13所屬的S2、CpMYB3所屬的S5以及CpMYB4所屬的S7具有影響植物原花青素、多酚及類黃酮物質(zhì)生物合成的功能,協(xié)助調(diào)控植物的次生代謝[31-33]。同時,本研究還發(fā)現(xiàn)了3個與其他亞組關(guān)系較遠,且進化相對保守的新亞組。新亞組NS1中包含一個擬南芥MYB轉(zhuǎn)錄因子AtMYB91與兩個山楂MYB轉(zhuǎn)錄因子,根據(jù)Liu等[34]的研究,AtMYB91對細胞中KNOX表達具有負調(diào)節(jié)作用,因此NS1亞組的功能可能與其相關(guān)。關(guān)于MYB轉(zhuǎn)錄因子的研究目前主要集中于2R-MYB轉(zhuǎn)錄因子上,對1R-MYB的研究相對較少。本研究發(fā)現(xiàn)山楂花朵內(nèi)1R-MYB轉(zhuǎn)錄因子蛋白占所有MYB轉(zhuǎn)錄因子蛋白的比例較高,且在菠蘿[6]、馬纓杜鵑[35]等物種中也存在類似現(xiàn)象,因此將1R-MYB轉(zhuǎn)錄因子蛋白單獨進行系統(tǒng)進化分析。本研究發(fā)現(xiàn),35個山楂1RMYB轉(zhuǎn)錄因子蛋白可分為6個亞組,其中數(shù)量最少的亞組(R1S5)與數(shù)量最多的亞組(R1S6)可能具有相同的來源,但R1S6內(nèi)進化程度更為復(fù)雜,因而推測R1S6內(nèi)的MYB轉(zhuǎn)錄因子具有更豐富的生物功能。
本研究中,山楂轉(zhuǎn)錄組數(shù)據(jù)的差異表達分析表明,達到差異表達水平的轉(zhuǎn)錄因子共有16個,其中有1個3R-MYB轉(zhuǎn)錄因子,7個2R-MYB轉(zhuǎn)錄因子,8個1RMYB轉(zhuǎn)錄因子。CpMYB2和CpMYB4僅在BB-1 vs BB-2組中差異表達,BB-1與BB-2為白色花的不同時期,且均在第二時期上調(diào)表達,因而考慮其主要功能可能是調(diào)控白色花的表達或控制花的發(fā)育。進一步研究發(fā)現(xiàn),CpMYB4屬于2R-MYB轉(zhuǎn)錄因子,而與其系統(tǒng)進化關(guān)系較近的AtMYB11[36]、AtMYB12[37]均可以調(diào)控擬南芥類黃酮生物合成,影響黃酮醇積累的作用,因此推測CpMYB4轉(zhuǎn)錄因子具有相同的生物學功能,促進了白色花的表達。CpMYB6、CpMYB41、CpMYB45三個轉(zhuǎn)錄因子只單獨出現(xiàn)在BB-2 vs BF-2組中,且上調(diào)表達,由于該分組為芽變品種花朵完全開放前后兩個時期的對比,且在完全開放前后花朵顏色發(fā)生了變化,因此這三個轉(zhuǎn)錄因子極有可能在山楂花色表達過程中起到調(diào)控作用。通過前人研究,AtMYB26、AtMYB103在花藥發(fā)育、細胞壁合成和分解、木質(zhì)素生物合成等方面具有調(diào)控作用[38-39],而CpMYB6在系統(tǒng)進化關(guān)系上與其相近,因而推測CpMYB6與其具有類似的生物功能。研究發(fā)現(xiàn),CpMYB56僅在BB-1 vs BF-1組中具有表達差異,該組為正常山楂和芽變山楂花朵開放初始階段,雖然并無明顯顏色變化,但其可能參與花朵顏色變化前期的生理過程,調(diào)控機制還需要進一步研究確認。本研究未發(fā)現(xiàn)單獨在BF-1 vs BF-2組中差異表達的轉(zhuǎn)錄因子,但是發(fā)現(xiàn)了2個只在BB-2 vs BF-2組和BF-1 vs BF-2組的交集中差異表達的轉(zhuǎn)錄因子,分別是CpMYB42、CpMYB58,且均在BF-2中上調(diào)表達,因此CpMYB42和CpMYB58也極有可能調(diào)控山楂花色的形成。CpMYB29僅在BB-1 vs BB-2組和BF-1 vs BF-2組中差異表達,由于這兩組均能體現(xiàn)山楂花開放的過程,因而猜測該轉(zhuǎn)錄因子可能與花的生長發(fā)育相關(guān)。CpMYB22、CpMYB48、CpMYB64均在BB-1 vs BB-2組中下調(diào)表達,在BB-2 vs BF-2組中上調(diào)表達,與CpMYB22系統(tǒng)進化關(guān)系交近的AtMYB2主要可以增強植物細胞的分裂與分化[40],因此推測CpMYB22可能也具有相同的生物學功能。CpMYB11、CpMYB12和CpMYB65均在BB-1 vs BB-2組與BB-1 vs BF-1組中下調(diào)表達,由于CpMYB12與AtMYB4系統(tǒng)進化關(guān)系較近,而AtMYB4可能參與抑制木質(zhì)素合成,調(diào)控黃酮類化合物合成的功能[41],因而CpMYB12可能也具有相同的生物學功能,而CpMYB11的功能還有待進一步深入研究。
本研究利用生物信息學方法深度挖掘了山楂轉(zhuǎn)錄組數(shù)據(jù)中的MYB基因家族成員,共篩選出73個MYB轉(zhuǎn)錄因子,其中35個為1R-MYB成員,36個為2RMYB成員,2個為3R-MYB成員。通過進一步分析,將篩選出的2R-MYB轉(zhuǎn)錄因子按照擬南芥已有的研究基礎(chǔ)進行分類,其中有19個山楂2R-MYB蛋白被匹配到14個在擬南芥已具有一定研究基礎(chǔ)的亞組中,同時還利用系統(tǒng)進化樹分析的手段,將篩選出的1R-MYB轉(zhuǎn)錄因子分為了6個亞組。根據(jù)轉(zhuǎn)錄組數(shù)據(jù)進行差異表達分析,發(fā)現(xiàn)CpMYB4、CpMYB6、CpMYB12、CpMYB41、CpMYB42、CpMYB45、CpMYB56、CpMYB58等8個轉(zhuǎn)錄因子可能具有調(diào)控山楂花色的功能。本研究為進一步研究影響山楂花色的MYB轉(zhuǎn)錄因子提供了參考。