時小東,肖含磊,秦小波
(1.成都大學(xué) 農(nóng)業(yè)農(nóng)村部雜糧加工重點(diǎn)實(shí)驗室,四川 成都 610106;2.四川省自然資源科學(xué)研究院,四川 成都 610015)
藜麥(Chenopodiumquinoa)是原產(chǎn)于南美洲安第斯高原的一種糧食作物,是聯(lián)合國糧農(nóng)組織認(rèn)定的唯一的單一植物即可滿足人體基本營養(yǎng)需求的食物。同時,由于藜麥具有耐鹽堿、海拔適應(yīng)性強(qiáng)等優(yōu)勢,它已經(jīng)被引種至我國多個高海拔地區(qū),被認(rèn)為是具有發(fā)展前景的替代作物[1-2]。藜麥籽粒營養(yǎng)豐富,富含高品質(zhì)蛋白,且氨基酸配比均衡,能夠滿足人類的必需氨基酸需求,且不含有麩質(zhì)[3]。此外,藜麥籽粒含有豐富的脂肪酸,其脂肪酸含量高于常見谷物。研究表明,藜麥籽粒的脂肪酸主要為亞油酸、亞麻酸和油酸等不飽和脂肪酸,含量超過80%;其脂肪酸中亞油酸與亞麻酸的比值(LA/ALA)為6.2,符合FAO/WHO的推薦值[4]。隨著消費(fèi)者對膳食脂肪要求的提高,與其他商業(yè)化的功能性油脂相比,藜麥具有更大的油料開發(fā)潛力。
在植物種子中油脂合成過程十分復(fù)雜,涉及多種關(guān)鍵基因和限速酶。在模式植物擬南芥中,油脂合成相關(guān)途徑已經(jīng)較為清晰,根據(jù)在細(xì)胞活動中功能的差異,可將油脂合成相關(guān)基因分為9類,涉及葉綠體中脂肪酸的合成、內(nèi)膜系統(tǒng)的膜脂合成、油脂合成與存儲、脂質(zhì)信號等,確定了與油脂合成相關(guān)的基因600多個[5-6]。在油料作物大豆中,通過同源對比的方式鑒定得到與油脂合成相關(guān)的基因1100多個,這些基因和涉及通路對植物油脂含量具有重要的影響[7]。與油脂儲存蛋白相關(guān)的基因在植物油脂合成中發(fā)揮著非常重要的作用[8]。研究表明,在擬南芥中油脂儲存蛋白涉及基因19個,在大豆中油脂儲存相關(guān)基因有22個[5,8]。通過對油脂合成中關(guān)鍵基因的修飾和表達(dá)調(diào)控,能夠達(dá)到增加植物油脂產(chǎn)量的目的。
隨著分子生物學(xué)和測序技術(shù)的發(fā)展,藜麥基因組測序工作已經(jīng)完成,目前已經(jīng)獲得了高質(zhì)量的藜麥參考基因組序列信息[9]。這對于藜麥關(guān)鍵基因的挖掘和分析,以及在分子水平上改造油脂從而提高產(chǎn)油量具有重要意義。基于藜麥的組學(xué)數(shù)據(jù),我們對藜麥的油脂儲存蛋白進(jìn)行了鑒定和分析,并系統(tǒng)地分析了其理化信息、亞細(xì)胞定位、二級結(jié)構(gòu)、染色體定位,以及在不同組織中的表達(dá)情況,以期為進(jìn)一步研究藜麥籽粒油脂調(diào)控途徑和品質(zhì)改良奠定基礎(chǔ)。
通過NCBI(https://www.ncbi.nlm.nih.gov/)下載藜麥的基因組數(shù)據(jù)(ASM168347v1);大豆的基因組數(shù)據(jù)下載于JGI(https://genome.jgi.doe.gov/portal/);擬南芥的基因組數(shù)據(jù)下載于TARI(https://www.arabidopsis.org/)。根據(jù)報道[10]提取擬南芥和大豆油脂儲存相關(guān)的蛋白序列。
以提取的擬南芥和大豆油脂儲存基因的蛋白序列作為查詢序列信息,利用BLAST軟件進(jìn)行同源搜索[11],篩選參數(shù)為E-value<10-5。根據(jù)對比結(jié)果獲得藜麥中油脂儲存基因的蛋白序列和基因序列等信息。
使用ExPaSy(https://web.expasy.org/protparam/)對篩選序列的氨基酸數(shù)目、分子量、理論等電點(diǎn)等信息進(jìn)行預(yù)測;使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/)對α-螺旋、延伸鏈和β-轉(zhuǎn)角等二級結(jié)構(gòu)進(jìn)行預(yù)測。分別利用ProtComp(http://linux1.softberry.com/berry.phtml?group=programs&subgroup=proloc&topic=protcompan)和SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)對藜麥油脂儲存蛋白進(jìn)行亞細(xì)胞定位和信號肽分析,參數(shù)設(shè)置值為默認(rèn)值。
根據(jù)公布的藜麥基因組結(jié)構(gòu)數(shù)據(jù)文件,對藜麥油脂儲存蛋白基因的染色體定位、內(nèi)含子和外顯子結(jié)構(gòu)進(jìn)行分析和整理。使用ClustalX 2.1對獲得的氨基酸序列進(jìn)行多序列對比;再利用MEGA 7.0中的鄰接法(Neighbor-Joining, NJ)進(jìn)行系統(tǒng)進(jìn)化樹構(gòu)建,其中的bootstrap值設(shè)為1000。
基于本課題組構(gòu)建的藜麥根、莖、葉、花和種子的轉(zhuǎn)錄組測序數(shù)據(jù),用FPKM值表示基因的表達(dá)量,對藜麥不同組織中油脂儲存蛋白基因的表達(dá)水平進(jìn)行比較。
基于報道的擬南芥和大豆的油脂儲存蛋白序列,通過BLASTp進(jìn)行對比分析和鑒定,從藜麥的基因組數(shù)據(jù)中鑒定得到了15條油脂儲存蛋白,各蛋白的氨基酸序列差異較大。利用藜麥基因組注釋信息將15條藜麥油脂儲存蛋白基因分別定位在染色體上,對應(yīng)基因分布于9條染色體,其中分布于2號染色體和7號染色體的序列較多,各為3條;其次是染色體1號和4號,均有2條油脂儲存蛋白基因分布;其余染色體上分布數(shù)目各為1條。
利用生物信息學(xué)軟件對得到的藜麥油脂儲存蛋白序列進(jìn)行分析,其氨基酸數(shù)目為153~675;其中氨基酸數(shù)目大于500的蛋白有4個,氨基酸數(shù)目小于200的蛋白有6個(表1)。其蛋白質(zhì)分子量介于16093.50~74842.52 kDa。與大豆中油脂儲存蛋白的氨基酸數(shù)目(165~1012個)和蛋白質(zhì)分子量(19197.0~113732.9 kDa)相比,藜麥中跨度相對較小。理論等電點(diǎn)分析表明,15個藜麥油脂儲存蛋白的等電點(diǎn)介于5.7~10.1,其中6個蛋白的等電點(diǎn)小于7.0,表現(xiàn)為酸性;9個蛋白的等電點(diǎn)為8.5~10.1,在堿性范圍內(nèi),說明藜麥種子中的油脂儲存蛋白含有較多的堿性氨基酸。
對藜麥油脂儲存蛋白不穩(wěn)定指數(shù)的分析結(jié)果(表1)表明:Cq9024、Cq9021、Cq47176等8個蛋白的不穩(wěn)定指數(shù)小于40.0,為穩(wěn)定蛋白;其余7個蛋白的不穩(wěn)定指數(shù)大于40.0,為不穩(wěn)定蛋白。說明藜麥油脂儲存蛋白的穩(wěn)定性和不穩(wěn)定性數(shù)目相當(dāng)。
對藜麥油脂儲存蛋白的脂肪指數(shù)和疏水性進(jìn)行分析,結(jié)果表明:脂肪指數(shù)大于100的蛋白數(shù)量為2個;13個藜麥油脂儲存蛋白的脂肪指數(shù)小于100(表1),說明絕大多數(shù)藜麥油脂儲存蛋白表現(xiàn)為疏水性。
表1 藜麥油脂儲存蛋白的一級結(jié)構(gòu)
研究表明,蛋白質(zhì)的二級結(jié)構(gòu)是衡量蛋白質(zhì)穩(wěn)定性的重要因素,α-螺旋和β-轉(zhuǎn)角結(jié)構(gòu)具有高度的穩(wěn)定性,為蛋白質(zhì)的有序結(jié)構(gòu);而無規(guī)則卷曲為蛋白質(zhì)的無序結(jié)構(gòu)。對15個藜麥油脂儲存蛋白的二級結(jié)構(gòu)進(jìn)行預(yù)測,結(jié)果表明:藜麥油脂儲存蛋白的二級結(jié)構(gòu)以無規(guī)則卷曲和α-螺旋為主,β-轉(zhuǎn)角最少,說明藜麥中油脂儲存蛋白的二級結(jié)構(gòu)整體表現(xiàn)為穩(wěn)定(表2)。
對蛋白序列進(jìn)行信號肽分析,在藜麥油脂儲存蛋白中未發(fā)現(xiàn)信號肽序列。利用在線工具對15個藜麥油脂存儲蛋白進(jìn)行亞細(xì)胞定位分析,發(fā)現(xiàn)9個藜麥油脂儲存蛋白定位于胞外;定位于內(nèi)質(zhì)網(wǎng)和質(zhì)膜的蛋白數(shù)目均為3個(表2),表明藜麥油脂儲存蛋白基因可以在不同的細(xì)胞結(jié)構(gòu)中發(fā)揮功能。
表2 藜麥油脂儲存蛋白的二級結(jié)構(gòu)預(yù)測和亞細(xì)胞定位結(jié)果
基于氨基酸序列,對藜麥油脂儲存蛋白基因進(jìn)行系統(tǒng)進(jìn)化樹構(gòu)建,結(jié)果如圖1所示。根據(jù)進(jìn)化樹的分枝情況,可以將藜麥油脂儲存蛋白基因分為6個分枝:第一類分枝含有的基因數(shù)目最多(5個),包含Cq19333、Cq41585、Cq12793、Cq47176和Cq58234;其次是第五類分枝,含有3個基因,分別為Cq26888、Cq56385、Cq31514;第二類分枝含有的基因數(shù)目最少,僅含有Cq26935;其余分枝的基因數(shù)量均為2個,其中第三類分枝包含Cq3546、Cq39827,第四類分枝包括Cq9024、Cq9021,第六類分枝包括Cq1102、Cq37552。與其他分枝相比,第二類分枝較長,表明Cq26935基因發(fā)生較早,其可能經(jīng)歷了較為復(fù)雜的進(jìn)化進(jìn)程。同時,各分枝基因具有相似的基因結(jié)構(gòu)和特征,例如每個分枝基因編碼蛋白的亞細(xì)胞定位均相同,且具有類似的二級結(jié)構(gòu)。
圖1 藜麥油脂儲存蛋白基因的系統(tǒng)進(jìn)化樹
基于藜麥根、莖、葉、花和種子的轉(zhuǎn)錄組測序數(shù)據(jù),獲得了15個油脂儲存蛋白基因的FPKM值。結(jié)果表明:15個油脂蛋白基因在根、莖、葉和花中的表達(dá)聚類在一起;在種子組織中的表達(dá)單獨(dú)聚類(圖2)。結(jié)合系統(tǒng)進(jìn)化樹來看,藜麥油脂儲存蛋白基因的表達(dá)情況與進(jìn)化具有一定的相似性。第一分枝和第三分枝的7個基因表達(dá)模式相似,在種子中的表達(dá)量均明顯上調(diào)。其中,Cq47176在種子中特異表達(dá),在其他組織中均無表達(dá);Cq12793和Cq3546在根、莖和葉中無表達(dá),在花和種子中表達(dá),且在種子中的表達(dá)量顯著高于在花中的表達(dá)量,推測這2個基因在重要生物學(xué)作用的發(fā)揮中具有一定的關(guān)聯(lián)性。
圖2 藜麥種子中油脂儲存蛋白基因的表達(dá)水平
隨著測序技術(shù)和生物信息學(xué)方法的不斷發(fā)展,分子生物學(xué)數(shù)據(jù)呈現(xiàn)出爆炸式的增長,如何對生物學(xué)數(shù)據(jù)進(jìn)行深入分析和應(yīng)用成為當(dāng)前生物學(xué)研究的熱點(diǎn)之一。研究表明,藜麥為異源四倍體植物,由祖源的A和B兩個二倍體品種雜交而來,其質(zhì)量性狀易表現(xiàn)出雙染色體遺傳現(xiàn)象[12]。Jarvis等應(yīng)用基因組測序的方法估計藜麥的重組發(fā)生在330萬~630萬年前,并且其可能分別在高原和沿海環(huán)境被獨(dú)立馴化[9]。本文的系統(tǒng)分析表明,15個藜麥油脂蛋白被分為6個分枝,第一分枝和第二分枝成員最多,第三分枝和第四分枝成員較少。每個分枝的基因均具有相似的結(jié)構(gòu)和定位結(jié)構(gòu),表明其在功能上存在相似性或功能冗余。第一分枝成員的枝長較長,說明這些基因發(fā)生較早,可能在馴化中經(jīng)歷了復(fù)雜的進(jìn)化。
藜麥籽粒中脂肪含量是玉米的兩倍,且含有豐富的必需脂肪酸,已經(jīng)被應(yīng)用在保健產(chǎn)品、面包營養(yǎng)添加劑、高端化妝品等產(chǎn)品中,因此藜麥?zhǔn)蔷哂袧摿r值的作物[13]。石振興等[14]對國內(nèi)、玻利維亞、美國、秘魯?shù)葒鴥?nèi)外60份藜麥籽粒的品質(zhì)進(jìn)行了分析,結(jié)果表明其脂肪酸方面的變異范圍較小,這可能與藜麥油脂相關(guān)基因的多樣性較低有關(guān)。油脂合成相關(guān)基因是一個重要的家族,涉及多種功能基因和途徑;油脂儲存相關(guān)的基因雖然數(shù)量較少,卻發(fā)揮著重要的作用[15]。本研究的同源對比分析得到了15個藜麥油脂儲存蛋白基因,分布于9條染色體上。對藜麥油脂儲存蛋白序列的分析表明,與大豆油脂儲存蛋白相比,15個基因的蛋白序列氨基酸數(shù)目、分子量等差異較小,可能與藜麥在進(jìn)化過程中片段的丟失和保留機(jī)制有一定的相關(guān)性。
與大豆相似,藜麥油脂儲存蛋白的二級結(jié)構(gòu)主要為無規(guī)則卷曲和α-螺旋,且主要定位于內(nèi)質(zhì)網(wǎng)、胞外和質(zhì)膜,均無信號肽位點(diǎn)。雖然藜麥和大豆在油脂儲存蛋白的氨基酸數(shù)目等方面存在差異,但二級結(jié)構(gòu)和亞細(xì)胞定位等方面具有相似性,這可能與其功能的發(fā)揮具有相關(guān)性。同時,13個藜麥油脂儲存蛋白的脂肪指數(shù)小于100,說明絕大多數(shù)藜麥油脂儲存蛋白表現(xiàn)為疏水性。理論等電點(diǎn)分析表明,15個藜麥油脂儲存蛋白的等電點(diǎn)介于5.7~10.1,其中9個蛋白的等電點(diǎn)為8.5~10.1,在堿性范圍內(nèi),說明藜麥油脂儲存蛋白含有較多的堿性氨基酸,這與前人的研究結(jié)果[8]一致。從不穩(wěn)定指數(shù)的分析結(jié)果可知,藜麥油脂儲存蛋白的穩(wěn)定性和不穩(wěn)定性蛋白數(shù)目基本一致,由此推測藜麥的一部分油脂儲存蛋白可能受外界環(huán)境條件的刺激誘導(dǎo)而發(fā)生了變化。
植物種子的油脂合成過程比較復(fù)雜,涉及的關(guān)鍵基因和調(diào)控因子較多,這給研究帶來了很大的困難。運(yùn)用生物信息學(xué)的方法,從基因組水平進(jìn)行整體分析,可為研究藜麥油脂合成提供參考[16]。藜麥基因組測序工作的完成為藜麥的功能基因挖掘、機(jī)理分析和品種改良提供了途徑。本研究結(jié)果可為深入研究藜麥油脂合成的調(diào)控和改良等提供參考數(shù)據(jù)。