趙珊珊 ,董琳琳 ,柴文婷 ,楊博慧 ,孫慧瓊 ,王新宇 ,劉卓君 ,郭子浩 ,史小霞 ,郝昱寧 ,朱立勛 ,鄒春雷 ,姜曉東 ,趙威軍 ,呂晉慧 ,張春來
(1.山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院/教育部省部共建黃土高原特色作物高效生產(chǎn)協(xié)同創(chuàng)新中心,山西 太谷 030801;2.山西農(nóng)業(yè)大學(xué) 高粱研究所,山西 晉中 030600;3.山西農(nóng)業(yè)大學(xué) 林學(xué)院,山西 太谷 030801)
粒用高粱(Sorghum bicolor)為C4 短日照植物,已有超過5 000 a 的栽培歷史,是世界第五大糧食作物,也是非洲及一些南亞地區(qū)的主要糧食作物,其高產(chǎn)、耐鹽、抗旱等特點倍受關(guān)注[1-5]。隨著人們的生活條件越來越好,更多的高粱被用來作飼料,用來釀酒,用來作其他的工業(yè)材料。高粱的谷蛋白是一種用于儲藏糧食的重要蛋白,與醇溶蛋白共同影響著整個蛋白質(zhì)的生物學(xué)價值,2 種蛋白加在一起,占據(jù)了整個高粱蛋白質(zhì)總量的70%[6-9]。目前,對谷蛋白的研究主要集中在其提取、純化和蛋白質(zhì)加工特性方面。
前期研究表明,高粱籽粒蛋白的變化幅度在4.4%~21.1%,籽粒蛋白由水溶性蛋白,如清蛋白、球蛋白、谷蛋白以及交聯(lián)的醇溶蛋白組成,其中,谷蛋白及醇溶蛋白所占的比例超過70%,按照分子質(zhì)量又可劃分為α-、β-、γ-、δ-kafirin(高粱醇溶蛋白),儲存在球狀蛋白體的內(nèi)質(zhì)網(wǎng)中[10]。籽粒儲藏蛋白的合成和積累是禾本科作物儲藏蛋白的重要來源。有研究表明,高粱glutelin 是一種與高粱利用價值密切相關(guān)的蛋白質(zhì),是一種與小麥谷蛋白同源性很高的蛋白質(zhì)[11]。
本研究主要利用數(shù)據(jù)庫,對高粱glutelin基因表達和其結(jié)構(gòu)進行研究,觀察它是否屬于所需要改良的基因或者蛋白質(zhì),并對高粱的利用價值進行更深層次地了解,旨在為高粱籽粒蛋白質(zhì)含量的調(diào)控研究提供參考。
利用Phytozome Plant 數(shù)據(jù)庫(https://phytozome-next.jgi.doe.gov/)檢索出小麥glutelin 蛋白序列,結(jié)合轉(zhuǎn)錄組的測序數(shù)據(jù),篩選出高粱glutelin家族。
運用ExPASy(https://web.expasy.org/protparam/)匯總分析高粱glutelin 家族成員蛋白質(zhì)的結(jié)構(gòu)和理化性質(zhì)。
將CDS 序列文本、基因序列文本以及nwk 格式樹文本文件上傳在GSDS 2.0 在線工具(http://gsds.cbi.pku.edu.cn/),對高粱glutelin基因結(jié)構(gòu)進行分析。
利用SignalP-5.0(SignalP 5.0-DTU Health Tech-Bioinformatic Services)預(yù)測高粱glutelin 蛋白家族信號肽;利用PSORT Prediction(http://psort1.hgc.jp/form. html)進行亞細胞定位匯總分析。
利用TMHMM Server v2.0(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測高粱glutelin 蛋白質(zhì)跨膜螺旋;利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預(yù)測分析高粱glutelin 蛋白二級結(jié)構(gòu);利用Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)進行三級結(jié)構(gòu)預(yù)測分析。
采用Pfam 數(shù)據(jù)庫(http://pfam.xfam.org/)對高粱 glutelin 蛋白進行全基因組測序,獲得其蛋白質(zhì)結(jié)構(gòu)域,并通過TBtools 軟件對其進行可視化處理。
上傳高粱glutelin蛋白序列,利用MEME(http://meme-suite.org/tools/meme)在線數(shù)據(jù)網(wǎng)站,獲取高粱glutelin 蛋白meme.xml 文件,并且使用TBtools 軟件對高粱glutelin 蛋白保守性進行分析。
利用Phytozome Plant 數(shù)據(jù)庫檢索高粱(3 個)、水稻(7 個)、小麥(7 個)、玉米(3 個)和谷子(4 個)不同的glutelin 蛋白序列,通過MEGA 7.0 軟件進行Clustal W 多重比對,獲取高粱、水稻、小麥、玉米和谷子不同物種glutelin 進化樹的結(jié)果樹文本格式,利用iTOL(http://itol.embl.de)在線工具對進化樹進行美化分析。
高粱種質(zhì)資源3chi3、IS22203、IS22204、Laohanye(老漢葉,山西和順)從國家農(nóng)作物種質(zhì)資源庫獲取,其中后2 個為高蛋白種質(zhì)。1383-2×7050B_F4-12由山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院作物基因組與分子育種實驗室團隊選育。
根據(jù)山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院作物基因組與分子育種實驗室團隊高粱籽粒轉(zhuǎn)錄組數(shù)據(jù),在百邁客云平臺(biocloud.net.cn)獲取表達量,再利用TBtools軟件作出表達量的熱圖。
利用STRING (https://cn.string-db.org/)數(shù)據(jù)庫分析高粱全基因組glutelin 的蛋白互作。
本研究以高粱為研究對象,利用NCBI 數(shù)據(jù)庫下載得到高粱全基因組文件及GFF 注釋文件,結(jié)合高粱各組織的轉(zhuǎn)錄組測序數(shù)據(jù)并通過結(jié)構(gòu)域驗證,最終得到3 個glutelin基因分別為SbGLUA1(Sobic.001G143700編碼11S globulin seed storage protein 2)、SbGLUA2(Sobic.009G017600編碼Glutelin type-A2)、SbGLUB4(Sobic.009G007100編碼glutelin type-B4)。高粱glutelin 中2 個基因家族成員SbGLUA2和SbGLUB4分布在SBI-09染色體上,SbGLUA1位于SBI-01染色體上。3 個基因的氨基酸具體含量、分子質(zhì)量和理化特性等信息如表1、2 所示。
表1 高粱glutelin 蛋白家族成員及理化性質(zhì)Tab.1 glutelin member in sorghum and their physico-chemical properties
由表1 可知,SbGLUA1基因位于SBI-01∶11527023—11528931,編碼氨基酸375 個,分子質(zhì)量為40 068.60 u;SbGLUA2基因位于SBI-09∶1633682—1636453,編碼氨基酸360 個,分子質(zhì)量為37 886.30 u;SbGLUB4基因位于SBI-09∶639510—641454,編碼氨基酸484個,分子質(zhì)量為53 099.81 u;理論等電點為5.60~6.44;不穩(wěn)定系數(shù)分析顯示,所有的高粱glutelin蛋白都是穩(wěn)定的(Instability index<40);蛋白質(zhì)的流動性取決于其脂肪系數(shù),脂肪系數(shù)越大,說明其流動性就越好,SbGLUA1、SbGLUA2、SbGLUB4 蛋白的脂肪系數(shù)都低于90,說明其流動性不強。結(jié)果顯示,除了SbGLUA2 之外,其他蛋白質(zhì)的總平均吸水性均為負值,說明其余蛋白質(zhì)是親水蛋白。
從表2 可以看出,SbGLUA1 和SbGLUA2 相似度高,可達80%,而它們與SbGLUB4 的相似度很低,分別僅為23%、24%。在高粱基因組還有些相似度很低,如Globulin1S(由SORBI_3001G144900編碼)、Cupincin(由SORBI_3001G059800 編碼)、vicilin-like(由SORBI_3001G469300 編碼)。
表2 高粱glutelin 蛋白之間的關(guān)系Tab.2 Relationship between glutelins in sorghum
從圖1 可以看出,上下游非編碼區(qū)域均存在于SbGLUA1、SbGLUA2、SbGLUB4 家族成員上;其中,SbGLUA1、SbGLUA2上、下游的非編碼區(qū)相對較長,而SbGLUB4上較短。CDS 是一種編碼蛋白質(zhì)產(chǎn)物的序列,高粱glutelin基因外顯子數(shù)量集中在3~4 個,SbGLUB4具有4 個外顯子,SbGLUA1、SbGLUA2的外顯子數(shù)量都只有3 個。并且從圖1可以清楚地看到,SbGLUA2是3 個基因中內(nèi)含子最長的。
圖1 glutelin 基因結(jié)構(gòu)Fig.1 glutelin gene structure
蛋白質(zhì)前體的信號肽結(jié)果用C 值表示,成熟蛋白的信號肽用S 值表示。通過分析(圖2、3)可以看出,SbGLUB4 蛋白C 值結(jié)果為第35 位氨基酸(分值約為0.491),S 值結(jié)果是第13 位氨基酸(分值約為0.983),優(yōu)化后的C 值和S 值的最佳結(jié)果用Y 值來表示,高粱glutelin 擬合后的最佳結(jié)果為第35 位氨基酸,得分是0.663,存在信號肽;而SbGLUA2 蛋白、SbGLUA1 蛋白信號肽的剪切位點分值以及綜合剪切位點分值均小于0.5,則表明SbGLUA2 及SbGLUA1 蛋白都不含信號肽,不是分泌性蛋白。SbGLUA1、SbGLUA2、SbGLUB4 蛋白質(zhì)的亞細胞定位預(yù)測顯示,各高粱glutelin 蛋白都位于液泡上,并且僅高粱GLUB4 蛋白具有1 個跨膜結(jié)構(gòu)(表3)。
圖2 SbGLUA1(A)及SbGLUA2(B)信號肽Fig.2 SbGLUA1(A)and SbGLUA2(B)signal peptide
圖3 SbGLUB4 信號肽Fig.3 SbGLUB4 signal peptide
表3 glutelin 蛋白信號肽與亞細胞定位預(yù)測Tab.3 The signal peptide and subcellular localization prediction of glutelin protein
對跨膜結(jié)構(gòu)域進行分析發(fā)現(xiàn)(表3),除SbGLUA1、SbGLUA2 外,SbGLUB4 蛋白跨膜結(jié)構(gòu)域為1 個。從表1 可以看出,編碼SbGLUA1 蛋白的氨基酸數(shù)為375 個,編碼SbGLUA2 蛋白的氨基酸數(shù)為360 個,通過二級結(jié)構(gòu)發(fā)現(xiàn),SbGLUA1 和SbGLUA2 蛋白以延伸鏈和無規(guī)則卷曲為主,在氨基酸中所占的比例在60%以上,而α-螺旋和β-轉(zhuǎn)角的比例很小(表4);編碼SbGLUB4 蛋白的氨基酸數(shù)為484 個,α-螺旋和無規(guī)則卷曲構(gòu)成蛋白質(zhì)中所占比例超過60%,推測它們是SbGLUB4 蛋白跨膜域形成的關(guān)鍵因素。因此可以推斷,SbGLUB4蛋白中,α-螺旋和無規(guī)則卷曲是最主要的結(jié)構(gòu)元素,而延伸鏈和β-轉(zhuǎn)角則是散布于整個蛋白中。
表4 glutelin 蛋白二級結(jié)構(gòu)Tab.4 The secondary structure of glutelin protein %
在此基礎(chǔ)上,進一步對高粱glutelin 基因家族中SbGLUB4 進行了蛋白質(zhì)的跨膜螺旋預(yù)測,生物信息學(xué)分析結(jié)果顯示,SbGLUB4 在膜內(nèi)的區(qū)域為第1—11 位氨基酸,跨膜蛋白區(qū)域為第12—34 位氨基酸,膜外的區(qū)域為第35—484 位氨基酸(圖4)。綜上所述,僅有SbGLUB4 存在跨膜蛋白區(qū)域。
圖4 SbGLUB4 跨膜區(qū)域預(yù)測結(jié)果Fig.4 Prediction results of transmembrane region of SbGLUB4 protein
對高粱glutelin 蛋白的三維結(jié)構(gòu)進行預(yù)測,從圖5 可以看出,3 種高粱glutelin 蛋白均具有特異的類似的結(jié)構(gòu)和特異的功能。其中,SbGLUB4 的分子質(zhì)量更大、結(jié)構(gòu)更復(fù)雜、親水性更強,而且這種螺旋狀的多肽可以形成一些特殊的結(jié)構(gòu)域,起到一定的生物作用,推測SbGLUB4 多肽鏈經(jīng)過多次盤曲后,可形成某些發(fā)揮生物學(xué)功能的特定區(qū)域。
圖5 高粱glutelin 蛋白三級結(jié)構(gòu)預(yù)測Fig.5 Prediction of tertiary structure of glutelin protein in sorghum
通過結(jié)構(gòu)域分析可知,所有g(shù)lutelin 蛋白均含有cupinRmIC-like superfamily 結(jié)構(gòu)域(圖6)。Cupin超家族最初是基于在胚芽素和胚芽樣蛋白中發(fā)現(xiàn)的高度保守的基序。Cupin 超家族成員的活性位點通常位于中心,包括金屬離子。Cupin 超家族成員可分為兩大類:參與細胞壁碳水化合物修飾的單域細菌異構(gòu)酶(例如耐干燥種子儲存球蛋白),以及參與豆科植物根結(jié)瘤的多域核轉(zhuǎn)錄因子。推測,glutelin蛋白可通過與多個不同類別的蛋白質(zhì)相互作用來發(fā)揮其生物學(xué)功能,正是因為Cupin 超家族保守結(jié)構(gòu)域的存在,使得glutelin 蛋白可提升作物品質(zhì)。
圖6 高粱glutelin 蛋白功能結(jié)構(gòu)域Fig.6 Function domain of glutelin protein in sorghum
利用MEME 數(shù)據(jù)庫,對高粱glutelin基因的氨基酸序列進行保守基序分析,結(jié)果發(fā)現(xiàn)(圖7),glutelin基因包含的10 種保守基序命名為Motif 1~Motif 10。在SbGLUB4 蛋白序列中,存在Motif 4、Motif 5、Motif 6、Motif 7 和Motif 10 的缺失,各Motif在glutelin 蛋白家族的排列位置基本一致。因此說明,glutelin基因的基序相對較為保守,推測蛋白質(zhì)基序Motif 1~Motif 10 很可能與glutelin 執(zhí)行儲藏蛋白密切相關(guān)。
圖7 高粱glutelin 蛋白保守基序Fig.7 Conserved motifs of glutelin protein in sorghum
將高粱(S.bicolor)(3個)、水稻(O.sativa)(7個)、小麥(T.aestivum)(7 個)、玉米(Z.mays)(3 個)、谷子(S.italica)(4 個)基因家族共24 個glutelin 蛋白,采用鄰接法構(gòu)建glutelin 蛋白系統(tǒng)進化樹(圖8),不同顏色范圍代表不同亞族,24 個glutelin 蛋白可以分為4 個亞家族。其中,SbGLUA1與SbGLUB4、SbGLUA2與Ta1DL 757719220最先聚類合并,在進化上靠得最近,分別匯聚在同一分支下,且成對出現(xiàn),說明親緣關(guān)系更近。
圖8 高粱與水稻、小麥、玉米和谷子glutelin 系統(tǒng)進化樹分析Fig.8 Phylogenetic tree of glutelin in S. bicolor,O. sativa,T. aestivum,Z. mays,and S. italica
根據(jù)山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院作物基因組與分子育種實驗室團隊高粱籽粒轉(zhuǎn)錄組數(shù)據(jù),繪高粱表達的數(shù)據(jù)構(gòu)造熱圖,從圖9可以看出,SbGLUB4在種子部位的表達量最高,而在其他部位的表達量均較低;SbGLUA1在各組織中的表達量均很低,只有在穗部位的表達量稍高;而SbGLUA2在各組織中的表達水平都比較高。
圖9 高粱3chi3 不同組織中g(shù)lutelin 基因的表達Fig.9 Expression of glutelin genes in different tissues of sorghum 3chi3
高粱不同籽粒發(fā)育期、不同品種中谷蛋白的基因表達如圖10 所示,SbGLUB4、SbGLUA2隨著種子發(fā)育期的推進而逐漸升高;其中,SbGLUB4在IS22204 表達最高,SbGLUA2在1383-2x7050BF4-12R 表達最高,其次是IS22203、IS22204 和Laohanye。
利用STRING 預(yù)測互作蛋白顯示(圖11、表5),SbGLUA2(C5YYX1)平均聚類系數(shù)為9.09;PPI 富集P值為5.51E-14。通過鄰接節(jié)點數(shù)篩選出SORBI_3002G420000(C5X5N6)、SORBI_3004G181500(A0 A1Z5RP56)、SORBI_3003G370300(A0A1W0W0 R8)、SORBI_3003G314900(A0A1W0VZV3)、SOR BI_3005G115500(A0A1B6PRT5)、SORBI_3003G 023200(A0A1B6Q0Y2)、SORBI_3008G010900(A0 A1Z5R4C2)、SORBI_3004G107000(A0A1Z5RMU 4)、SORBI_3003G045200(C5XMS3)、SORBI_300 4G151000(A0A1Z5RNL4)核心蛋白。SbGLUA2蛋白與DNA 解旋酶、重組酶等互作,推測功能發(fā)生變化。SbGLUB4(C5YY38)平均聚類系數(shù)為3.45;PPI 富集P值為0.00 765。通過鄰接節(jié)點數(shù)篩選出SORBI_3001G144900(A0A1Z5S5M9)、SORBI_30 01G059800(A0A1Z5S4J3)、SORBI_3009G186400(C5Z0E2)、SORBI_3003G064200(A0A1W0VVX 4)、SORBI_3007G062200(A0A1B6PFX4)、SORBI_3006G042800(C5YE64)、SORBI_3004G147300(A 0A194YPS5)、SORBI_3001G363200(C5WZK2)、SORBI_3003G185500(C5XN00)、SORBI_3004G1 55400(C5XSL9)核心蛋白。可以看出,SbGLUB4與數(shù)個種子儲藏蛋白結(jié)果基因及調(diào)節(jié)基因(如MYB和bHLH)互作。
圖11 SbGLUs 蛋白互作網(wǎng)絡(luò)Fig.11 Network of SbGLUs proteins interaction
表5 STRING 預(yù)測SbGLUs 的互作Tab.5 SbGLUs interaction predicted by STRING
高粱是一種多用途的糧食、飼草和能源作物,是非洲和部分亞洲國家的主糧作物。除了具有優(yōu)良的農(nóng)藝性狀外,其籽粒中還具有豐富的營養(yǎng)成分,如蛋白質(zhì)、碳水化合物、脂肪、礦物質(zhì)等。其中蛋白質(zhì)含量的變幅為4.4%~21.1%,存在較大遺傳變異。籽粒儲藏蛋白是指儲藏于高粱籽粒中的蛋白質(zhì)組分。它們在細胞外分散于細胞間隙和細胞內(nèi),其存在形式可分為2 類,一類是游離狀態(tài)的可溶性蛋白(如清蛋白),另一類是結(jié)合狀態(tài)的不可溶性蛋白(如球蛋白)。高粱籽粒中的清蛋白占總蛋白質(zhì)含量的80%以上,其所含的清蛋白是小麥中所不具備的,這就造成了高粱與小麥之間在蛋白質(zhì)含量上存在差異。根據(jù)蛋白質(zhì)的可溶性,又將蛋白質(zhì)分為以下幾類:清蛋白、球蛋白、谷蛋白和醇溶蛋白,谷蛋白也作為高粱籽粒中蛋白質(zhì)存儲的主要形式,除本研究的SbGLUA1、SbGLUA2 和SbGLUB4外,還有Globulin1S(由SORBI_3001G144900編碼)、Cupincin(由SORBI_3001G059800 編碼)、vicilinlike(由SORBI_3001G469300 編碼)等[12]。關(guān)于對籽粒蛋白總含量的貢獻,它們是否涉及過敏反應(yīng)等有待進一步研究。
利用基因工程手段對其進行遺傳改良,是當前高粱育種面臨的一個長期課題。籽粒中含有豐富的淀粉、脂肪、蛋白、微量營養(yǎng)元素和酚類抗氧化物質(zhì),但是蛋白中賴氨酸、甲硫氨酸的含量比較低,因此,淀粉和蛋白的可消化性比較差[13-16]。隨著膳食結(jié)構(gòu)調(diào)整和人們對谷物營養(yǎng)需求不斷增加,對高粱食品的開發(fā)和利用顯得尤為重要[17]。目前,對高粱的研究已成為一個熱門話題,但改良其食用性的研究卻是排在第1 位的,而發(fā)掘優(yōu)良品種、選育可食性優(yōu)良的新品種也是一個重要的發(fā)展方向。
山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院作物基因組與分子育種實驗室團隊積累基因組、轉(zhuǎn)錄組、表型組資源,熟練掌握了生物信息分析與分子生物學(xué)實驗技術(shù),解析高粱抗逆和耐瘠性狀形成機制。最近,對高粱DCL、HSF、NRT1、NRT2/3、CLC家族的表達和DNA 變異進行了分析[18-22]。本研究從全基因組水平上對高粱glutelin 蛋白進行分析。前人對高粱谷蛋白研究較少,認為高粱不含麥谷蛋白,是緩解麥谷蛋白導(dǎo)致腸糜病的理想谷物[23]。本研究表明,高粱glutelin基因在種子表達有待用Western 雜交研究在高粱籽粒中蛋白的積累。
高粱谷蛋白依據(jù)山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院作物基因組與分子育種實驗室團隊高粱籽粒轉(zhuǎn)錄組數(shù)據(jù),熱圖顯示,SbGLUA1在高粱3chi3 各組織中的表達量都不是很高,SbGLUA2則是在根和種子中較SbGLUA1均高表達,而SbGLUB4在高粱3chi3 不同組織中只有一個部位表達較高,其余部位表達均低,但是在不同高粱品種的各個部位表達都高。本研究鑒定出3 個高粱glutelin基因家族成員,分析其基因表達為glutelin基因家族的克隆及功能,進一步解析和提高作物食用品質(zhì)研究創(chuàng)造了條件,且蛋白含量決定了高粱面筋蛋白品質(zhì),對決定高粱加工品質(zhì)好壞起重要作用,極大地影響了高粱籽粒最終用途性狀[24-26]。隨著分子生物學(xué)和基因組學(xué)研究發(fā)展,挖掘高粱加工品質(zhì)相關(guān)的優(yōu)異基因,解析其作用機制,對進一步提升高粱品質(zhì)具有重要意義[27]。
在未來的研究中,應(yīng)繼續(xù)研究蛋白質(zhì)的組學(xué)分析、性能分析和域分析,以及谷物中麥谷蛋白形成及影響。通過對谷蛋白進行分析,了解其進化過程中谷蛋白的作用和功能,預(yù)測出基因內(nèi)的各種性質(zhì),從而觀察谷蛋白的存在以及含量的高低對高粱的使用價值的影響。