黃 娟,鄧 嬌,石桃雄,梁成剛,張啟迪,陳慶富
(貴州師范大學(xué) 蕎麥產(chǎn)業(yè)技術(shù)研究中心,貴州 貴陽(yáng) 550001)
蕎麥3個(gè)種子蛋白基因的序列和表達(dá)分析
黃 娟,鄧 嬌,石桃雄,梁成剛,張啟迪,陳慶富
(貴州師范大學(xué) 蕎麥產(chǎn)業(yè)技術(shù)研究中心,貴州 貴陽(yáng) 550001)
【目的】闡明蕎麥Fagopyrum中3個(gè)種子蛋白基因序列的特征及其在種子發(fā)育過程中的作用,為探討蕎麥種子發(fā)育過程分子機(jī)制提供理論依據(jù)?!痉椒ā坷帽镜豍erl程序、BLASTP、MEGA6、PLANTCARE等,分析了蕎麥3個(gè)種子蛋白基因(13S球蛋白基因、11S球蛋白基因和谷蛋白基因)序列及其編碼蛋白質(zhì)的進(jìn)化關(guān)系,預(yù)測(cè)啟動(dòng)子區(qū)域的順式作用元件。通過熒光定量PCR技術(shù)分析3個(gè)基因在甜蕎F.esculentum、苦蕎F.tataricum和金蕎F.cymosum種子發(fā)育過程中的表達(dá)情況?!窘Y(jié)果】13S球蛋白基因含有4個(gè)外顯子和3個(gè)內(nèi)含子,蛋白序列長(zhǎng)515 aa,與苦蕎中的一個(gè)13S球蛋白(GeneBank登錄號(hào):ABI32184.1)僅有6個(gè)氨基酸不同,推測(cè)二者為同一個(gè)基因,在苦蕎灌漿中期表達(dá)量最高;11S球蛋白基因含有8個(gè)外顯子和7個(gè)內(nèi)含子,蛋白序列長(zhǎng)914 aa,與歐洲慈姑中的一個(gè)11S球蛋白(GeneBank登錄號(hào):ABB77213.1)親緣關(guān)系最近,在苦蕎灌漿中期表達(dá)量最高;谷蛋白基因含有3個(gè)外顯子和2個(gè)內(nèi)含子,蛋白序列長(zhǎng)355 aa,與甜菜中的一個(gè)B5型谷蛋白(GeneBank登錄號(hào):XP_010683769.1)親緣關(guān)系最近,在甜蕎灌漿中期表達(dá)量最高。3個(gè)基因的啟動(dòng)子區(qū)域均含有大量響應(yīng)逆境和激素的順式作用元件,以及在胚乳中表達(dá)所需的順式作用元件?!窘Y(jié)論】本研究獲得了1個(gè)13S球蛋白基因序列、1個(gè)11S球蛋白基因序列和1個(gè)谷蛋白基因序列,這3個(gè)基因可能在胚乳中優(yōu)勢(shì)表達(dá),并且參與到逆境脅迫和激素響應(yīng)的過程中;灌漿中期是種子蛋白積累的關(guān)鍵時(shí)期,3個(gè)基因均在這一時(shí)期大量表達(dá),這為后續(xù)進(jìn)一步研究基因功能奠定了基礎(chǔ)。
蕎麥; 種子蛋白; 灌漿期; 基因表達(dá)
蕎麥屬于蓼科蕎麥屬Fagopyrum1年生雙子葉草本植物,是國(guó)際糧農(nóng)組織公認(rèn)的藥食兼用糧種。中國(guó)是蕎麥種植面積最大、產(chǎn)量最高的國(guó)家[1],且主要分布在西部貧困山區(qū),成為這些地區(qū)的主要雜糧和經(jīng)濟(jì)作物[2]。種子是蕎麥的主要食用部分,蕎麥種子中不僅富含人體所必需的蛋白質(zhì)、淀粉、脂肪等大量元素,還含有豐富的膳食纖維、維生素、礦物質(zhì)等微量元素,以及禾本科糧食作物所不具備的黃酮、類黃酮等重要的次生代謝物[3],具有降三高、抗腫瘤、抗氧化、抗疲勞、增強(qiáng)免疫力等功效[4]。蛋白質(zhì)是蕎麥成熟種子中的重要組成物質(zhì)之一,蕎麥籽粒富含中、低分子量蛋白質(zhì),缺乏高分子量蛋白質(zhì)組分[5]。蕎麥種子蛋白質(zhì)質(zhì)量分?jǐn)?shù)(w)平均為12.89%,不同種間差異很大:大粒組野生蕎麥為14.92%、大粒組栽培蕎麥為12.52%、小粒組蕎麥為10.39%[3, 6-7]。按照蛋白溶解度的不同,蕎麥中種子蛋白的成分可以分為清蛋白、球蛋白、醇溶蛋白和谷蛋白4類,其中清蛋白的含量最高,占蕎麥種子蛋白總含量的71.4%;球蛋白和谷蛋白次之,均占9.1%;醇溶蛋白的含量最少,占蕎麥種子蛋白總含量的7.4%[8]。
對(duì)蕎麥種子蛋白相關(guān)編碼基因進(jìn)行研究,有助于從分子水平上了解種子蛋白合成機(jī)制。灌漿期是種子營(yíng)養(yǎng)物質(zhì)積累的主要時(shí)期,研究該時(shí)期相關(guān)基因的表達(dá)情況對(duì)于鑒定蕎麥中種子蛋白基因具有重要意義。通過對(duì)蕎麥灌漿期種子全長(zhǎng)cDNA文庫(kù)的篩選和分析,共獲得了1 106個(gè)有效EST序列,這些序列主要參與抗病、儲(chǔ)藏蛋白等[9]。通過篩選基因組文庫(kù),獲得了17個(gè)13S 球蛋白基因[10]。本課題組前期完成了蕎麥種子的轉(zhuǎn)錄組學(xué)分析(SRA登錄號(hào):DRP001013),從中鑒定到了3個(gè)表達(dá)水平較高的種子蛋白基因[13S 球蛋白(13S Globulin)基因、11S球蛋白(11S Globulin)基因和谷蛋白(Glutelin)基因],并獲得這3個(gè)基因的全長(zhǎng)、氨基酸序列和基因組序列。本研究通過生物信息學(xué)方法對(duì)這3個(gè)基因的結(jié)構(gòu)、進(jìn)化關(guān)系以及基因上游1 500 bp啟動(dòng)子進(jìn)行了分析,并分析了3個(gè)基因在蕎麥種子灌漿期的表達(dá)情況,為探討蕎麥種子發(fā)育過程分子機(jī)制提供理論依據(jù),也為改善蕎麥種子蛋白含量和組分提供了優(yōu)異基因資源。
1.1 種子蛋白基因序列的獲取和生物信息學(xué)分析
從本課題組測(cè)序的蕎麥基因組數(shù)據(jù)中獲得3個(gè)基因(13S球蛋白基因、11S球蛋白基因和谷蛋白基因)的編碼序列、氨基酸序列和基因組序列,利用NCBI中BLASTP對(duì)其進(jìn)行注釋,利用在線EXPASY (http://web.expasy.org/compute_pi/)預(yù)測(cè)蛋白的等電點(diǎn)和相對(duì)分子質(zhì)量;利用GSGD2.0(http://gsds.cbi.pku.edu.cn/)預(yù)測(cè)基因結(jié)構(gòu);13S球蛋白、11S球蛋白和谷蛋白的同源序列從NCBI中獲得,用MEGA6 構(gòu)建系統(tǒng)進(jìn)化樹。根據(jù)基因組注釋文件的位置信息,利用本地Perl程序從基因組中調(diào)取基因上游1 500 bp啟動(dòng)子序列,用 PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預(yù)測(cè)啟動(dòng)子區(qū)域的順式作用元件。
1.2 材料種植和取樣
選擇甜蕎F.esculentum、苦蕎F.tataricum和金蕎F.cymosum代表品種各1份,即豐甜1號(hào)、米苦蕎104和紅心金蕎,均種植于貴州師范大學(xué)蕎麥產(chǎn)業(yè)技術(shù)研究中心試驗(yàn)基地,常規(guī)大田管理,分別于授粉后第5天(灌漿前期)、第10天(灌漿中期)和第20天(灌漿末期)取樣,取回的樣品在冰上剝殼,剔除差異較大的種子,嚴(yán)格控制種子的大小和時(shí)期,所有的樣品保存于-80 ℃冰箱備用。
1.3 實(shí)時(shí)熒光定量PCR(qRT-PCR)
RNA 提取采用 Plus 植物總RNA提取試劑盒(天根生化科技有限公司, 北京),具體操作按照說明書進(jìn)行。用Nanodrop 2000微量紫外分光光度計(jì)檢測(cè)RNA 濃度及質(zhì)量,用 10 g·L-1的瓊脂糖凝膠電泳檢測(cè)RNA的完整性。按照PrimeScriptTMRT Reagent Kit (Perfect Real Time)(寶生物工程有限公司, 大連)說明書反轉(zhuǎn)錄合成cDNA。
利用 Primer Premier 6.0軟件,設(shè)計(jì)qRT-PCR引物。引物設(shè)計(jì)標(biāo)準(zhǔn)是:擴(kuò)增長(zhǎng)度50~250 bp,溫度(60±2) ℃,引物長(zhǎng)度 20~22 bp,GC 質(zhì)量分?jǐn)?shù) 45%~55%[11]。13S 球蛋白基因的上下游引物分別為5′-ACGCCATAACCAGTCCGATTGC-3′、5′-AAAC-GCTTCCTCGCCTTCTCCT-3′; 11S 球蛋白基因的上下游引物分別為5′-ACAGTGTGCTGGTGTTGCCTTC-3′、5′-TGGTGTTCATCCTGGAACTCGC-3′;谷蛋白基因的上下游引物分別為5′-GCATGGCATGGCTCTCAA-CTGT-3′、5′-GCACCAAGTCCAACCTCACCAA-3′。以蕎麥Actin基因?yàn)閮?nèi)參(GenBank登錄號(hào):HQ398855.1),上下游引物分別為5′-ACCTTGCTGGAC-GTGACCTTAC-3′、5′-CCATCAGGAAGCTCATAGTTC-3′。
qRT-PCR的反應(yīng)體系和程序按照SYBR? Premix ExTaqTM(Tli RNaseH Plus, 寶生物工程有限公司, 大連)說明書進(jìn)行,相對(duì)表達(dá)量用 2- ΔΔCt計(jì)算[12],數(shù)據(jù)統(tǒng)計(jì)和作圖使用 Originlab 公司的Origin8.0進(jìn)行(http://www.originlab.com/)。
2.1 種子蛋白基因的序列分析
2.1.1 13S球蛋白基因 核酸序列長(zhǎng)1 548 bp?;蚪Y(jié)構(gòu)分析(圖1)表明,該基因含有4個(gè)外顯子(分別為334、284、510、420 bp)和3個(gè)內(nèi)含子(分別為109、80、143 bp)。編碼的蛋白序列全長(zhǎng)515 aa,蛋白的等電點(diǎn)為5.69,相對(duì)分子質(zhì)量為58 330(表1)。將其與GenBank中蕎麥和其他物種中的13S球蛋白構(gòu)建進(jìn)化樹,結(jié)果(圖2)表明:13S球蛋白與苦蕎中已報(bào)道的一個(gè)13S球蛋白(又名過敏蛋白,GenBank登錄號(hào):ABI32184.1)的親緣關(guān)系最近,僅有6個(gè)氨基酸的不同(相似性98%),推測(cè)二者為同一個(gè)基因;蕎麥屬甜蕎和苦蕎中20個(gè)13S球蛋白聚在一起,它們的親緣關(guān)系較其他物種中的13S球蛋白更近;甜菜Betavulgaris、胡楊Populuseuphratica和煙草Nicotianasylvestris中的13S球蛋白聚為一類。
圖中藍(lán)色箭頭表示外顯子,紅色線條表示內(nèi)含子。
2.1.2 11S球蛋白基因 核酸序列長(zhǎng)2 745 bp。基因結(jié)構(gòu)分析(圖1)表明,該基因含有8個(gè)外顯子(分別為95、148、249、85、390、251、1 191、336 bp)和7個(gè)內(nèi)含子(分別為79、100、582、132、612、119、337 bp)。編碼的蛋白序列全長(zhǎng)914 aa,蛋白的等電點(diǎn)為5.87,相對(duì)分子質(zhì)量為103 350(表1)。將其與GenBank中其他物種中的11S球蛋白構(gòu)建進(jìn)化樹,結(jié)果(圖3)表明:本研究中的11S球蛋白與歐洲慈姑Sagittariasagittifolia(GenBank登錄號(hào):CAA70334.1)和獼猴桃Actinidiachinensi(GenBank登錄號(hào):ABB77213.1)中的11S球蛋白親緣關(guān)系最近(相似性45%)。
2.1.3 谷蛋白基因 核酸序列長(zhǎng)1 068 bp。基因結(jié)構(gòu)分析(圖1)表明,該基因含有3個(gè)外顯子(分別為196、721、151 bp)和2個(gè)內(nèi)含子(分別為623、82 bp)。編碼的蛋白序列全長(zhǎng)355 aa,蛋白的等電點(diǎn)為6.45,相對(duì)分子質(zhì)量為37 890(表1)。將其與GenBank中其他物種中的谷蛋白構(gòu)建進(jìn)化樹(圖4),結(jié)果表明:蕎麥谷蛋白與甜菜Betavulgaris中B5型谷蛋白親緣關(guān)系最近(GenBank登錄號(hào):XP_010683769.1,相似性81%);蕎麥、甜菜和擬南芥Arabidopsislyrata3個(gè)物種中的谷蛋白聚為一類,其他物種中谷蛋白聚為一類。
表1 3個(gè)種子蛋白基因的基本信息統(tǒng)計(jì)
Tab.1 Information of three seed protein genes
基因核酸長(zhǎng)度/bp蛋白長(zhǎng)度/aa等電點(diǎn)相對(duì)分子質(zhì)量13S球蛋白基因15485155.695833011S球蛋白基因27459145.87103350谷蛋白基因10683556.4537890
圖2 13S球蛋白基因編碼蛋白質(zhì)的進(jìn)化關(guān)系
Fig.2 Evolutionary relationship of the protein sequences encoded by 13S globulin gene
圖3 11S球蛋白基因編碼蛋白質(zhì)的進(jìn)化關(guān)系Fig.3 Evolutionary relationship of the protein sequences encoded by 11S globulin gene
圖4 谷蛋白基因編碼蛋白質(zhì)的進(jìn)化關(guān)系Fig.4 Evolutionary relationship of the protein sequences encoded by glutelin gene
2.2 種子蛋白基因啟動(dòng)子序列的分析
2.2.1 13S球蛋白基因啟動(dòng)子 13S球蛋白基因啟動(dòng)子區(qū)域的順式作用元件列于表2。13S球蛋白基因的ATG上游含有21個(gè)真核生物轉(zhuǎn)錄起始所必需的TATA框[13]和5個(gè)控制轉(zhuǎn)錄頻率的CAAT框[14];在其ATG上游1 500 bp內(nèi)含有5個(gè)響應(yīng)生物和非生物脅迫的順式作用元件,即4個(gè)厭氧響應(yīng)元件(ARE)[14]和1個(gè)真菌激發(fā)元件(Box-W1)[15],表明該基因可能響應(yīng)低氧環(huán)境和受真菌誘導(dǎo);13S球蛋白基因啟動(dòng)子區(qū)含有10個(gè)響應(yīng)激素的元件,即4個(gè)脫落酸響應(yīng)元件(3個(gè)ABRE和1個(gè)CE1)[13, 16],4個(gè)茉莉酸甲酯響應(yīng)元件(2個(gè)CGTCA-motif和2個(gè)TGACG-motif)[17],2個(gè)水楊酸響應(yīng)元件(TCA-element)[18],表明該基因可能對(duì)脫落酸、茉莉酸甲酯和水楊酸3類激素有響應(yīng);13S球蛋白基因啟動(dòng)子區(qū)含有一個(gè)MYB轉(zhuǎn)錄因子的結(jié)合位點(diǎn)(MBS)[19],表明MYB轉(zhuǎn)錄因子可能能夠結(jié)合在該基因的啟動(dòng)子區(qū)域,誘導(dǎo)它的表達(dá);此外,還含有6個(gè)胚乳表達(dá)所需要的順式作用元件(Skn-1_motif)[20],表明該基因可能在胚乳中優(yōu)勢(shì)表達(dá)。
表2 13S球蛋白基因和11S球蛋白基因的啟動(dòng)子分析
Tab.2 Promoter analysis of the 13S globulin gene and 11S globulin gene
基因順式作用元件數(shù)量序列功能 13S球蛋白基因TATA?box21TATAAA轉(zhuǎn)錄起始必需元件[13]CAAT?box5CAAT轉(zhuǎn)錄增強(qiáng)元件[14]ARE4TGGTTT厭氧誘導(dǎo)元件[14]Box?W11TTGACC響應(yīng)真菌誘導(dǎo)[15]ABRE3TACGTG響應(yīng)脫落酸[13]CE11TGCCACCGG響應(yīng)脫落酸[16]CGTCA?motif2CGTCA響應(yīng)茉莉酸甲酯[17]TGACG?motif2TGACG響應(yīng)茉莉酸甲酯[17]TCA?element2GAGAAGAATA響應(yīng)水楊酸[18]MBS1CGGTCAMYB結(jié)合位點(diǎn)[19]Skn?1_motif6GTCAT胚乳表達(dá)調(diào)控元件[20]11S球蛋白基因TATA?box2TATAA轉(zhuǎn)錄起始必需元件[13]CAAT?box8CCAAT轉(zhuǎn)錄增強(qiáng)元件[14]WUN?motif1TCATTACGAA傷害響應(yīng)元件[18]HSE1CNNGAANNTTCNNG高溫響應(yīng)元件[21]LTR2CCGAAA低溫響應(yīng)元件[22]TC?richrepeats1ATTTTCTTCA響應(yīng)防御和脅迫[23]ABRE1TACGTG響應(yīng)脫落酸[13]CGTCA?motif1CGTCA響應(yīng)茉莉酸甲酯[17]TGACG?motif1TGACG響應(yīng)茉莉酸甲酯[17]TCA?element2GAGAAGAATA響應(yīng)水楊酸[18]TGA?element2AACGAC響應(yīng)生長(zhǎng)素[18]Skn?1_motif3GTCAT胚乳表達(dá)調(diào)控元件[20]
2.2.2 11S球蛋白基因啟動(dòng)子 11S球蛋白基因啟動(dòng)子區(qū)域的順式作用元件列于表2。11S球蛋白基因的ATG上游含有2個(gè)真核生物轉(zhuǎn)錄起始所必需的TATA框[13]和8個(gè)控制轉(zhuǎn)錄頻率的CAAT框[14];在其ATG上游1 500 bp內(nèi)含有5個(gè)響應(yīng)非生物脅迫的順式作用元件,即1個(gè)傷害響應(yīng)元件(WUN-motif)[18]、1個(gè)熱脅迫響應(yīng)元件(HSE)[21]、2個(gè)低溫響應(yīng)元件(LTR)[22]和1個(gè)防御和脅迫響應(yīng)元件(TC-rich repeat)[23],表明該基因可能對(duì)傷害、高溫、低溫等非生物脅迫有響應(yīng);11S球蛋白基因啟動(dòng)子區(qū)含有7個(gè)響應(yīng)激素的元件,即1個(gè)脫落酸響應(yīng)元件(ABRE)[13]、2個(gè)茉莉酸甲酯響應(yīng)元件(1個(gè)CGTCA-motif和1個(gè)TGACG-motif)[17]、2個(gè)水楊酸響應(yīng)元件(TCA-element)[18]和2個(gè)生長(zhǎng)素響應(yīng)元件(TGA-element)[18],表明該基因可能對(duì)脫落酸、茉莉酸甲酯、水楊酸和生長(zhǎng)素4類激素有響應(yīng);此外,還含有3個(gè)胚乳表達(dá)所需要的順式作用元件(Skn-1_motif)[20],表明該基因可能在胚乳中表達(dá)。
2.2.3 谷蛋白基因啟動(dòng)子 谷蛋白基因啟動(dòng)子區(qū)域的順式作用元件列于表3。谷蛋白基因的ATG上游含有38個(gè)真核生物轉(zhuǎn)錄起始所必需的TATA框[13]和10個(gè)控制轉(zhuǎn)錄頻率的CAAT框[14]; 在其ATG上游1 500 bp內(nèi)含有3個(gè)響應(yīng)非生物脅迫的順式作用元件,即1個(gè)熱脅迫響應(yīng)元件HSE[21]和2個(gè)防御和脅迫響應(yīng)元件(TC-rich repeat)[23],表明該基因可能對(duì)高溫等非生物學(xué)脅迫有響應(yīng);11S球蛋白基因啟動(dòng)子區(qū)含有8個(gè)響應(yīng)激素的元件,即2個(gè)脫落酸響應(yīng)元件(ABRE)[13]、2個(gè)茉莉酸甲酯響應(yīng)元件(1個(gè)CGTCA-motif和1個(gè)TGACG-motif)[17]、2個(gè)乙烯響應(yīng)元件(ERE)[24]和1個(gè)赤霉素響應(yīng)元件(GARE-motif)[18],1個(gè)水楊酸響應(yīng)元件(TCA-element)[18],表明該基因可能對(duì)脫落酸、茉莉酸甲酯、乙烯、赤霉素和水楊酸等5類激素有響應(yīng);谷蛋白基因啟動(dòng)子區(qū)含有1個(gè)參與黃酮合成的MYB轉(zhuǎn)錄因子結(jié)合位點(diǎn)(MBSII)[25],表明這一類的MYB轉(zhuǎn)錄因子可能能夠結(jié)合到該基因啟動(dòng)子區(qū)域,誘導(dǎo)它表達(dá)。此外,還含有2個(gè)胚乳表達(dá)所需的順式作用元件(1個(gè)Skn-1_motif和1個(gè)GCN4_motif)[20, 26],表明該基因可能在胚乳中表達(dá)。
表3 谷蛋白基因的啟動(dòng)子分析
Tab.3 Promoter analysis of the glutelin gene
順式作用元件數(shù)量序列 功能TATA?box38TATAA轉(zhuǎn)錄起始必需元件[13]CAAT?box10CAAAT轉(zhuǎn)錄增強(qiáng)元件[14]TC?richrepeats2ATTTTCTCCA響應(yīng)防御和脅迫[23]HSE1AAAAAATTTC高溫響應(yīng)元件[21]ABRE2GACACGTGGC響應(yīng)脫落酸[13]CGTCA?motif1CGTCA響應(yīng)茉莉酸甲酯[17]TGACG?motif1TGACG響應(yīng)茉莉酸甲酯[17]ERE2ATTTCAAA響應(yīng)乙烯[24]GARE?motif1TCTGTTG響應(yīng)赤霉素[18]TCA?element1CCATCTTTTT響應(yīng)水楊酸[18]MBSII1AAAAGTTAGTTA參與黃酮合成的MYB結(jié)合位點(diǎn)[25]GCN4_motif1TGTGTCA胚乳表達(dá)調(diào)控元件[26]Skn?1_motif1GTCAT胚乳表達(dá)調(diào)控元件[20]
2.3 種子蛋白基因在蕎麥種子發(fā)育過程中的表達(dá)
3個(gè)種子蛋白基因在甜蕎、苦蕎和金蕎種子不同發(fā)育時(shí)期的表達(dá)情況如圖5所示: 1)13S球蛋白基因在苦蕎中的表達(dá)量最高,在金蕎中次之,在甜蕎中最低;在甜蕎種子發(fā)育過程中,該基因的表達(dá)沒有明顯的變化,表明該基因在這一過程不起主要作用;在苦蕎種子發(fā)育過程中,該基因在灌漿前期表達(dá)量較低,然后逐漸升高,到灌漿中期表達(dá)量最高,隨后逐漸降低,表現(xiàn)出低-高-次高的規(guī)律;在金蕎種子發(fā)育過程中,該基因的表達(dá)隨著種子灌漿過程逐漸升高,表現(xiàn)出遞增的規(guī)律(圖5A)。2)11S球蛋白基因在苦蕎中表達(dá)量最高,在甜蕎中次之,在金蕎中最低;在甜蕎種子發(fā)育過程中,該基因在灌漿前期和中期無明顯表達(dá),在灌漿末期大量表達(dá),表現(xiàn)出低-低-高的規(guī)律;在苦蕎種子發(fā)育過程中,該基因在灌漿前期低豐度表達(dá),然后逐漸升高,到灌漿中期表達(dá)量最高,隨后逐漸降低,表現(xiàn)出低-高-次高的規(guī)律;在金蕎種子發(fā)育過程中,該基因的表達(dá)沒有明顯的變化,表明該基因在這一過程中不起主要作用(圖5B)。3)谷蛋白基因在甜蕎中的表達(dá)量最高,在苦蕎中次之,在金蕎中最低;在甜蕎種子發(fā)育過程中,該基因在灌漿前期有一定的表達(dá),隨灌漿進(jìn)程表達(dá)量逐漸升高,在灌漿中期最高,隨后快速下降,在灌漿末期表達(dá)量最低,表現(xiàn)出中-高-低的規(guī)律;在苦蕎種子發(fā)育過程中,該基因的表達(dá)與在甜蕎種子發(fā)育過程中一致,也表現(xiàn)出中-高-低的規(guī)律;在金蕎種子發(fā)育過程中,該基因在灌漿前期的表達(dá)量最高,隨后逐漸降低,表現(xiàn)出遞減的規(guī)律(圖5C)。
*表示相同時(shí)間與甜蕎種子相比,差異達(dá)到極顯著水平(P<0.01,Bonferroni法)。
蛋白質(zhì)是蕎麥種子中的重要營(yíng)養(yǎng)物質(zhì)之一,按照蛋白溶解度的不同,蕎麥中種子蛋白的成分可以分為清蛋白、球蛋白、醇溶蛋白和谷蛋白4類。目前蕎麥中球蛋白的編碼基因已經(jīng)鑒定了19個(gè),均為13S球蛋白基因(18個(gè)來自甜蕎、1個(gè)來自苦蕎)[10, 27]。本研究獲得的球蛋白基因與苦蕎中已報(bào)道的一個(gè)球蛋白基因(GenBank登錄號(hào):ABI32184.1)十分相似,在氨基酸水平上僅有6個(gè)氨基酸的不同,推測(cè)二者為同一個(gè)基因;將ABI32184.1在細(xì)菌中表達(dá),重組蛋白的大小為65 400,通過EXPASY對(duì)本研究中獲得的13S球蛋白進(jìn)行預(yù)測(cè),其相對(duì)分子質(zhì)量為58 330,二者差異較小,說明通過EXPASY預(yù)測(cè)的蛋白相對(duì)分子質(zhì)量比較可靠,具有一定的參考價(jià)值[27]。蕎麥中11S球蛋白、清蛋白、醇溶蛋白和谷蛋白的編碼基因目前鮮見報(bào)道,本研究獲得了1個(gè)11S球蛋白和1個(gè)谷蛋白的基因序列,這為后續(xù)進(jìn)一步研究基因功能奠定了基礎(chǔ)。
通過對(duì)3個(gè)種子蛋白基因上游啟動(dòng)子序列的分析,挖掘了許多響應(yīng)脅迫和激素及胚乳表達(dá)所必需的順式作用元件。植物的生長(zhǎng)發(fā)育除了遺傳調(diào)控外,還會(huì)受到環(huán)境的干擾,惡劣環(huán)境會(huì)對(duì)植物的生長(zhǎng)發(fā)育產(chǎn)生不良影響,如高溫、凍害、損傷、缺氧、病原菌侵染等[28]。植物為了避免環(huán)境因素導(dǎo)致的不良影響,會(huì)誘導(dǎo)相關(guān)基因的大量表達(dá),來抵制或消除這些不良環(huán)境造成的弊端,維持植物正常的生長(zhǎng)發(fā)育[29]。3個(gè)種子蛋白基因的啟動(dòng)子區(qū)域都有響應(yīng)脅迫的順式作用元件,表明這3個(gè)基因可能在蕎麥種子灌漿過程中參與到對(duì)各種脅迫的響應(yīng)中,從而維持種子正常的生長(zhǎng)發(fā)育過程。植物激素的作用主要有2個(gè):一個(gè)是響應(yīng)植物的逆境脅迫;另一個(gè)是植物某一生長(zhǎng)發(fā)育過程所必需[30]。茉莉酸甲酯主要參與植物的抗逆和衰老過程,水楊酸主要參與植物的抗逆過程,脫落酸主要參與植物的干旱脅迫和種子萌發(fā)過程,生長(zhǎng)素主要促進(jìn)植物的生長(zhǎng)發(fā)育,乙烯促進(jìn)植物的衰老和成熟,赤霉素則促進(jìn)植物的生長(zhǎng)發(fā)育及開花過程[31]。在本研究3個(gè)種子蛋白基因的啟動(dòng)子中發(fā)現(xiàn)了這幾類激素的響應(yīng)元件,表明這些基因可能是這些激素作用的下游信號(hào)途徑中的一員,與蕎麥種子發(fā)育過程中對(duì)逆境的響應(yīng)、營(yíng)養(yǎng)物質(zhì)的積累和種子成熟有關(guān)。水稻種子中的蛋白質(zhì)主要積累在胚乳外周區(qū)域[32],本研究的3個(gè)種子蛋白基因的啟動(dòng)子區(qū)域都含有胚乳表達(dá)所需的順式作用元件(Skn-1_motif和GCN4_motif),這表明蕎麥種子中蛋白質(zhì)的積累部位可能和水稻相似,也在胚乳中。
在甜蕎、苦蕎和金蕎種子發(fā)育過程中,這3個(gè)基因表達(dá)較高的時(shí)期均集中在灌漿中期,說明灌漿中期是種子蛋白積累的關(guān)鍵時(shí)期,這一發(fā)現(xiàn)與水稻中的結(jié)論一致[32]。3個(gè)基因在不同材料中的表達(dá)水平不一致,13S球蛋白基因在苦蕎和金蕎中表達(dá)量較高,11S球蛋白基因在甜蕎和苦蕎中表達(dá)量較高,谷蛋白基因則在3個(gè)材料中均有較高水平的表達(dá),這說明不同材料中相關(guān)蛋白的編碼基因并不是一致的,這些基因可能存在一定的冗余,當(dāng)一個(gè)編碼基因不表達(dá)時(shí),則由其同源基因來代替它完成功能,從而完成種子的發(fā)育過程。
[1] 林汝法,周小理,任貴興,等. 中國(guó)蕎麥的生產(chǎn)與貿(mào)易、營(yíng)養(yǎng)與食品[J]. 食品科學(xué),2005,26(1): 259-263.
[2] 向達(dá)兵,彭鐮心,趙鋼,等. 蕎麥栽培研究進(jìn)展[J]. 作物雜志,2013(3): 1-6.
[3] GUO X, YAO H. Fractionation and characterization of tartary buckwheat flour proteins[J]. Food Chem,2006, 98(1): 90-94.
[4] 清源. 苦蕎的價(jià)值及開發(fā)利用現(xiàn)狀[J]. 南方農(nóng)業(yè),2014,18(27): 131-133.
[5] 朱新產(chǎn),王寶維,魏益民. 蕎麥種子蛋白組分差異研究[J]. 種子,2000(6): 9-10.
[6] 郭玉珍,陳慶富,楊蘭英,等. 栽培及野生蕎麥資源的種子蛋白質(zhì)含量研究[C]//林汝法,池田清和. 苦蕎產(chǎn)業(yè)經(jīng)濟(jì)國(guó)際論壇論文集.太原:山西省食品科學(xué)學(xué)會(huì),2006.
[7] 王燕,陳慶富. 甜蕎、苦蕎和大野蕎的高分子量種子蛋白亞基研究[J]. 安徽農(nóng)業(yè)科學(xué),2010,38(33): 18678-18680.
[8] 劉擁海,俞樂,肖迪. 蕎麥種子蛋白質(zhì)組分分析[J]. 種子,2006,25(12): 31-33.
[9] 賈鵬. 苦蕎種子灌漿期cDNA文庫(kù)的篩選與分析[D]. 楊凌:西北農(nóng)林科技大學(xué), 2012.
[10]SANO M, NAKAGAWA M, OISHI A, et al. Diversification of 13S globulins, allergenic seed storage proteins of common buckwheat[J]. Food Chem,2014, 155(11): 192-198.
[11]ARTICO S, NARDELI S M, BRILHANTE O, et al. Identification and evaluation of new reference genes inGossypiumhirsutumfor accurate normalization of real-time quantitative RT-PCR data[J]. BMC Plant Biol,2010, 10(1): 1-12.
[12]LIVAK K J, SCHMITTGEN T D. Analysis of relative gene expression data using real-time quantitative PCR and the 2(-Delta Delta C(T)) method[J]. Methods,2001, 25(4): 402-408.
[13]YAMAGUCHI-SHINOZAKI K, SHINOZAKI K.ArabidopsisDNA encoding two desiccation-responsiverd29 genes[J]. Plant Physiol,1993, 101(3): 1119-1120.
[14]VAUTERIN M, FRANKARD V, JACOBS M. TheArabidopsisthalianadhdpsgene encoding dihydrodipicolinate synthase, key enzyme of lysine biosynthesis, is expressed in a cell-specific manner[J]. Plant Mol Biol,1999, 39(4): 695-708.
[15]RUSHTON P J, TORRES J T, PARNISKE M, et al. Interaction of elicitor-induced DNA-binding proteins with elicitor response elements in the promoters of parsleyPR1 genes[J]. EMBO J,1996, 15(20): 5690-5700.
[16]SHEN Q, UKNES S J, HO T H. Hormone response complex in a novel abscisic acid and cycloheximide-inducible barley gene[J]. J Biol Chem,1993, 268(31): 23652-23660.
[17]ROUSTER J, LEAH R, MUNDY J, et al. Identification of a methyl jasmonate-responsive region in the promoter of a lipoxygenase 1 gene expressed in barley grain[J]. Plant J,1997, 11(3): 513-523.
[18]PASTUGLIA M, ROBY D, DUMAS C, et al. Rapid induction by wounding and bacterial infection of anSgene family receptor-like kinase gene inBrassicaoleracea[J]. Plant Cell,1997, 9(1): 49-60.
[19]NASH J, LUEHRSEN K R, WALBOT V.Bronze-2 gene of maize: Reconstruction of a wild-type allele and analysis of transcription and splicing[J]. Plant Cell,1990, 2(11): 1039-1049.
[20]ADACHI M, KANAMORI J, MASUDA T, et al. Crystal structure of soybean 11S globulin: glycinin A3B4 homohexamer[J]. Proc Natl Acad Sci USA,2003, 100(12): 7395-7400.
[21]SUN S W, CHUNG M C, LIN T Y. The structure and expression of anhsc70 gene fromLycopersiconesculentum[J]. Gene,1996, 170(2): 237-241.
[22]WHITE A J, DUNN M A, BROWN K, et al. Comparative analysis of genomic sequence and expression of a lipid transfer protein gene family in winter barley[J]. J Exp Bot,1994, 45 (12): 1885-1892.
[23]DIAZ-DE-LEON F, KLOTZ K L, LAGRIMINI L M. Nucleotide sequence of the tobacco (Nicotianatabacum) anionic peroxidase gene[J]. Plant Physiol,1993, 101(3): 1117-1118.
[24]ITZHAKI H, WOODSON W R. Characterization of an ethylene-responsive glutathione S-transferase gene cluster in carnation[J]. Plant Mol Biol,1993, 22(1): 43-58.
[25]KOES R E, SPELT C E, VAN DEN ELZEN P J, et al. Cloning and molecular characterization of the chalcone synthase multigene family ofPetuniahybrida[J]. Gene,1989, 81(2): 245-257.
[26]KIM S Y, WU R. Multiple protein factors bind to a rice glutelin promoter region[J]. Nucleic Acids Res,1990, 18(23): 6845-6852.
[27]SHIGEMORI S, YONEKURA S, SATO T, et al. Expression of the immunoreactive buckwheat major allergenic storage protein inLactococcuslactis[J]. Appl Microbiol Biotechnol,2013, 97(8): 3603-3611.
[28]徐慧妮,王秀峰. 植物生長(zhǎng)發(fā)育逆境脅迫及其研究方法[C]// 中國(guó)園藝學(xué)會(huì).中國(guó)園藝學(xué)會(huì)第七屆青年學(xué)術(shù)討論會(huì)論文集.北京:中國(guó)園藝學(xué)會(huì),2006:887-893.
[29]劉輝,李德軍,鄧治. 植物應(yīng)答低溫脅迫的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)研究進(jìn)展[J]. 中國(guó)農(nóng)業(yè)科學(xué),2014,47(18): 3523-3533.
[30]熊國(guó)勝,李家洋,王永紅. 植物激素調(diào)控研究進(jìn)展[J]. 科學(xué)通報(bào),2009,54(18): 2718-2733.
[31]王麗萍,李志剛,譚樂和,等. 植物內(nèi)源激素研究進(jìn)展[J]. 安徽農(nóng)業(yè)科學(xué),2011,39(4): 1912-1914.
[32]蘭瑩. 水稻心白突變體flo2灌漿期籽粒中miRNA鑒定與表達(dá)分析[D]. 南京:南京農(nóng)業(yè)大學(xué), 2010.
【責(zé)任編輯 周志紅】
Sequence and expression analyses of three seed protein genes of buckwheat
HUANG Juan, DENG Jiao, SHI Taoxiong, LIANG Chenggang, ZHANG Qidi, CHEN Qingfu
(Research Center of Buckwheat Industry Technology,Guizhou Normal University,Guiyang 550001,China)
【Objective】 To clarify the sequence features and functions of three seed protein genes of buckwheat, providing a theoretical foundation for studying the molecular mechanism during seed development. 【Method】Using local Perl script, BLASTP, MEGA6 and PLANTCARE,the sequences and evolutionary relationships of three buckwheat seed protein genes, namely 13S globulin gene, 11S globulin gene and glutelin gene, were analyzed. The cis-regulatory elements in the promoter region were predicted. Using the qRT-PCR technology, the expression patterns of three genes were analyzed during seed development ofFagopyrumesculentum,F.tataricumandF.cymosum. 【Result】The 13S globulin gene included four exons and three introns. The protein length was 515 aa. This 13S globulin only had six different amino acid sites compared with another 13S globulin inF.tataricum(ABI32184.1), thus they might be the same gene. The expression level was the highest in the middle filling stage ofF.tataricum. The 11S globulin gene included eight exons and seven introns. The protein length was 914 aa, and it was most closly related to a 11S globulin inSagittariasagittifolia(CAA70334.1). The expression level was the highest in the middle filling stage ofF.tataricum. The glutelin gene included three exons and two introns. The protein length was 355 aa, and it was most closly related to a B5-type glutelin inBetavulgaris(XP_010683769.1). The expression level was the highest in the middle filling stage ofF.esculentum. The promoter regions of three genes contained various cis-acting elements which responded to stresses and phytohormones, as well as cis-acting elements required for endosperm expression. 【Conclusion】 The sequences of 13S globulin, 11S globulin and glutelin genes are obtained. These genes might be preferentially expressed in endosperm, and involved in stress and hormone responsive processes. The middle filling stage is the key stage for seed protein accumulation, and three genes are massively expressed at this stage, which provides a solid foundation for studying gene function in the future.
buckwheat; seed protein; filling stage; gene expression
2016- 03- 06優(yōu)先出版時(shí)間:2016-12-28
黃 娟(1988—),女,博士,E-mail:huang200669@163.com;通信作者:陳慶富(1966—),男,教授,博士,E-mail:cqf1966@163.com
國(guó)家自然科學(xué)基金(31471562,31171609);國(guó)家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系專項(xiàng)資金 (CARS-08-A4);貴州省蕎麥工程技術(shù)研究中心項(xiàng)目(黔科合農(nóng)G字【2015】4003號(hào));貴州師范大學(xué)博士基金資助項(xiàng)目(11904/0516031,11904/0516026)
S517
A
1001- 411X(2017)01- 0023- 08
優(yōu)先出版網(wǎng)址:http://www.cnki.net/kcms/detail/44.1110.s.20161228.0937.030.html
黃 娟,鄧 嬌,石桃雄,等.蕎麥3個(gè)種子蛋白基因的序列和表達(dá)分析[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2017,38(1):23- 30.