彭宣翔,陳夏曄
(湖南省煙草公司 郴州市公司,湖南 郴州 423000)
木質(zhì)素(lignin)是煙草細(xì)胞壁物質(zhì)的主要成分之一,有益于維持煙草植株直立生長、抗病蟲等。木質(zhì)素是復(fù)雜的苯丙烷單體聚合物,其3種主要組成單體為香豆醇、松柏醇和芥子醇。因單體不同,木質(zhì)素可分為3種類型:S-木質(zhì)素、G-木質(zhì)素和H-木質(zhì)素??Х人?O-甲基轉(zhuǎn)移酶(COMT)催化咖啡酸與5-羥基阿魏酸甲基化分別生成阿魏酸與芥子酸,在木質(zhì)素合成中參與S-木質(zhì)素單體的合成[1-2]。在許多植物中,多個COMT基因已經(jīng)被分離和鑒定,并且有多個基因在煙草中進(jìn)行了功能研究[2-5]。如,綠竹COMT基因反向轉(zhuǎn)化煙草后,轉(zhuǎn)基因植株木質(zhì)素含量下降28.7%[2];尾葉桉COMT基因轉(zhuǎn)化煙草成功改變了煙草植株的木質(zhì)素單體組成[4]。但對煙草內(nèi)源COMT基因的研究較為滯后,對煙草工業(yè)的發(fā)展不利。
木質(zhì)素的存在增強(qiáng)了植物體的支撐能力,是植物適應(yīng)陸生的重要標(biāo)志之一。但其給植物細(xì)胞壁的利用帶來了諸多不便,如造紙工業(yè)需用化學(xué)試劑去除木質(zhì)素,增加成本且污染環(huán)境[6-7]。在煙草中,木質(zhì)素含量高,煙葉燃吸時產(chǎn)生較重的木質(zhì)氣,降低了卷煙感官質(zhì)量[8-12]。同時,木質(zhì)素高溫?zé)峤鈺a(chǎn)生較多的有害氣體,危害健康[8,12]。因此,通過基因工程手段調(diào)控?zé)煵菽举|(zhì)素生物合成的研究具有較大的潛在應(yīng)用前景[13-14]。但目前國內(nèi)對煙草內(nèi)源COMT基因的研究尚未見報(bào)道。通過序列同源比對,在普通煙草基因組中鑒定了普通煙草的20個NtCOMT基因,并對其進(jìn)行了序列分析、進(jìn)化樹構(gòu)建、蛋白性質(zhì)分析和表達(dá)譜分析等,旨在為煙草木質(zhì)素生物合成的分子調(diào)控提供參考,進(jìn)而為給煙草工業(yè)提供低害煙葉奠定基礎(chǔ)。
從茄科作物基因組網(wǎng)站(https://solgenomics.net/)下載普通煙草基因組序列,從擬南芥基因組網(wǎng)站(http://www.arabidopsis.org/)下載擬南芥AtCOMT1(AT5G54160)基因序列。以AtCOMT1作為查詢序列,利用BLAST在煙草基因組數(shù)據(jù)庫中進(jìn)行比對,參數(shù)E值設(shè)為0.001。以得到完整編碼區(qū)的基因序列作為候選NtCOMT基因,并以NtCOMT1、NtCOMT2、NtCOMT3……NtCOMT20依次對煙草NtCOMT基因進(jìn)行命名。
依據(jù)序列編號在數(shù)據(jù)庫中下載其相應(yīng)的基因組序列、編碼區(qū)序列和蛋白質(zhì)序列,進(jìn)一步進(jìn)行序列結(jié)構(gòu)分析和蛋白結(jié)構(gòu)域預(yù)測等。利用序列分析在線工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/)繪制基因結(jié)構(gòu)圖;采用軟件Protparam(http://web.expasy.org/protparam/)預(yù)測煙草NtCOMT編碼蛋白的理化特性,如分子量和理論等電點(diǎn)等;利用MEME(http://meme-suite.org/tools/meme)和ProtComp 9.0(http://linux1.softberry.com)預(yù)測煙草NtCOMT蛋白的保守結(jié)構(gòu)域和亞細(xì)胞定位;利用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測煙草NtCOMT蛋白是否含有跨膜結(jié)構(gòu)域。所用軟件均為免費(fèi)在線工具,在進(jìn)行分析時,參數(shù)多采用默認(rèn)值。
將煙草20個NtCOMT蛋白序列導(dǎo)入MEGA 6.0軟件,利用ClustalW程序?qū)ζ溥M(jìn)行多序列比對;輸出的多序列比對結(jié)果采用Neighbor-Joining方法構(gòu)建系統(tǒng)進(jìn)化樹,Bootstrap設(shè)為500。
從http://www.ncbi.nlm.nih.gov/sra/網(wǎng)址下載編號為SRP029184的普通煙草品種K326的轉(zhuǎn)錄組數(shù)據(jù)。利用TopHat2軟件提取與煙草NtCOMT基因相匹配的表達(dá)數(shù)據(jù);相應(yīng)的組織選擇根、幼苗期葉片、團(tuán)棵期葉片、旺長期葉片、打頂后3天葉片和打頂后6 d葉片共6個。最后,利用Cluster 3.0和TreeView對表達(dá)數(shù)據(jù)進(jìn)行可視化分析,繪圖。
由表1可見,多數(shù)NtCOMT蛋白約含360個氨基酸殘基,分子量在37~41 kDa,大小相當(dāng),其中NtCOMT14最小,僅含有201個氨基酸殘基,分子量22.59 kDa。NtCOMT蛋白等電點(diǎn)為5.41~7.77,其中,除NtCOMT8、NtCOMT10、NtCOMT11和NtCOMT14為弱堿性外,其余成員為弱酸性,蛋白表面凈電荷為負(fù)電荷。
表1 煙草NtCOMT的蛋白序列Table 1 Sequence of NtCOMT proteins in tobacco
由圖1可見,NtCOMT基因含有的外顯子數(shù)目為2~5個外顯子,其中50%的基因含有4個外顯子;各個基因內(nèi)含子的數(shù)目和大小均差異較大,如NtCOMT8和NtCOMT17僅1個內(nèi)含子,而NtCOMT10則含4個內(nèi)含子;NtCOMT14基因的第1個內(nèi)含子大小超過3 kbp,而NtCOMT19的第1個內(nèi)含子僅37 bp。此外,基因結(jié)構(gòu)的相似性與其同源性呈正相關(guān)。
圖1 煙草NtCOMT家族成員的基因結(jié)構(gòu)Fig.1 Gene structure of the NtCOMT family in tobacco
圖2 煙草與擬南芥NtCOMT基因家族的系統(tǒng)進(jìn)化樹Fig.2 Phylogenetic tree for NtCOMT family of tobacco and AtCOMT family of Arabidopsis thaliana
由圖2可見,NtCOMT1和NtCOMT2與AtCOMT1同源性最高,說明其可能具有相似的功能。相比于擬南芥,煙草含有數(shù)目較大的COMT基因家族,說明其木質(zhì)素合成較擬南芥復(fù)雜。
亞細(xì)胞定位預(yù)測結(jié)果表明(表1),煙草NtCOMT蛋白約有1/2定位于細(xì)胞質(zhì),1/2定位于胞外。蛋白結(jié)構(gòu)域預(yù)測分析發(fā)現(xiàn),煙草NtCOMT蛋白結(jié)構(gòu)高度保守,其中Motif1、Motif3、Motif4和Motif5最為保守(圖3)。從圖3還可看出,各成員保守結(jié)構(gòu)域的位置排列相似,其中NtCOMT14在進(jìn)化中丟失了部分結(jié)構(gòu)域,發(fā)生了較大變異,可能已經(jīng)進(jìn)化成為假基因。
圖3 煙草NtCOMT蛋白結(jié)構(gòu)域Fig.3 Protein domains of the NtCOMT proteins in tobacco
由圖4可知,NtCOMT1、NtCOMT2、NtCOMT4、NtCOMT5和NtCOMT19 5個基因在不同生長發(fā)育時期的煙葉中均有較高的表達(dá)量。部分基因只在某個發(fā)育時期高表達(dá),如,NtCOMT3、NtCOMT11和NtCOMT12僅在團(tuán)棵期葉片中高表達(dá);NtCOMT13在打頂后葉片中高表達(dá)。其余11個基因在煙葉中表達(dá)量低,說明其在煙草葉片木質(zhì)素的生物合成中不發(fā)揮作用。此外,有10個NtCOMT基因在根中有較高的表達(dá)水平。
圖4 煙草NtCOMT基因在不同時期K326葉片的表達(dá)Fig.4 Expression pattern of NtCOMTs in K326 leaves of different stages in tobacco
煙草木質(zhì)素是煙氣有害成分的主要來源之一。相對于其他植物,對煙草內(nèi)源COMT基因的功能研究較為滯后。本研究在普通煙草K326基因組中鑒定了20個NtCOMT家族基因,并對其基因結(jié)構(gòu)、進(jìn)化關(guān)系、蛋白保守結(jié)構(gòu)域和基因表達(dá)情況等進(jìn)行分析。蛋白質(zhì)的結(jié)構(gòu)決定其功能。對蛋白家族保守結(jié)構(gòu)進(jìn)行預(yù)測,有利于分析保守結(jié)構(gòu)域甚至保守氨基酸殘基在進(jìn)化過程中的重要作用。保守結(jié)構(gòu)分析和進(jìn)化分析表明煙草NtCOMT家族結(jié)構(gòu)較為保守,說明這些保守的序列和高級結(jié)構(gòu)的生物學(xué)功能非常重要。一些結(jié)構(gòu)域丟失的基因可能進(jìn)化成假基因而失去了功能。這有待于進(jìn)一步對基因功能開展研究。研究認(rèn)為,植物細(xì)胞在胞質(zhì)中合成木質(zhì)素單體,然后經(jīng)過囊泡運(yùn)輸?shù)竭_(dá)細(xì)胞壁并進(jìn)一步聚合堆積成木質(zhì)素[15-16]。擬南芥AtCOMT1蛋白定位于細(xì)胞質(zhì)。推測定位于細(xì)胞質(zhì)的NtCOMT蛋白可能參與木質(zhì)素單體的合成,而定位于胞外的NtCOMT蛋白可能參與胞外木質(zhì)素聚合或其他修飾過程。
煙草是收獲和使用煙葉的經(jīng)濟(jì)作物。因此,對NtCOMT家族基因在不同發(fā)育階段的煙葉中進(jìn)行了表達(dá)分析發(fā)現(xiàn),有9個基因在幼苗期、團(tuán)棵期、旺長期煙葉或打頂后煙葉中具有較高的表達(dá)量。這些葉片高表達(dá)的基因可能參與了煙葉細(xì)胞壁中木質(zhì)素的合成。因此,開展這些基因的功能研究,可為分子水平改良煙葉提供參考。值得注意的是,大部分在煙葉中高表達(dá)的NtCOMT基因在根中也具有較高的表達(dá)量。因此,通過調(diào)控這些基因降低煙葉木質(zhì)素含量存在一定的風(fēng)險,因?yàn)樵诮档腿~片木質(zhì)素含量的同時,可能影響煙草植株的正常生長發(fā)育。解決方案之一是優(yōu)先針對只在葉片中高表達(dá)的基因如NtCOMT11、NtCOMT12和NtCOMT13進(jìn)行功能缺失研究。
木質(zhì)素為煙草生長發(fā)育所必須,但對煙葉品質(zhì)有較大影響。木質(zhì)素含量高,煙葉燃吸時會產(chǎn)生較重的木質(zhì)氣,降低卷煙感官質(zhì)量[8-12]。同時,木質(zhì)素高溫?zé)峤膺€會產(chǎn)生較多的有害氣體,危害消費(fèi)者的身體健康[8,12]。因此,通過基因工程手段降低煙草木質(zhì)素含量具有較大的潛在應(yīng)用前景[13-14,17]。本研究鑒定了普通煙草的20個NtCOMT家族基因,并對其表達(dá)模式進(jìn)行了初步分析,找到了煙草葉片特異高表達(dá)的基因,對煙草木質(zhì)素含量的分子調(diào)控研究具有重要參考價值。