王琴波,王雨晴,楊 謹(jǐn),陳觀水
福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建 福州 350002
三萜類化合物是一類具有抗腫瘤、抗病毒、降血糖、調(diào)血脂等多種生物活性的植物次生代謝產(chǎn)物,在太子參、人參、甘草等中藥基原植物中廣泛存在[1-3]。三萜類化合物的結(jié)構(gòu)與生物合成過(guò)程比較復(fù)雜,關(guān)于合成途徑中的關(guān)鍵酶的研究是熱點(diǎn)之一[4]。研究表明,三萜類化合物主要有兩條合成途徑生成,即甲羥戊酸(mevalonate pathway,MVA)和甲基-赤蘚醇-4-磷酸途徑(2-methyl-D-erythritol-4-phosphate,MEP)途徑,其中MVA 途徑是植物三萜類化合物合成的主要途徑[5-8]。在MVA 途徑中,鯊烯合酶(squalene synthase,SQS)位于三萜合成通路的分支點(diǎn)上,決定著法尼基焦磷酸的流向,是三萜類化合物生物合成途徑中一個(gè)關(guān)鍵酶,其含量及活性決定了植物該物質(zhì)的產(chǎn)量,也是三萜皂苷合成代謝中的一個(gè)重要的限速酶[9-14]。目前,已從各種各樣的生物,如動(dòng)物[15]、人類[16]、真菌[17]、植物[9]中成功分離了鯊烯合酶編碼基因序列近1000 條。通過(guò)對(duì)SQS 的結(jié)構(gòu)及理化特性分析表明,不同來(lái)源的SQS 在功能位點(diǎn)、結(jié)構(gòu)特征存在一定的差異。因此,鯊烯合酶作為三萜類化合物代謝途徑中關(guān)鍵調(diào)控酶?jìng)涫荜P(guān)注,具有重要的研究意義。
本研究運(yùn)用生物信息學(xué)相關(guān)軟件及其分析方法,對(duì)太子參等《中國(guó)藥典》2015年版[18]收錄的20 種中藥基原植物中SQS 蛋白氨基酸序列的理化特性、跨膜結(jié)構(gòu)域、亞細(xì)胞定位、親水性進(jìn)行比較與分析,并構(gòu)建SQS 蛋白家族的系統(tǒng)發(fā)育樹。為進(jìn)一步研究植物SQS 的功能與結(jié)構(gòu)特征和調(diào)控植物三萜類化合物的生物合成提供依據(jù)。
設(shè)定SQS 為關(guān)鍵詞進(jìn)行搜索,從美國(guó)國(guó)立生物技術(shù)信息中心(National Center of Biotechnology Information,NCBI)下載并篩選出了太子參Pseudostellaria he terophylla(Miq.) Pax ex Pax et Hoffm(登錄號(hào)AQV11962.1)、人參Panax ginsengC.A.Meyer(登錄號(hào) ACV88718.1)、三七Panax notoginseng(Burkill) F.H.Chen ex C.H.(登錄號(hào)AIK21786.1)、西洋參Panax quinquefoliumL.(登錄號(hào)(AED99863.1)、竹節(jié)參Panax japonicas(T.Nees)C.A.Mey.(登錄號(hào) ALB38664.1)、刺五加Acanthopanax senticosus(Rupr.Maxim.) Harms(登錄號(hào)AER23670.1)、柴胡Bupleurum chinenseD.C.(登錄號(hào)(ACX42425.1)、甘草Glycyrrhiza uralensisFisch.(登錄號(hào)ACS66749.1)、膜莢黃芪Astragalus membranaceus(Fisch.) Bunge(登錄號(hào)(ALA23415.1)、千金子Euphorbia lathyris(L.) Nees(登錄號(hào)(AFZ93644.1)、梔子Gardenia jasminoidesEllis.(登錄號(hào)AYC62335.1)、瓜蔞Trichosanthes kirilowiiMaxim.(登錄號(hào)(ARE29883.1)、金鐵鎖Psammosilene tunicoidesW.C.Wu & C.Y.Wu(登錄號(hào)(ABQ96265.1)、遠(yuǎn)志Polygala t enuifoliaWilld.(登錄號(hào)ABG66304.1)、羅漢果Siraitia gr osvenorii(Swingle) C.Jeffery(登錄號(hào)(ANM71227.1)、丹參Salvia m iltiorrhizaBunge(登錄號(hào)ACR57219.1)、黃花蒿Artemisia annuaL.(登錄號(hào)AAR20329.1)、京大戟Euphorbia pe kinensisRupr.(ER)(登錄號(hào)AFT92039.1)、光果甘草Glycyrrhiza glabraL.(登錄號(hào)(AMR98504.1)、積雪草Centella asiatica(L.)Urb.(登錄號(hào)AAV58897.1)20 種《中國(guó)藥典》2015年版中收錄的中藥基原植物完整的SQS 氨基酸序列。
SQS 氨基酸序列利用NCBI 網(wǎng)站進(jìn)行在線分析;氨基酸序列的組成、相對(duì)分子質(zhì)量、等電點(diǎn)、不穩(wěn)定系數(shù)等理化性質(zhì)利用Protparam(http: //web.expasy.org/protparam/)在線進(jìn)行分析;跨膜結(jié)構(gòu)域用 TMHMM Serverv.2.0 ( http://www.cbs.dtu.dk/services/TMHMM-2.0/)進(jìn)行預(yù)測(cè);亞細(xì)胞定位利用 PSORTPrediction ( https: //wolfpsort.hgc.jp/)進(jìn)行分析;信號(hào)肽利用SignalP軟件5.0 版(http://www.cbs.dtu.dk/services/ SignalP/)進(jìn)行預(yù)測(cè);采用 SOPMA ( https: //npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl/page=npsa_so pma.html)進(jìn)行蛋白二結(jié)結(jié)構(gòu)的預(yù)測(cè)分析;采CDD在線工具分析(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行功能域預(yù)測(cè);蛋白質(zhì)磷酸化位點(diǎn)利用 NetPhos3.1 Server ( http://www.cbs.dtu.dk/services/NetPhos/)進(jìn)行預(yù)測(cè);利用DNAMAN 9.0 進(jìn)行SQS 蛋白氨基酸序列的多重比對(duì)分析;采用MEGA 10.0 軟件構(gòu)建SQS 蛋白的系統(tǒng)進(jìn)化樹;利用 MEME 在線分析工具(http://meme-suite.org/tools/meme)進(jìn)行SQS 蛋白的保守基序進(jìn)行分析。
使用在線軟件Protparam 對(duì)20 條SQS 的氨基酸序列進(jìn)行理化性質(zhì)預(yù)測(cè)分析(表1)。預(yù)測(cè)析分表明,20 條氨基酸序列的等電點(diǎn)在6.19~8.53,呈現(xiàn)弱酸性或弱堿性,正負(fù)電荷比例約為1∶1;同時(shí)對(duì)氨基酸序列的組成成分也進(jìn)行了分析,發(fā)現(xiàn)所有SQS 蛋白中亮氨酸(L)含量最高,最高可達(dá) 11.8%。相對(duì)分子質(zhì)量之間差別不大,在46 960~47 890;總平均親水系數(shù)均為負(fù)值,親水性較好,表明SQS 均屬于親水性蛋白;預(yù)測(cè)的蛋白的不穩(wěn)定指數(shù)在35.77~44.38,表明20 種蛋白中既有穩(wěn)定性蛋白也有不穩(wěn)定性蛋白。
表1 20 種中藥基原植物SQS 蛋白理化性質(zhì)的預(yù)測(cè)分析Table 1 Prediction and analysis of physical and chemical properties of SQS protein in 20 Chinese herbal plants
利用在線軟件TMHMM 對(duì)太子參等20 個(gè)SQS 蛋白進(jìn)行跨膜預(yù)測(cè)(表2),顯示除來(lái)源于桅子和丹參的SQS 蛋白只有1 個(gè)跨膜,其余SQS蛋白均含有2 個(gè)跨膜結(jié)構(gòu)。亞細(xì)胞定位預(yù)測(cè)表明(表2),20 個(gè)SQS 蛋白均具有多個(gè)亞細(xì)胞定位,其主要分布于細(xì)胞質(zhì)和質(zhì)膜中,并在細(xì)胞核、線粒體、高爾基體、內(nèi)質(zhì)網(wǎng)、液泡中也有少量分布,說(shuō)明這些蛋白質(zhì)主要在細(xì)胞質(zhì)和質(zhì)膜中行使其功能。利用在線工具Signal P 對(duì)20 個(gè)SQS 蛋白進(jìn)行信號(hào)肽預(yù)測(cè)(表2),結(jié)果顯示,所有的SQS 蛋白均不存在信號(hào)肽。
利用SOPMA 對(duì)20 種中藥SQS 蛋白的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)(表3)。結(jié)果表明,所有SQS 蛋白均由α-螺旋、延伸連和無(wú)規(guī)則卷曲3 種構(gòu)件組成,其中以α-螺旋和無(wú)規(guī)則卷曲為主。以太子參SQS 為例,其α-螺旋、延伸連和無(wú)規(guī)則卷曲3 種構(gòu)件的比例分別為38.65%、22.22%和39.13%。因此推測(cè),α-螺旋和無(wú)規(guī)則卷曲是植物SQS 蛋白中主要存在的結(jié)構(gòu)元件,并且分散在整個(gè)多肽鏈中。
表2 不同中藥基原植物SQS 蛋白跨膜、亞細(xì)胞定位及信號(hào)肽預(yù)測(cè)分析Table 2 SQS protein sequences prediction analysis of transmembrane,subcellular localization and signal peptide from different Chinese herbal plants
表3 不同中藥基原植物SQS 蛋白二級(jí)結(jié)構(gòu)元件比例Table 3 Secondary structure element ratio of SQS in different Chinese herbal plants
利用CDD 在線工具分析太了參等20 種SQS 氨基酸序列的功能結(jié)構(gòu)域。結(jié)果表明,20 種SQS 氨基酸的保守結(jié)構(gòu)域中均含有底物結(jié)合區(qū)、底物-鎂離子結(jié)合位點(diǎn)、活性位點(diǎn)蓋殘基、催化殘基和2 個(gè)天冬氨酸富集區(qū),具有典型的多聚異戊二烯基合成酶活性結(jié)構(gòu)域和鯊烯/八氫番茄紅素合成酶活性結(jié)構(gòu)域,屬于Isoprenoid-Biosyn-C1 超家族,為類異戊二烯生物合成酶。太子參SQS 的保守結(jié)構(gòu)域見圖1。
圖1 太子參SQS 的保守結(jié)構(gòu)域分析Fig.1 Conserved domain analysis of PhSQS
利用NetPhos 3.1 Server 對(duì)20 種中藥基原植物SQS 蛋白磷酸化位點(diǎn)進(jìn)行預(yù)測(cè),位點(diǎn)數(shù)在29~38個(gè),其中絲氨酸磷酸化位點(diǎn)數(shù)在12~20 個(gè),蘇氨酸位點(diǎn)有5~15 個(gè),酪氨酸磷酸化位點(diǎn)有5~8 個(gè)。以太子參SQS 為例,共有32 個(gè)磷酸化位點(diǎn),其中絲氨酸位點(diǎn)有13 個(gè),蘇氨酸位點(diǎn)有11 個(gè),酪氨酸磷酸化位點(diǎn)有8 個(gè),其他中草藥植物的SQS 蛋白的氨基酸磷酸化位點(diǎn)差別。見表4。
20 種中藥基原植物的SQS 氨基酸序列的多重比分析表明(圖2),所有20 種SQS 均含有4 個(gè)高保守(I~Ⅳ)且典型的17~23 個(gè)氨基酸長(zhǎng)度的結(jié)構(gòu)域和1個(gè)高度差異且?guī)缀跻允杷被釟埢鶠橹鞯母叨仁杷畢^(qū)結(jié)構(gòu)域(V)。研究表明,這些結(jié)構(gòu)域與SQS 的結(jié)合、調(diào)節(jié)及催化活性功能密切相關(guān)。用MEGA 10.0軟件對(duì)包括太子參在內(nèi)的20 種有代表性的SQS 蛋白構(gòu)建系統(tǒng)進(jìn)化樹(圖3)。
表4 20 種中藥基原植物SQS 蛋白磷酸化作用位點(diǎn)預(yù)測(cè)結(jié)果Table 4 Prediction of phosphorylation sites of SQS protein from 20 Chinese herbal plants
圖2 20種中藥基原植物的SQS氨基酸序列比對(duì)分析Fig.2 Amino acid sequence alignment of SQS protein from 20 Chinese herbal plants
分析結(jié)果顯示,在進(jìn)化遺傳學(xué)上親緣越近的物種,在SQS的分子系統(tǒng)進(jìn)化樹上基本上距離越近?;诎被嵝蛄兄亟ǖ南到y(tǒng)進(jìn)化樹,其結(jié)果對(duì)判斷不同植物之間的親緣關(guān)系具有一定的借鑒意義和可行性參考。
通過(guò)MEME軟件的搜索,在20個(gè)SQS蛋白氨基酸序列中發(fā)現(xiàn)了15個(gè)保守基序(motif)結(jié)構(gòu)(圖3),長(zhǎng)度在6~50個(gè)氨基酸,所有SQS蛋白含有的基序除在碳端有稍有差別外,其他大體一致,且存在有位于SQS保守結(jié)構(gòu)域內(nèi)的保守基序。同時(shí)還發(fā)現(xiàn),在系統(tǒng)發(fā)育樹的每個(gè)分支上的成員具有相同或類似的基序類型和排列順序,顯示SQS蛋白之間在這20種中藥基原植物中的相對(duì)保守性。
圖3 20 種中藥基原植物SQS 蛋白系統(tǒng)發(fā)育樹及保守基序Fig.3 Phylogenetic tree and conserved motif of SQS proteins from 20 Chinese herbal plants
三萜及其苷類廣泛存在于自然界,在菌類、蕨類、單子葉、雙子葉植物、動(dòng)物及海洋生物中均有分布,尤以雙子葉植物中分布最多[3]。三萜類化合物是人參、甘草、柴胡等中草藥植物中主要活性物質(zhì),常具有抗腫瘤、溶血、抗菌、增加機(jī)體免疫力的作用[1-3]。通過(guò)對(duì)三萜類化合物生物合成的研究表明,三萜類化合物是由鯊烯經(jīng)過(guò)不同的途徑環(huán)合而成,而鯊烯是三萜類化合物合成途徑中關(guān)鍵前體物質(zhì),它由法尼基焦磷酸(farnesyl diphosphate,F(xiàn)PP)經(jīng)過(guò)鯊烯合酶作用下兩分子鯊烯通過(guò)尾-尾縮合生成[5-11]。眾多研究表明,鯊烯合酶是三萜類化合物的底物合成起始點(diǎn)的催化合成酶,是三萜類化合物合成途徑中一個(gè)關(guān)鍵限速酶,對(duì)三萜類化合物合成途徑的下游物質(zhì)合成和積累具有重要決定性意義[9-10]。
利用生物信息學(xué)分析工具對(duì)源自《中國(guó)藥典》2015年版且三萜類化合物為其主要活性物質(zhì)的中藥基原植物的20 條SQS 蛋白氨基酸序列進(jìn)行分析。SQS 蛋白質(zhì)一級(jí)結(jié)構(gòu)分析,表明這20 種中藥基原植物的SQS 蛋白呈現(xiàn)弱酸性或弱堿性,部分不穩(wěn)定,部分穩(wěn)定,均屬于親水性蛋白,不具有信號(hào)肽,可推測(cè)SQS 不是分泌蛋白,這與其屬于細(xì)胞質(zhì)中的MVA 途徑相一致;均存在1~2 個(gè)跨膜結(jié)構(gòu)域;亞細(xì)胞定位預(yù)測(cè)分析表明其最大可能定位在質(zhì)膜或細(xì)胞質(zhì)上,這與前人研究報(bào)道鯊烯合酶屬于膜結(jié)合蛋白相一致[12]。二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果表明,所有的SQS均以α-螺旋和任意卷曲為主要成份。多序列比對(duì)顯示這20 種中藥基原植物的SQS 氨基酸序列彼此間存在較高的相似性,含有4 個(gè)高保守且典型的17~23 個(gè)氨基酸長(zhǎng)度的結(jié)構(gòu)域(I~Ⅳ)包括底物結(jié)合區(qū)、底物-鎂離子結(jié)合位點(diǎn)、活性位點(diǎn)蓋殘基、催化殘基和2 個(gè)天冬氨酸富集區(qū),研究表明,這些高保守區(qū)域?qū)τ赟QS 發(fā)揮催化作用具有關(guān)鍵作用[14,19]。另外,這20 條序列中均在氨基酸序列的C 端序列差異性極大且屬于幾乎都是疏水氨基酸殘基,研究表明,這些殘基有助于鯊烯合酶錨定于細(xì)胞器膜上[20]。系統(tǒng)發(fā)育樹的結(jié)果顯示,20 種中藥基原植物的SQS 蛋白氨基酸序列的聚類結(jié)果基本與植物系統(tǒng)分類學(xué)結(jié)果相一致。所有的信息表明,這20 種中藥基原植物的SQS 蛋白結(jié)構(gòu)和序列上的高度保守也許揭示它們?cè)诠δ苌系南嗨菩?。本研究通過(guò)對(duì)SQS 的序列結(jié)構(gòu)的預(yù)測(cè)和分析為深入研究鯊烯合酶結(jié)構(gòu)與功能的關(guān)系、作用機(jī)制和代謝過(guò)程提供了參考,同時(shí)也有助于其他生物的SQS 基因的克隆。