王步勇+馬玲
摘要:以黃花蒿(Artemisia annua L.) 1-脫氧-D-木酮糖-5-磷酸還原異構酶基因(DXR)為研究對象,利用美國國家生物技術信息中心(NCBI)網站及生物信息學軟件對堿基分布、氨基酸組成、親疏水性及編碼蛋白結構進行預測,用Clustal W進行多序列比對,用MGEA構建系統(tǒng)發(fā)育樹,用STRING進行蛋白互作網絡分析,研究黃花蒿DXR基因特征并預測分析DXR蛋白結構與功能。結果表明:黃花蒿DXR基因mRNA序列長度為1 419 bp,編碼蛋白包含472個氨基酸,等電點為6.15;DXR蛋白為疏水性蛋白,無信號肽,無跨膜結構域。多序列比對及系統(tǒng)發(fā)育樹分析表明,黃花蒿DXR蛋白與杭白菊DXR(BAE79548.1)的相似度最高,為98%,且處于同一分支,親緣關系較近。蛋白結構分析顯示,α-螺旋、無規(guī)則卷曲是黃花蒿DXR蛋白的主要結構元件?;プ骶W絡分析顯示,黃花蒿DXR在2-甲基-D-赤蘚糖醇-4-磷酸(2-C-methyl-D-erythritol-4-phosphate,MEP)代謝途徑中,可與CMS、DXS、HDS等多個蛋白發(fā)生互作。黃花蒿DXR基因在進化過程中相對保守,獲得的保守區(qū)序列信息為其他物種DXR基因的克隆奠定了基礎,深入研究該蛋白酶的結構和功能特征,也為今后提高青蒿素的生物合成量提供理論支持。
關鍵詞:黃花蒿;DXR基因;生物信息學;同源序列;多重序列比對;蛋白結構;蛋白互作網絡;青蒿素;生物合成量
中圖分類號: S188;R282.5 文獻標志碼: A
文章編號:1002-1302(2016)09-0042-05
黃花蒿(Artemisia annua L.)為菊科蒿屬的一年生草本植物,生態(tài)適應性非常廣,在我國各地均有分布,已入藥2 000多年,具有清熱解毒的功效,為我國傳統(tǒng)中草藥之一。其主要有效成分青蒿素在抗瘧,治中暑、蕁麻疹和滅蚊等方面具有重要功效,是目前世界衛(wèi)生組織推薦治療瘧疾的首選藥物[1-2]。中國青蒿素產量占世界總產量的70%左右[3],由于野生資源的黃花蒿中青蒿素含量較低(0.01%~0.8%),致使青蒿素價格較高,很難滿足醫(yī)藥需求[4]。近年來,利用環(huán)己烯酮[5]、青蒿酸[6-7]等物質化學合成青蒿素取得一定成果,但因青蒿酸的生產主要依賴黃花蒿葉片,青蒿素的全化學合成幾乎不可能[8]。生物合成青蒿素仍是生產青蒿素的主要途徑,培育黃花蒿則成為提高青蒿素產量的關鍵。通過對青蒿素生物合成中關鍵酶的研究,利用基因工程獲得高產轉基因黃花蒿植株是解決這一矛盾的有效途徑。
青蒿素是含有過氧基團的倍半萜內酯,屬于萜類化合物。絕大多數萜類化合物的合成前體是異戊烯基焦磷酸(IPP),植物體內IPP的生物合成主要存在2條不同的代謝途徑:一是定位于細胞質中的甲羥戊酸(mevalonate,MVA)途徑[9];另一條是定位于質體中的2-甲基-D-赤蘚糖醇-4-磷酸(2-C-methyl-D-erythritol-4-phosphate,MEP)途徑[10]。1-脫氧-D-木酮糖-5-磷酸還原異構酶(DXR)催化1-脫氧-D-葡萄糖-5-磷酸(DXP)產生異構并還原生產MEP,是MEP代謝途徑中最重要的限速反應,也是細胞質體內類異戊二烯化合物代謝中的重要調控穩(wěn)點[11]。DXR在植物類異戊二烯生物合成過程中發(fā)揮了重要作用。Mahmoud等發(fā)現(xiàn),薄荷過量表達DXR,可促進葉片中薄荷油等單萜的合成,使薄荷精油量提高50%[12]。Carretero-Paulet等發(fā)現(xiàn),在過量表達DXR的轉基因擬南芥中,葉綠素、類胡蘿卜素水平都顯著提高[13]。Graham等通過對青蒿基因組測序并對青蒿素合成相關基因進行分析表明,DXR與青蒿素合成呈正相關[14]。
近年來,擬南芥、番茄、水稻、玉米、銀杏、橡膠樹及喜樹等多種植物的DXR基因得到解析[15-16],但尚未有報道利用生物信息學的方法系統(tǒng)研究這些基因,制約了其他物種中該基因的克隆與功能驗證。本試驗利用生物信息學方法對黃花蒿DXR基因以及GenBank上已發(fā)表的其他植物DXR基因進行序列分析和功能預測,利用分子互作技術對黃花蒿DXR基因進行全面分析,旨在為提高黃花蒿青蒿素產量提供新思路,為其他植物DXR基因的克隆、功能驗證提供理論和實踐參考依據。
1 材料與方法
數據來源于美國國家生物技術信息中心(NCBI)核苷酸和蛋白質數據庫中已登陸的黃花蒿DXR基因的核苷酸序列(GenBank登錄號:AF182287.2)、氨基酸序列(GanBank登錄號:AAD56391.2)[17]。
黃花蒿DXR序列分析:利用NCBI在線工具ORF-Finder翻譯蛋白并進行開放閱讀框(ORF)查找。利用ExPASy ProtParam預測分析編碼蛋白的相對分子量、理論等電點、穩(wěn)定性等理化性質[18]。用Target 1.1 Server在線軟件分析編碼蛋白的導肽[19]。用SignalP 4.1在線軟件分析編碼蛋白信號肽[20]。用TMHMM Server軟件對編碼蛋白的跨膜結構域進行預測分析[21]。用WOLF PSORT預測蛋白亞細胞定位信號[22]。用ProtScale分析編碼蛋白的親疏水性。用NetPhos 2.0 Server分析編碼蛋白潛在的磷酸化位點[23]。利用NCBI BLAST篩選同源序列,用Bioedit軟件進行多序列比對分析。利用MEGA 5.2 軟件鄰接算法N-J(Neihgbor-Joining)[24],選用JTT+I模型運算1 000次構建系統(tǒng)進化樹,并利用Bootstraping自展法對其進行評估。
蛋白結構預測及互作網絡分析:用NCBI CDD工具對蛋白保守區(qū)域進行預測分析;用ExPaSy-SOPMA軟件分析編碼蛋白二級結構;用SWISS-MODEL自動建模方式來篩選構建三維模型,用X射線衍射結構進行模型修飾;用Swiss-Pdb viewer構建拉氏構象圖,對建模準確性進行評估;用STRIG 9.1(http://string.embl.de/)[25]進行蛋白質互作網絡分析。
2 結果與分析
2.1 黃花蒿DXR基因分析和蛋白分析
2.1.1 黃花蒿DXR基因序列分析 NCBI上登錄的黃花蒿DXR序列是從黃花蒿mRNA中克隆得到的全長CDS(coding sequence)序列。序列全長為1 419 bp,其中包含多個起始密碼子(ATG)和1個終止密碼子(TGA)。其中A有379個,T有415個,A+T含量較高,為55.95%;C有292個,G有333個,C+T含量較少,為44.05%。
2.1.2 黃花蒿DXR編碼蛋白的氨基酸組成及其理化性質分析 通過ORF-Finder軟件分析發(fā)現(xiàn),黃花蒿DXR編碼蛋白編碼472個氨基酸。該預測蛋白原子總數為7 204個,分子式為C2 278H3 634N600O677S15,蛋白相對分子量為50.74 ku;理論半衰期為30 h;不穩(wěn)定系數為33.53,小于40.0,說明該蛋白屬于穩(wěn)定性蛋白。此外,該蛋白脂肪系數為98.37,親水性系數為0.020,理論等電點(PI)為6.15。由其氨基酸組分可知,丙氨酸Ala(A)、亮氨酸Leu(L)含量最高,為9.70%;半胱氨酸Cys(C)含量最低,為1.50%;帶負電荷總殘基數(Asp+Glu)為49個,帶正電荷總殘基數(Arg+Lys)為44個(圖1)。
2.1.3 DXR蛋白導肽、信號肽及亞細胞定位預測分析 用TargetP 1.1 Server預測DXR導肽,結果顯示,該序列mTP(定位于線粒體)值為0.030,cTP(定位于葉綠體)值為0.691,SP(信號肽)值為0.022,推測該序列不含有線粒體目標肽、分類途徑信號肽,可能為葉綠體轉運肽。SignalP 4.1預測顯示,黃花蒿DXR蛋白為非分泌蛋白。用WOLF PSORT軟件對該蛋白進行亞細胞定位發(fā)現(xiàn),該蛋白最可能定位于細胞質上,可信度高達76%。
2.1.4 DXR蛋白親/疏水性及磷酸化位點分析 利用ProtScale預測黃花蒿DXR蛋白的親/疏水性,由圖2可見:在黃花蒿DXR蛋白氨基酸中,第167~193位氨基酸區(qū)域具有很強的疏水性,在第171位氨基酸處達到最強疏水性峰值,為2.444;第32~44位氨基酸區(qū)域具有很強的親水性,在第40位氨基酸處達到最強親水性峰值,為-2.224。由于親水性氨基酸的個數多于疏水性氨基酸,預測黃花蒿DXR蛋白為親水性蛋白。
用NetPhos2.0 Server預測結黃花蒿DXR蛋白磷酸化位點發(fā)現(xiàn),在DXR有17個絲氨酸(Ser,S)磷酸化位點、6個蘇氨酸(Thr,T)磷酸化位點、3個酪氨酸(Tyr,Y)磷酸化位點。在整個氨基酸序列中,第7位氨基酸(S)、第40位氨基酸(S)的磷酸化預測值最高,為0.992,可能受蛋白磷酸化激酶磷酸化。
2.2 多序列比對和系統(tǒng)進化樹分析
用NCBI BLAST篩選得到14條黃花蒿DXR同源序列(表1),應用Clustal W進行多重序列比對分析。圖3結果發(fā)現(xiàn),中間功能區(qū)域的氨基酸序列較為保守,兩端區(qū)域的氨基酸序列差異較大,且N-端差異大于C-端差異。用MEGA5.2 軟件N-J法構建系統(tǒng)進化樹。由圖4結果可知:16個物種的DXR氨基酸序列聚集成2大分支:黃花蒿、艾菊、杭白菊、甜葉菊聚為分支Ⅰ;千金子、蓖麻、毛果楊等聚為分支Ⅱ。由傳統(tǒng)分類學可知,分支Ⅰ中的黃花蒿、艾菊、杭白菊、甜葉菊4個物種均屬菊科,分支Ⅱ中的千金子、蓖麻、毛果楊等11個物種不屬于菊科。這表明DXR是1種相對保守的蛋白,物種的進化速度與物種DXR蛋白的進化速度是一致的,DXR可以作為生物遺傳分析、分子進化研究的重要因子。
2.3 DXR蛋白結構預測及互作網絡分析
2.3.1 黃花蒿DXR蛋白保守區(qū)預測 利用NCBI CDD在線分析黃花蒿DXR蛋白保守區(qū)域。圖5結果顯示,DXR蛋白含有DXP_reductoisom、DXP_redisom_C、DXPR_C 3個保守結構區(qū)域,預測該蛋白屬于SDR 超家族、DXP_redisom_C超家族及DXPR_C超家族。
2.3.2 黃花蒿DXR蛋白結構分析 用ExPaSy-SOPMA軟件分析DXR蛋白二級結構。由圖6可知,該蛋白由37.08%無規(guī)則卷曲、28.81% α-螺旋、23.94%延伸鏈、10.17%β-轉角組成,無規(guī)則卷曲、α-螺旋是其主要構件,延伸鏈貫穿于整個蛋白質中。
利用Swiss-MODEL根據同源蛋白構建黃花蒿DXR蛋白的三級結構(圖7-A),該蛋白包含28個α-螺旋、25個β-折疊和大量無規(guī)則卷曲。通過Swiss-Pdb Wiewer構建拉氏構象圖(圖7-B)對預測的DXR三維模型進行評估發(fā)現(xiàn),預測模型的二面角位于黃色核心區(qū)域,其空間結構穩(wěn)定,該蛋白利用Swiss-MODEL同源建模得到的三維結構的可信度極高。用VAST Search在線軟件預測DXR蛋白的功能位點(圖7-C),預測DXR蛋白兩端的α-螺旋、β-折疊結合部位為主要的功能位點。
2.3.3 黃花蒿DXR蛋白互作網絡分析 根據黃花蒿DXR蛋白質三維結構模型,利用STRING交互式數據庫進行蛋白質互作網絡分析。結果表明,DXR在催化DXP產生異構并還原生產MEP代謝過程中與多個蛋白發(fā)生互作,主要包括:CMS、DXS、eugene3.09030001、gw1.III.2599.1、gw1.171.35.1、gw1.VI.2744.1、estExt_Genewise1_v1.C_LG_XVIII1471、MCS、gw1.I.8813.1、HDS等(圖8)。
3 結論與討論
次生代謝產物是地球上最豐富的有機化合物,由于其功能特殊、用途廣泛,現(xiàn)已成為國際上研究的熱點、焦點。目前已經有多種萜類化合物被分離提取,應用到醫(yī)學、農業(yè)、工業(yè)等各領域。青蒿素作為黃花蒿的1萜類次生代謝產物,因其具有抗瘧效率高、速度快、毒性低等優(yōu)點,已經成為全球抗瘧的主要藥物。2011年,因對青蒿素的抗瘧研究作出貢獻,我國的女藥學家屠呦呦獲得了拉斯克獎[26]。青蒿素的獲取主要依賴于黃花蒿的生物合成,全面了解青蒿素生物合成途徑關鍵酶的功能,通過基因工程等手段調控其在植物體內表達,獲得大量有用的青蒿素,可為提高青蒿素產量開辟新的思路。
DXR在萜類物質MEP合成途徑中具有特殊作用,可將DXP異構化并還原生產MEP。黃花蒿DXR作為青蒿素生物合成的重要限速酶而倍受關注。生物信息學是當今生命科學和自然科學的核心領域,是后基因組時代的重要研究方法。本研究根據NCBI上登錄的黃花蒿DXR基因序列,應用生物信息學技術對該基因及編碼蛋白進行比對、分析、建模等研究,應用STRING對該基因編碼蛋白進行互作網絡分析?;蛐蛄蟹治霭l(fā)現(xiàn),該基因中A+T堿基含量較高,為55.95%,高于50%,且錯配率較低,核苷酸穩(wěn)定。編碼蛋白氨基酸序列分析發(fā)現(xiàn),DXR蛋白不穩(wěn)定系數為33.53,屬于不穩(wěn)定性蛋白。多序列比對及系統(tǒng)發(fā)育樹分析發(fā)現(xiàn),黃花蒿DXR與杭白菊DXR同源性最高,為98%,親緣關系最近。DXR在進化上高度保守,可作為其他物種生物遺傳分析和分子進化研究的重要因子。蛋白結構分析顯示,無規(guī)則卷曲、α-螺旋是其主要結構元件。蛋白互作網絡分析表明,黃花蒿DXR可能與1-脫氧木桶糖-5-磷酸合成酶(DXS)互作。本研究結果為深入探討黃花蒿DXR蛋白功能和萜類生物合成的分子機制提供重要基礎信息,為提高黃花蒿青蒿素的生物合成量提供了理論支持,也為其他植物萜類等次生代謝產物的研究提供了一定依據。
參考文獻:
[1]Klayman D L.Qinghaosu (artemisinin):an antimalarial drug from China[J]. Science,1985,228(473):1049-1055.
[2]World Health Organization.World malaria report 2010[R]. Geneva:WHO,2010.
[3]White N J.Qinghaosu (artemisinin):the price of success[J].Science,2008,320(5874):330-334.
[4]Liu B,Wang H,Du Z,et al. Metabolic engineering of artemisinin biosynthesis in Artemisia annua L.[J]. Plant Cell Reports,2011,30(5):689-694.
[5]Zhu C,Cook S P.A concise synthesis of (+)-artemisinin[J]. Journal of the American Chemical Society,2012,134(33):13577-13579.
[6]Lévesque F,Seeberger P H.Continuous-flow synthesis of the anti-malaria drug artemisinin[J]. Angewandte Chemie,2012,51(7):1706-1709.
[7]Hao H D,Li Y,Han W B,et al. A Hydrogen peroxide based access to qinghaosu (artemisinin)[J]. Organic Letters,2011,13(16):4212-4215.
[8]Yadav J S,Babu R S,Sabitha G.Stereoselective total synthesis of (+)-artemisinin[J]. Tetrahedron Letters,2003,44(2):387-389.
[9]Newman J D,Chappell J.Isoprenoid biosynthesis in plants:Carbon partitioning within the cytoplasmic pathway[J]. Critical Reviews in Biochemistry and Molecular Biology,1999,34(2):95-106.
[10]馬 靚,丁 鵬,楊廣笑,等. 植物類萜生物合成途徑及關鍵酶的研究進展[J]. 生物技術通報,2006(Z1):22-30.
[11]Takahashi S,Kuzuyama T,Watanabe H,et al. A 1-deoxy-D-xylulose 5-phosphate reductoisomerase catalyzing the formation of 2-C-methyl-D-erythritol 4-phosphate in an alternative nonmevalonate pathway for terpenoid biosynthesis[J]. Proceedings of the National Academy of Sciences of the United States ofAmerica,1998,95(17):9879-9884.
[12]Mahmoud S S,Croteau R B.Metabolic engineering of essential oil yield and composition in mint by altering expression of deoxyxylulose phosphate reductoisomerase and menthofuran synthase[J]. Proceedings of the National Academy of Sciences of the United States of America,2001,98(15):8915-8920.
[13]Carretero-Paulet L,Cairó A,Botella-Pavía P,et al. Enhanced flux through the methylerythritol 4-phosphate pathway in Arabidopsis plants overexpressing deoxyxylulose 5-phosphate reductoisomerase[J]. Plant Molecular Biology,2006,62(4/5):683-695.
[14]Graham I A,Besser K,Blumer S,et al. The genetic map of Artemisia annua L.identifies loci affecting yield of the antimalarial drugartemisinin[J]. Science,2010,327(5963):328-331.
[15]Seetang-Nun Y,Sharkey T D,Suvachittanont W.Molecular cloning and characterization of two cDNAs encoding 1-deoxy-D-xylulose 5-phosphate reductoisomerase from Hevea brasiliensis[J]. Journal of Plant Physiology,2008,165(9):991-1002.
[16]Yao H,Gong Y,Zuo K,et al. Molecular cloning,expression profiling and functional analysis of a DXR gene encoding 1-deoxy-D-xylulose 5-phosphate reductoisomerase from Camptotheca acuminata[J]. Journal of Plant Physiology,2008,165(2):203-213.
[17]Souret F F,Weathers P J,Wobbe K K.The mevalonate-independent pathway is expressed in transformed roots of Artemisia annua and regulated by light and culture age[J]. In vitro Cellular & Developmental Biology-Plant,2002,38(6):581-588.
[18]Wilkins M R,Gasteiger E,Bairoch A,et al. Protein identification and analysis tools in the ExPASy server[J]. Methods in Molecular Biology,1999,112(112):531-552.
[19]Emanuelsson O,Brunak S,Von Heijne G,et al. Locating proteins in the cell using TargetP,SignalP and related tools[J]. NatureProtocols,2007,2(4):953-971.
[20]Petersen T N,Brunak S,Von Heijne G,et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature Methods,2011,8(10):785-786.
[21]Mller S,Croning M D,Apweiler R.Evaluation of methods for the prediction of membrane spanning regions[J]. Bioinformatics,2001,17(7):646-653.
[22]Horton P,Park K J,Obayashi T,et al. WoLF PSORT:protein localization predictor[J]. Nucleic Acids Research,2007,35(Web Server issue):W585-W587.
[23]Blom N,Gammeltoft S,Brunak S.Sequence and structure-based prediction of eukaryotic protein phosphorylation sites[J]. Journal of Molecular Biology,1999,294(5):1351-1362.
[24]Gascuel O,Steel M.Neighbor-Joining revealed[J]. MolecularBiology & Evolution,2006,23(11):1997-2000.
[25]Franceschini A,Szklarczyk D,F(xiàn)rankild S,et al. STRING v9.1:protein-protein interaction networks,with increased coverage andintegration[J]. Nucleic Acids Research,2013,41:D808-D815.
[26]Miller L H,Su X.Artemisinin:discovery from the Chinese herbal garden[J]. Cell,2011,146(6):855-858.