劉攀峰,吳 敏,杜紅巖
(1.中國(guó)林業(yè)科學(xué)研究院 經(jīng)濟(jì)林研究開(kāi)發(fā)中心,河南 鄭州 450003;2.國(guó)家林業(yè)局杜仲工程技術(shù)研究中心,河南 鄭州 450003)
萜存在于幾乎所有的生命形式中,是自然界最大的一類天然產(chǎn)物家族,也是植物中種類最為繁多的一類天然產(chǎn)物[1]。萜類骨架以異戊二烯(isoprene)為基本單元,它的生物合成是由異戊 二 烯 焦 磷 酸(isopentenyl diphosphate,IPP)與其異構(gòu)體二甲基丙烯基焦磷酸(dimethylallyl diphosphate,DMAPP),以及二者縮合形成中間產(chǎn)物相互之間的聚合反應(yīng)[2]。異戊烯基焦磷酸異構(gòu)酶(isopentenyl diphosphate isomerase,IPI)催化IPP的碳碳雙鍵與DMAPP親電丙烯基間的可逆轉(zhuǎn)化,被視作整個(gè)萜類代謝網(wǎng)絡(luò)的一個(gè)樞紐[3-4]。目前認(rèn)為有2類結(jié)構(gòu)迥異的非同源IPI蛋白家族[5-6],I型IPI在植物中廣泛存在并且基因序列十分保守,多有2個(gè)或2個(gè)以上基因亞型存在,序列較長(zhǎng)的I型IPI基因多定位于質(zhì)體,而較短的多定位于細(xì)胞質(zhì);此外,線粒體、過(guò)氧化物酶體也發(fā)現(xiàn)有IPI存在。IPP可從細(xì)胞質(zhì)向各種細(xì)胞器中擴(kuò)散,有研究推斷是由于IPP有膜通透性,也可能是存在一種特殊的轉(zhuǎn)運(yùn)機(jī)制。II型IPI基因序列較長(zhǎng),一般編碼300個(gè)氨基酸以上,其活性位點(diǎn)幾乎分布于整個(gè)氨基酸序列[4]。
目前認(rèn)為IPI為關(guān)鍵基因調(diào)控萜類代謝途徑,大腸桿菌Escherichia coli中通過(guò)外源表達(dá)IPI基因發(fā)現(xiàn)番茄紅素與類胡蘿卜素產(chǎn)量明顯提高[7-8];山榛Corylus avellanaL.IPI基因在根、莖、葉中均有表達(dá)且以根表達(dá)量相對(duì)較高,并有試驗(yàn)推斷CaIPI能影響植株中紫杉醇的合成[9];而有關(guān)橡膠Hevea brasiliensis(Willd.ex A.Juss.)Muell.Arg.的研究認(rèn)為IPI基因的表達(dá)情況是萜類合成路徑的關(guān)鍵步驟,并認(rèn)為創(chuàng)傷不會(huì)影響植株IPI基因的表達(dá)水平[10]。也有試驗(yàn)指出,外界刺激對(duì)IPI活性也產(chǎn)生一定影響,在高光及高鹽環(huán)境下會(huì)誘導(dǎo)煙草Nicotiana tabacumL.IPI mRNA的合成,但是否會(huì)影響IPI活性尚待進(jìn)一步證實(shí)。
杜仲Eucommia ulmoidesOliv.是世界上極少數(shù)分布于溫帶、亞熱帶能生產(chǎn)優(yōu)質(zhì)天然橡膠的木本植物[11-12]。杜仲膠、京尼平苷和桃葉珊瑚苷等諸多杜仲萜類具有重要的產(chǎn)業(yè)應(yīng)用價(jià)值,在橡膠工業(yè)、航空航天、國(guó)防、船舶、化工、醫(yī)療、體育等國(guó)民經(jīng)濟(jì)許多部門引起廣泛關(guān)注[13-16]。對(duì)杜仲IPI基因結(jié)構(gòu)與功能開(kāi)展的研究不多,本研究試通過(guò)闡明杜仲IPI基因序列、結(jié)構(gòu)特征并分析其作用機(jī)理,以期為杜仲萜類生物調(diào)控和分子育種提供基礎(chǔ)資料。
2011年4月下旬,在中國(guó)林業(yè)科學(xué)研究院經(jīng)濟(jì)林研究開(kāi)發(fā)中心采集 “華仲6號(hào)”杜仲幼嫩葉片,用清水沖洗表面雜質(zhì)后,帶回室內(nèi)于液氮中-80℃保存?zhèn)溆谩?/p>
MightyAmp DNA Polymerase Ver.2(Takara,大連),3’-Full RACE Core Set(Takara,大連),M-MLV RTase cDNA Synthesis Kit(Takara,大連),5’-Full RACE Kit(Takara,大連),氯化鋰(Amresco,美國(guó)),CTAB(Amresco,美國(guó)),瓊脂糖凝膠DNA回收試劑盒(天根,北京),DH5α感受態(tài)細(xì)胞(天根,北京),SDS(上海生工,上海),DEPC(Sigma,德國(guó)),pEASY-T1 Cloning Kit(全式金,北京),PVP(Amresco,美國(guó))。
通過(guò)改良CTAB-LiCl法進(jìn)行杜仲葉片RNA的提取[17],并依照M-MLV RTase cDNA Synthesis Kit進(jìn)行杜仲單鏈cDNA的合成。
由杜仲轉(zhuǎn)錄組測(cè)序中已知的IPI unigene序列,設(shè) 計(jì) 引 物 5′-TCCTTCTCTATTCGCCTCATCC-3′/5′ATGTTCGCCCCACTTCC-3′擴(kuò) 增 IPI基 因 特異片段;后結(jié)合試劑盒錨定引物序列,設(shè)計(jì)3′RACE 巢 式 擴(kuò) 增的 引 物 5′-CTCCTTCAGC AACGATCAGG-3′/5′-CTGAG GATGTTCCAGT CGAT-3′,以及 5′RACE 巢式擴(kuò)增引物 5′-CGTCC ACACCAAAGGGAATGTTAC-3′/5′-CCACCAAA ATACATTCGTCCTC-3′。
基因全長(zhǎng)末端擴(kuò)增反應(yīng)體系與反應(yīng)條件參照Takara 3′-Full RACE Core Set Ver.2.0 與 Takara 5′-Full RACE Kit 說(shuō)明操作。
基因片段回收按TIANGEN通用型DNA回收試劑盒進(jìn)行,擴(kuò)增片段連接按pEAZY-T克隆試劑盒進(jìn)行,基因片段測(cè)序由金斯瑞公司(南京)完成。
序列相似性檢索由NCBI(http://www.ncbi.nlm.nih.gov)Blast程序完成;蛋白質(zhì)氨基酸組成、相對(duì)分子質(zhì)量、理論等電點(diǎn)以及功能位點(diǎn)分析由ExPASy(http://cn.expasy.org)ProtParam 程 序 與ScanProsite程序完成;蛋白質(zhì)細(xì)胞定位及二級(jí)結(jié)構(gòu)預(yù)測(cè)由Predict Protein(http://www.predictprotein.org/)以 及 PSIPRED方 法(http://bioinf.cs.ucl.ac.uk/psipred)完成[18];轉(zhuǎn)運(yùn)肽預(yù)測(cè)由ChloroP 1.1 Server(http://www.cbs.dtu.dk/services/ChloroP/)完成[19];蛋白質(zhì)同源建模由SWISS-MODEL程序(http://swissmodel.expasy.org/)完 成[20];蛋白質(zhì)序列多重比對(duì)由Lasergene軟件完成;基因系統(tǒng)進(jìn)化樹(shù)構(gòu)建由MEGA 5軟件完成[21];氨基酸序列無(wú)序性分析由在線程序FoldIndex(http://bip.weizmann.ac.il/ fl dbin/ fi ndex)完成[22]。
在逆轉(zhuǎn)錄cDNA模板上分別擴(kuò)增出3條杜仲IPI基因特異片段,測(cè)序拼接后得到1條1 231 bp的基因序列,如圖1、圖2所示。與喜樹(shù)Camptotheca acuminataDecne.(AF031079.1)、歐洲榛Corylus avellanaL.(EF553533.1)、番薯Ipomoea batatas(L.)Lamarck(AB499048.1)、 番 茄Lycopersicon esculentumMiller.(NM_001247924.1)、長(zhǎng) 春 花Catharanthus roseus(L.)G.Don.(EU135981.1)、葛 根Pueraria lobataOhwi.(AY315650.1)IPI全長(zhǎng)基因序列的相似性分別為84%、84%、83%、84%、83%、82%。通過(guò)ORF fi nder程序查到1個(gè)長(zhǎng)921 bp的開(kāi)放閱讀框,與歐洲榛(ABW06959.1)、葡萄Vitis viniferaL.(XP_002277935.1)、煙 草Nicotiana tabacumL.(BAB40974.1)、番茄(NP_001234853.1)、丹參Salvia miltiorrhizaBunge(ABV08818.1)、番薯(BAI47570.1)IPI氨基酸序列的相似性分別為78%、77%、72%、92%、86%、91%,確定為杜仲IPI基因cDNA全長(zhǎng)序列,將其命名為EuIPI。
圖1 EuIPI基因RT-PCR擴(kuò)增的瓊脂糖凝膠電泳Fig.1 Agarose gel electrophoresis of RT-PCR ampli fi cation of EuIPI
圖2 EuIPI全長(zhǎng)cDNA及推導(dǎo)的氨基酸序列Fig.2 Full-length sequence of EuIPI cDNA and the deduced amino acid sequences
預(yù)測(cè)編碼蛋白相對(duì)分子質(zhì)量為34.65kD,理論等電點(diǎn)5.40;氨基酸組成以亮氨酸(12.7%)、絲氨酸(10.1%)、纈氨酸(6.9%)和丙氨酸(6.9%)含量最高,蛋白不穩(wěn)定系數(shù)為42.38,屬不穩(wěn)定蛋白質(zhì)。預(yù)測(cè)EuIPI亞細(xì)胞定位于葉綠體上,其中TargetP 1.1 Server預(yù)測(cè)分值為0.945,可靠性為Ⅱ級(jí)。多重比對(duì)結(jié)果顯示,EuIPI氨基酸序列包含植物IPI蛋白保守的NTCCSHPL基序和WGEHELDYLL基序,以及催化過(guò)程中所需要的Mg2+結(jié)合位點(diǎn)(A154、A175)和Zn2+結(jié)合位點(diǎn)(A107、A119、A156、A196、A206、A208)等功能位點(diǎn)。5 種同源IPI序列多重比對(duì)后相同的氨基酸位點(diǎn)達(dá)47個(gè),植物IPI蛋白N端比大腸桿菌多出一段80~90個(gè)氨基酸殘基的蛋白序列,說(shuō)明在這段區(qū)域中可能存在轉(zhuǎn)運(yùn)肽,推導(dǎo)EuIPI蛋白轉(zhuǎn)運(yùn)肽序列長(zhǎng)70個(gè)氨基酸殘基,去除轉(zhuǎn)運(yùn)肽序列后EuIPI蛋白的相對(duì)分子質(zhì)量為27.25kD(見(jiàn)圖3)。
在線預(yù)測(cè)EuIPI蛋白二級(jí)結(jié)構(gòu)α-螺旋22.55%,β-折疊13.40%,螺環(huán)結(jié)構(gòu)64.05%,屬混合型蛋白質(zhì)(見(jiàn)圖4)。分析結(jié)果顯示,EuIPI為多結(jié)構(gòu)域蛋白,分屬Nudix水解酶蛋白家族,包括金屬離子結(jié)合位點(diǎn)和nudix 基序等功能結(jié)構(gòu)(見(jiàn)圖5)。
圖3 推導(dǎo)EuIPI 同源序列的多重比對(duì)Fig.3 Multiple alignment of the deduced EuIPI homologous sequences
圖4 推導(dǎo)EuIPI蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.4 Prediction of secondary structure of the deduced EuIPI protein
圖5 推導(dǎo)EuIPI蛋白的保守結(jié)構(gòu)域預(yù)測(cè)Fig.5 Prediction of conserved domains of the deduced EuIPI protein
以人Homo sapiens IPI蛋白(2i6k)為模板對(duì)EuIPI蛋白質(zhì)同源建模,程序評(píng)測(cè)推導(dǎo)的EuIPI蛋白模型QMEAN4得分0.715,與模板蛋白序列相似性50.66%,從三維模型圖中可以看出EuIPI空間上以單體形式存在,主要保守基序位于分子結(jié)構(gòu)中部(見(jiàn)圖6)。
圖6 推導(dǎo)EuIPI蛋白三級(jí)結(jié)構(gòu)的預(yù)測(cè)Fig.6 Prediction of tertiary structure of the deduced EuIPI protein
程序分析EuIPI基序類型分4種,含10個(gè)潛在的功能位點(diǎn),包括2個(gè)蛋白激酶C磷酸化位點(diǎn)(SnK,26-28;SfR,50-52);2個(gè)N端糖基化位 點(diǎn)(NKSR,27-30;NQSA,303-306);3個(gè)N端豆蔻?;稽c(diǎn)(GAarTR,43-48;GTkvTF,140-145;GVrnAA,171-176);3個(gè)酪蛋白激酶Ⅱ磷酸化位點(diǎn)(SgmD,73-76;SkyE,129-132;TlqE,286-289)。軟件預(yù)測(cè)出18個(gè)EuIPI蛋白翻譯后磷酸化修飾位點(diǎn),包括11個(gè)絲氨酸磷酸化位 點(diǎn)(A16、A17、A26、A29、A31、A33、A36、A41、A49、A50、A73),2個(gè)蘇氨酸磷酸化位點(diǎn)(A102、A141)以及5個(gè)酪氨酸磷酸化位點(diǎn)(A34、A104、A131、A159、A241)(見(jiàn)圖 7)。
圖7 推導(dǎo)EuIPI蛋白翻譯后磷酸化位點(diǎn)預(yù)測(cè)Fig.7 Prediction of phosphorylation sites of deduced EuIPI protein
利用 ClustalW法對(duì)20個(gè)IPI同源蛋白進(jìn)行序列比對(duì),并用Neighbor-joining法構(gòu)建系統(tǒng)進(jìn)化樹(shù),如圖8所示。發(fā)現(xiàn)不同來(lái)源的IPI蛋白在進(jìn)化上具有較明顯的界限。其中推導(dǎo)EuIPI蛋白與歐洲榛IPI蛋白親緣關(guān)系最為接近,進(jìn)化距離為0.061,其次為水稻Oryza latifoliaDesv.(0.075)、丹參(0.082)、玉米Zea maysL.(0.082)、毛果楊Populus trichocarpaTorr.& Gray.(0.082)和喜樹(shù)(0.089)。
圖8 IPI同源蛋白的系統(tǒng)進(jìn)化樹(shù)構(gòu)建Fig.8 Construction of phylogenetic tree of IPI homologous protein
FoldIndex無(wú)序性分析對(duì)EuIPI氨基酸序列中共預(yù)測(cè)出2個(gè)無(wú)序化區(qū)域,分別為A87~A97,A218~A240,總的無(wú)序化氨基酸數(shù)目為34個(gè),無(wú)序化比例達(dá)11.11%,最長(zhǎng)的1段無(wú)序化區(qū)域包含23個(gè)氨基酸殘基(見(jiàn)圖9)。
Profun 2.2 Server預(yù)測(cè)蛋白功能的結(jié)果見(jiàn)表1。從表1可看出,EuIPI作為酶蛋白的概率(0.770)和比數(shù)(2.690)大于非酶蛋白,并可能屬于連接酶類,參與氨基酸生物合成的可能性(概率為0.282;比數(shù)為12.813)最高,而作為植物免疫反應(yīng)基因本體的可能性(概率為0.147;比數(shù)為1.727)最大。
圖9 EuIPI氨基酸序列的無(wú)序化分析Fig.9 Disordered analysis of the deduced EuIPI amino acid sequence
諸多植物萜類合成都需要有IPI異構(gòu)酶的參與,植物中IPI基因最早于1995年在花香基因模式植物仙女扇Clarkia breweri中分離出,后在擬南芥全基因組發(fā)現(xiàn)2個(gè)IPI編碼基因,并將其分別命名為IPI1和IPI2[5,23],至今有近2 000余條IPI基因相關(guān)核酸序列在GenBank注冊(cè),包括細(xì)菌、古細(xì)菌以及真核生物等。序列分析結(jié)果說(shuō)明本研究從杜仲中分離出的EuIPI與其它植物IPI基因有很高的同源性,所推導(dǎo)EuIPI氨基酸序列包含植物IPI蛋白保守的NTCCSHPL基序和WGEHELDYLL基序,并推測(cè)出多個(gè)潛在功能位點(diǎn),分析結(jié)果預(yù)示從杜仲中分離出的EuIPI為一功能蛋白的編碼基因,是高等植物IPI基因家族的新成員。
有39種IPI蛋白晶體模型在PDB數(shù)據(jù)庫(kù)中注冊(cè),目前認(rèn)為有2類結(jié)構(gòu)迥異的非同源蛋白家族作用于IPP與DMAPP間的異構(gòu)化過(guò)程。I型IPP蛋白于20世紀(jì)50年代首先被發(fā)現(xiàn),存在于幾乎所有真核生物及細(xì)菌中,其反應(yīng)過(guò)程需要2價(jià)金屬離子的參與。與II型IPI相比,I型IPI蛋白序列較短,具有保守的NXXXCXHP與EXE基序以及富甘氨酸序列,其催化機(jī)理可能依賴于通過(guò)生成3位碳正離子中間產(chǎn)物而實(shí)現(xiàn)的質(zhì)子化與去質(zhì)子作用,這個(gè)機(jī)制此前較少提出但得到來(lái)自生物信息學(xué)和酶學(xué)的試驗(yàn)證據(jù)的支持[3,24]。II型IPI發(fā)現(xiàn)較晚,被認(rèn)為屬于黃素酶家族,常見(jiàn)于缺氧、高鹽、高溫、高酸以及貧瘠等嚴(yán)酷條件生長(zhǎng)的細(xì)菌及所有已知的古細(xì)菌中,特別是嗜熱菌Thermophilic bacteria和超嗜熱菌中極為普遍。II型IPI反應(yīng)過(guò)程需要黃素蛋白、NAD(P)H以及2價(jià)金屬離子的參與,NAD(P)H被認(rèn)為用于還原黃素蛋白并生成IPI蛋白與還原型FMN的中間產(chǎn)物,但黃素蛋白在反應(yīng)過(guò)程中的作用機(jī)制目前尚不清楚。IPP與DMAPP之間最為可能的轉(zhuǎn)換機(jī)制為依賴于1,3位氫原子異位時(shí)的立體選擇性,但其異構(gòu)化過(guò)程究竟以那類IPI酶為主導(dǎo)至今還沒(méi)有定論[3]。序列分析說(shuō)明本研究EuIPI編碼蛋白屬于I型IPP蛋白,但其在杜仲萜類生物合成所扮演的角色尚待進(jìn)一步確定。
[1] Eric O,Lin F Y.Terpene biosynthesis:modularity rules[J].Angewandte Chemie,2012,51(5):1124-1137.
[2] Nobuaki S,Hirotaka U,Takashi N,et al.Construction and analysis of EST libraries of the trans-polyisoprene producing plant,Eucommia ulmoidesOliver[J] Planta,2012,236(5):1405.
[3] Zheng W,Sun F,Mark B,et al.The crystal Structure of human isopentenyl diphosphate isomerase at 1.7 ? resolution reveals its catalytic mechanism in isoprenoid biosynthesis[J].J Mol Biol,2007,366:1447-1458.
[4] Karine B,Yannick E,Alain D,et al.Isopentenyl Diphosphate Isomerase: A checkpoint to isoprenoid biosynthesis[J].Biochimi,2012,94(8):1621-1634.
[5] Michael C,Frederick MH,C Dale P,et al.Analysis of the isopentenyl diphosphate isomerase gene family fromArabidopsis thaliana[J].Plant Mol Biol,1998,36:323-328.
[6] Rapha?l D,Jérǒme de R,Virginie,et al.Overexpression,physicochemical characterization,and modeling of a hyperthermophilic pyrococcus furiosus type 2 IPP isomerase[J].Proteins,2008,71(4):1699-1707.
[7] Jin S,Yu-Yang Z,Hui L,et al.A novel cytoplasmic isopentenyl diphosphate isomerase gene from tomato (Solanumlycopersicum): cloning,expression,and color complementation[J].Plant Mol Biol Rep,2010,28:473-480.
[8] 化文平,王喆之.向日葵異戊烯焦磷酸異構(gòu)酶基因(ipi)的電子克隆和生物信息學(xué)分析[J].植物生理學(xué)通訊,2008,44(1):8l-86.
[9] 汪業(yè)春,唐克軒.山榛中異戊烯焦磷酸異構(gòu)酶基因的克隆及分析[J].中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2007,9(4):95-100.
[10] Soo KO,Hunseung K,Dong HS,et al.Molecular cloning and characterization of a functional cDNA clone encoding isopentenyl diphosphate isomerase fromHevea brasiliensis[J].J Plant Physiol,2000,157:549-557.
[11] 杜紅巖,胡文臻,俞 銳.杜仲產(chǎn)業(yè)綠皮書(shū):中國(guó)杜仲橡膠資源與產(chǎn)業(yè)發(fā)展報(bào)告[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2013.
[12] 杜紅巖,李 欽,杜蘭英,等.杜仲雄花茶營(yíng)養(yǎng)成分的測(cè)定分析[J].中南林業(yè)科技大學(xué)學(xué)學(xué)報(bào),2007,27(6):88-91.
[13] 劉攀峰,杜紅巖,烏云塔娜,等.杜仲1-脫氧-D-木酮糖-5-磷酸還原異構(gòu)酶基因cDNA全長(zhǎng)克隆與序列分析[J].林業(yè)科學(xué)研究,2012,25(2):195-200.
[14] 杜紅巖,劉昌勇,李 欽,等.杜仲葉中3 種主要活性成分含量的季節(jié)變化[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2013,31(8):6-9.
[15] 杜紅巖.杜仲活性成分與藥理研究的新進(jìn)展[J].經(jīng)濟(jì)林研究,2003,21(2):58-61.
[16] 杜紅巖.我國(guó)的杜仲膠資源及其開(kāi)發(fā)潛力與產(chǎn)業(yè)發(fā)展思路[J].經(jīng)濟(jì)林研究,2010,28(3):1-6.
[17] 周明兵,王紅珍,趙德剛.杜仲葉和樹(shù)皮總RNA的快速提取法[J].山地農(nóng)業(yè)生物學(xué)報(bào),2003,22(5):430-431.
[18] Jones DT.Protein secondary structure prediction based on position-speci fi c scoring matrices [J].J Mol Biol,1999,292(2):195-202.
[19] Emanuelsson O,Nielsen H,von Heijne G.ChloroP,a neural network-based method for predicting chloroplast transit peptides and their cleavage sites[J].Protein Sci,1999,(8): 978-984.
[20] Arnold K,Bordoli L,Kopp J,et al.The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling[J].Bioinformatics,2006,22:195-201.
[21] Tamura K,Peterson D,Peterson N,et al.MEGA5: Molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J].Mol Biol Evol,2011,28:2731-2739.
[22] Prilusky J,Felder CE,Zeev-Ben-Mordehai T,et al.A simple tool to predict whether a given protein sequence is intrinsically unfolded[J].Bioinformatics,2005,21(16):3435-3438.
[23] Blanc V M,Pichersky E.Nucleotide sequence of a Clarkia breweri cDNA clone of IPI1,a gene encoding isopentenyl pyrophosphate isomerase[J].Plant Physiol,1995,108(2): 855-856.
[24] Raphael D,Jerome R,Virginie D,et al.Overexpression,physicochemical characterization,and modeling of a hyperthermophilic pyrococcus furiosus type2 IPP isomerase[J].Proteins,2008,71: 1699-1707.