韋海忠,潘麗芹,田盛野,湯紫依,何海葉,張慧娟,蔣 明*
1.臺州科技職業(yè)學(xué)院,浙江 黃巖 318020
2.臺州學(xué)院生命科學(xué)學(xué)院,浙江 椒江 318000
鐵線蓮屬ClematisL.為毛茛科(Ranunculaceae)多年生木質(zhì)或草質(zhì)藤本植物,少數(shù)為直立灌木或草本,全世界約有300種,主要產(chǎn)于熱帶、亞熱帶和寒帶地區(qū),我國有100多種,全國各地均有分布[1]。鐵線蓮屬植物的不少種類具有較好的藥用價值,《中國藥典》2020年版記載,小木通C.armandiiFranch.、繡球藤C.montanaBuch.-Ham.ex DC.、威靈仙C.chinensisOsbeck、棉團鐵線蓮C.hexapetalaPall.和東北鐵線蓮C.manshuricaRupr.等植物的干燥藤莖、根或根莖可供藥用[2];《中國民族藥辭典》則記錄了40余種鐵線蓮屬藥用植物,如女萎C.apoofoliaDC.、甘青鐵線蓮C.tangutica(Maxim.) Korsh.、西藏鐵線蓮C.tenuifoliaRoyle和單葉鐵線蓮C.henryiOliv.等[3-4]。鐵線蓮屬植物富含皂苷類、黃酮類、木脂素類、萜類和酚類化合物,具有抗腫瘤、抗炎、鎮(zhèn)痛、抗氧化和抗菌等作用,用于治療風(fēng)濕痹痛、口舌生瘡和筋脈拘攣等[5-6]。
單葉鐵線蓮又名地雷根、雪里開、拐子藥等,為木質(zhì)藤本植物,根部膨大、單葉對生、花萼白色或淡黃色(圖1)。單葉鐵線蓮在我國的分布范圍較廣,長江流域各省均有,生長在溪邊、山谷、林下、路旁和灌叢等,是一種民間十分常用的中草藥[1]。單葉鐵線蓮的根和葉可供藥用,含熊果酸、胡蘿卜苷、甘露醇和皂苷等,具有行氣活血、清熱解毒和消腫止痛等功效[7-9]。目前,有關(guān)單葉鐵線蓮的研究集中在化學(xué)成分、組織培養(yǎng)、資源調(diào)查和藥理作用等方面,而該植物葉綠體基因組相關(guān)的研究未見報道[7-10]。葉綠體基因的數(shù)量較少,但它們在光合作用及氨基酸、激素、維生素和次生代謝物生物合成中起中重要作用,而葉綠體基因組在解析植物系統(tǒng)發(fā)育地位、物種鑒定、進化分析等方面有著重要意義[11]。近年來,已有部分鐵線蓮屬植物的葉綠體完成了組裝,如繡球藤、灌木鐵線蓮C.fruticosaTurcz.、牯牛鐵線蓮C.guniuensisW.Y.Ni, R.B.Wang et S.B.Zhou等,明確了它們的基因組結(jié)構(gòu)、序列特征、基因組成及系統(tǒng)發(fā)育關(guān)系等[11-13]。本研究擬在高通量測序的基礎(chǔ)上組裝單葉鐵線蓮的葉綠體基因組,以明確其序列特征、基因組成及系統(tǒng)發(fā)育關(guān)系,為該藥用植物的遺傳結(jié)構(gòu)和遺傳多樣性研究奠定基礎(chǔ)。
圖1 單葉鐵線蓮Fig.1 C.henryi Oliv.
單葉鐵線蓮的葉片采自浙江省臺州市黃巖區(qū)茅畬鄉(xiāng)山卡村,臺州學(xué)院蔣明教授鑒定為單葉鐵線蓮C.henryiOliv.,伴生植物有雀梅藤Sageretia thea(Osbeck) Johnst.、雞腿堇菜Viola acuminateLedeb.、短尾柯Lithocarpus brevicaudatus(Skan) Hayata、黃檀Dalbergia hupeanaHance和秀麗野海棠Bredia amoenaCogn.等。采集時間為2020年12月,將健康葉片放入取樣袋,帶回實驗室后先用大量的自來水沖洗,再用無菌水清洗3~4次,晾干后置于?80 ℃冰箱備用。
移液槍(德國艾本德公司);高速冷凍離心機(美國貝克曼庫爾特有限公司);電泳儀(北京六一生物科技有限公司);凝膠成像系統(tǒng)(美國Bio-rad公司);Thinkpad移動工作站(聯(lián)想集團有限公司);超低溫冰箱(日本Sanyo電機公司)。
葉片先用液氮快速冷凍,用研棒磨成粉末后采用十六烷基三甲基溴化銨(hexadecyltrimethylammonium bromide,CTAB)法提取基因組DNA,經(jīng)電泳檢測和濃度測定后置于?20 ℃冰箱備用。基因組DNA用超聲波處理,經(jīng)末端修復(fù)、加A尾、加測序接頭、純化、PCR擴增等步驟完成文庫構(gòu)建,再在Illumina高通量測序平臺NovaSeq 6000上測序,獲得原始數(shù)據(jù)。
經(jīng)去除接頭和低質(zhì)量的數(shù)據(jù),獲得clean reads。以轉(zhuǎn)子蓮C.patensMorr.et Decne.的matK(AY515250)基因為種子序列,利用NOVOPlasty軟件的Perl程序拼接單葉鐵線蓮的葉綠體基因組,參數(shù)采用默認值[14]。
利用Geneious prime的Find repeats插件檢測葉綠體基因組的反向重復(fù)(inverted repeat,IR)序列,確定大單拷貝區(qū)(large single copy,LSC)和小單拷貝區(qū)(small single copy,SSC)的范圍。單葉鐵線蓮葉綠體基因組采用Dual Organellar GenoMe Annotator(DOGMA,http://dogma.ccbb.utexas.edu/)注釋,并作手工調(diào)整[15];tRNA的預(yù)測采用tRNAscan-SE(http://lowelab.ucsc.edu/tRNA scan-SE/)和ARAGORN工具[16-17];最后Organellar Genome DRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)生成圈圖,勾選Tidy up annotation,其他參數(shù)采用默認值[18]。
利用MISA(MIcroSAtellite Identification Tool)提供的Perl程序分析簡單重復(fù)序列(Simple sequence repeat,SSR)位點,程序在WINDOWS命令窗口運行。單核苷酸最低重復(fù)次數(shù)設(shè)定為10,二核苷酸最低重復(fù)次數(shù)為5,三核苷酸、四核苷酸、五核苷酸和六核苷酸的最低重復(fù)次數(shù)為4[19]。核苷酸多態(tài)性分析采用DnaSP 5.0軟件,窗口大小、步移尺寸分別設(shè)為600 bp和200 bp。
用于多重比對和系統(tǒng)發(fā)育分析的葉綠體基因組全長序列下載自NCBI數(shù)據(jù)庫,它們是槭葉鐵線蓮C.acerifoliaMaxim.(NC_039844)、曲柄鐵線蓮C.repensFinet et Gagnep.(NC_039578)、長瓣鐵線蓮C.macropetalaLedeb.(NC_041477)、美花鐵線蓮C.potaniniiMaxim.(NC_058760)、繡球藤(NC_057507)、灌木鐵線蓮(MT083932)、甘青鐵線蓮(MK253446)、芹葉鐵線蓮C.aethusifoliaTurcz.(MK253462)、牯牛鐵線蓮(MN527334)、大葉鐵線蓮C.heracleifoliaDC.(KY120885)、鐵線蓮C.floridaThunb.(NC_058885)、轉(zhuǎn)子蓮(MW900175)、柱果鐵線蓮C.uncinataChamp.(NC_039846)、威靈仙(MZ351432)和圓錐鐵線蓮C.ternifloraDC.(KJ956785)等。
MAFFT 7.388程序用于鐵線蓮屬植物及細葉黃烏頭Aconitum barbatumPers.葉綠體基因組的兩兩比對和多重比對,然后采用jModelTest獲得最佳替代模型,最后基于最大似然(Maximum likelihood,ML)法構(gòu)建系統(tǒng)發(fā)育樹[20-22]。建樹時以毛茛科的細葉黃烏頭為外類群,自舉檢測(Bootstrap)次數(shù)為1000。
利用NOVOPlasty的Perl程序完成clean reads的拼接,綜合運用多個軟件或在線工具完成了葉綠體基因組的注釋。結(jié)果表明,單葉鐵線蓮的葉綠體基因組為一個典型的四分體結(jié)構(gòu),由LSC、SSC和2個IR組成(圖2)。葉綠體基因組的全長為159 707 bp,GC值為38.0%;LSC、SSC和IR序列的長度分別為79 449、18 100、31 079 bp,GC值分別為36.3%、31.4%、42.0%。
圖2 單葉鐵線蓮葉綠體基因組Fig.2 Chloroplast genome of C.henryi
基因注釋結(jié)果表明,單葉鐵線蓮葉綠體基因組共有137個基因,tRNA基因的數(shù)量最多,共36個,核糖體蛋白大小亞基基因的數(shù)量其次,為31個,其中大亞基基因14個,小亞基基因17個(表1)。tRNA中,trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG和trnV-GAC各有2個拷貝;核糖體蛋白大小亞基基因中,rps3、rps7、rps8、rps12、rps19、rpl2、rpl14、rpl16、rpl22和rpl23也各有2個拷貝;此外,所有核糖體RNA基因、ndhB和ycf2有2個拷貝;Ycf1和infA雖然各有2個拷貝,但其中1份為假基因。trnA-UGC、trnG-UCC、trnI-GAU、trnK-UUU、trnL-UAA、trnV-UAC、rps16、rpl2、rpl16、rpoC1、ndhA、ndhB、petB、petD和atpF各有1個內(nèi)含子,而rps12和ycf3有2個內(nèi)含子。單葉鐵線蓮葉綠體基因組序列已上傳NCBI,登錄號為OM650806。
表1 單葉鐵線蓮葉綠體基因組上的基因Table 1 Genes located on chloroplast genome of C.henryi
經(jīng)MISA檢測,單葉鐵線蓮葉綠體基因組共有41個SSR,其中單核苷酸重復(fù)40個,三核苷酸重復(fù)1個,沒有發(fā)現(xiàn)到其他類型的SSR(表2)。大部分SSR分布在基因間隔區(qū)(intergenic spacer,IGS),共29個,占總數(shù)的70.7%;10個出現(xiàn)在matK、trnG-UCC、rpoB、psbC、rpoA、ccsA和ycf1的編碼區(qū),其中ycf1基因編碼區(qū)內(nèi)有4個SSR;另有2個分別位于atpF和ndhA的內(nèi)含子中。SSR出現(xiàn)在LSR、SSR和IR的次數(shù)分別為25、14和2,反向重復(fù)區(qū)中SSR僅占總數(shù)的4.9%。
表2 單葉鐵線蓮葉綠體基因組SSR的分布Table 2 Distribution of SSRs within C.henryi chloroplast genome
利用DnaSP軟件分析了16種鐵線蓮屬植物葉綠體基因組的核苷酸多態(tài)性,結(jié)果表明,它們的核苷酸多態(tài)性范圍為0~0.023 57,平均值為0.003 252。rps11、ndhF、ndhD和rpl32-trnl-UAG等基因或基因間隔區(qū)具有較高的變異,它們的核苷酸多態(tài)性均大于0.015,其中,基因間隔區(qū)rpl32-trnl-UAG的多態(tài)性最高,ndhD次之,為0.016 9,而rps11、ndhF的多態(tài)性分別為0.016 5和0.015 8(圖3)。
圖3 核苷酸多態(tài)性的滑動窗口分析Fig.3 Sliding window analysis of nucleotide diversity
序列比對結(jié)果表明,單葉鐵線蓮與牯牛鐵線蓮和大葉鐵線蓮的相似性最高,分別達99.6%和99.4%,與外類群細葉黃烏頭的相似性最低,僅79.8%。利用jModelTest工具獲得分子進化模型,結(jié)果表明,GTR+G+I為最佳替代模型,赤池信息標(biāo)準(zhǔn)(akaike information criterion,AIC)與貝葉斯信息標(biāo)準(zhǔn)(bayesian information criterion,BIC)分別為632 080.765 08和632 493.356 54。系統(tǒng)發(fā)育分析結(jié)果表明,17種鐵線蓮屬植物在ML樹上取為4組,繡球藤與美花鐵線蓮聚于一組,槭葉鐵線蓮、曲柄鐵線蓮和長瓣鐵線蓮聚為一組,鐵線蓮、轉(zhuǎn)子蓮、柱果鐵線蓮、圓錐鐵線蓮和威靈仙聚于另一組,單葉鐵線蓮先與大葉鐵線蓮和牯牛鐵線蓮聚于一個分支,支持率達100%,它們再與灌木鐵線蓮、甘青鐵線蓮和芹葉鐵線蓮聚為一組,支持率為99%(圖4)。
圖4 基于葉綠體基因組序列構(gòu)建的系統(tǒng)發(fā)育樹Fig.4 A phylogenetic tree constructed based on chloroplast genome sequences
葉綠體是綠色植物和藻類的重要細胞器,它將光能轉(zhuǎn)換成化學(xué)能,并把二氧化碳同化為碳水化合物;葉綠體起源于藍藻,并保留很多古老的特征,葉綠體自帶基因組,基因參與光合作用、硫同化、脂類代謝及淀粉、色素、激素和氨基酸等的生物合成[23-24]。葉綠體基因組的大小通常為120 000~170 000 bp,植物葉綠體基因組的結(jié)構(gòu)、基因的組成及排列的順序具有一定的保守性[25]。鐵線蓮屬植物葉綠體基因組大小在159 500 bp左右,如繡球藤、灌木鐵線蓮和牯牛鐵線蓮的葉綠體基因組大小分別為159 523、159 683、159 682 bp[13]。本研究中,單葉鐵線蓮的葉綠體基因組為159 707 bp,序列長度與已組裝完成的同屬物種差異不大[11-13]。葉綠體基因組呈環(huán)狀,通??煞殖?個部分,即LSC、SSC和2個反向重復(fù)區(qū)IR(IRA和IRB),但也有例外,如松科(Pinaceae)植物中IRB缺失,柏類植物中IRA丟失[26-27]。本研究中,單葉鐵線蓮的葉綠體基因組為典型的四分體結(jié)構(gòu),即由LSC、SSC、IRA和IRB組成。
假基因化在葉綠體基因組中十分常見,堿基突變、插入或缺失等引起編碼區(qū)產(chǎn)生終止密碼子是假基因化較為常見的原因。在鴨跖草亞科(Commelinoideae)中,accD、rpoA和ycf15發(fā)生假基因化,它們由堿基插入或缺失引起,而杜若Pollia japonicaThunb.和鉤毛子草Rhopalephora scaberrima(Blume) Faden中ndhB的假基因化則由點突變引起[28]。產(chǎn)生假基因的另一種情況是編碼區(qū)截短,通常發(fā)生在邊界部分,如毛茛科烏頭A.carmichaeliiDebeaux和黃花烏頭A.coreanum(Lévl.) Rapaics的ycf1位于IRA與SSC的邊界,導(dǎo)致其假基因化[29]。本研究中,ycf1有2份拷貝,它們分別位于IRB/SSC和SSC/IRA的邊界,前者發(fā)生截短現(xiàn)象,成為假基因,另1份拷貝則正常,除ycf1外,2份infA中的1個拷貝也為假基因;類似的現(xiàn)象發(fā)生在牯牛鐵線蓮葉綠體基因組中,它的ycf1和infA均有2份拷貝,其中1份為假基因,不同的是,牯牛鐵線蓮的rpl32和ndhK也為假基因[13]。infA是葉綠體中蛋白翻譯起始的重要成分,該編碼蛋白基因假基因化現(xiàn)象十分普遍,假基因化的主要原因為有害突變的積累,包括堿基插入、缺失和替換等[30]。Millen等[31]對16屬17種茄科植物葉綠體基因組進行研究,發(fā)現(xiàn)所有物種的infA都是假基因,部分缺少起始密碼子,3個物種發(fā)生移碼框突變,而番茄Lycopersicon esculentumMiller葉綠體基因組的infA缺失前面124個堿基。在本研究中,單葉鐵線蓮infA的假基因化源于3’端序列的缺失。
SSR是指由1~6個核苷酸組成的基本單元經(jīng)多次重復(fù)形成的一段DNA,它們分布在葉綠體基因組的不同部位。與核基因組相比,葉綠體基因組較小,SSR數(shù)量相對較少,但也可用于物種鑒定和分子輔助育種。Liu等[32]以圓錐鐵線蓮葉綠體基因組為參照,開發(fā)SSR標(biāo)記對11個鐵線蓮屬植物的43個個體進行測試,發(fā)現(xiàn)SSR可將這些物種完全區(qū)分開。褐毛鐵線蓮變種C.fuscavar.coreanaTurcz.葉綠體基因組中有67個SSR,其中單核苷酸重復(fù)50個,二核苷酸-四核苷酸重復(fù)共17個[33]。本研究中,單葉鐵線蓮葉綠體基因組共有41個SSR,數(shù)量遠少于褐毛鐵線蓮,另外,SSR類型也較少,僅2種,即單核苷酸重復(fù)和三核苷酸重復(fù),其中單核苷酸重復(fù)占97.6%。SSR的數(shù)量和類型與物種相關(guān),甚至在同一物種不同品種間也存在差異,可用于物種鑒定和親緣關(guān)系分析等[34]。單葉鐵線蓮在分類學(xué)上屬于尾葉鐵線蓮組Sect.Viorna尾葉鐵線蓮亞組Subsect.Connatae,基于葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹上,單葉鐵線蓮與同為尾葉鐵線蓮亞組的大葉鐵線蓮和牯牛鐵線蓮聚為一組,支持率達100%,分子聚類結(jié)果與形態(tài)分類一致。
本研究以以藥用植物單葉鐵線蓮葉片為材料,經(jīng)過DNA提取、文庫構(gòu)建、高通量測序、組裝和序列分析,明確了葉綠體因組的序列特征和系統(tǒng)發(fā)育關(guān)系,為后續(xù)開展該藥用植物的遺傳結(jié)構(gòu)和遺傳多樣性研究打下了基礎(chǔ)。
利益沖突所有作者均聲明不存在利益沖突