蔡一鳴,代江鵬,鄭雨欣,任英毅,陳浩明,馮婷婷,高曉霞,朱 爽*
? 藥材與資源 ?
鉤藤屬植物分子鑒定的DNA條形碼篩選
蔡一鳴1,代江鵬1,鄭雨欣1,任英毅1,陳浩明1,馮婷婷1,高曉霞2,朱 爽1*
1. 廣東藥科大學(xué)生命科學(xué)與生物制藥學(xué)院 廣東省生物技術(shù)候選藥物研究重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006 2. 廣東藥科大學(xué)藥學(xué)院 廣東 廣州 510006
應(yīng)用分子生物學(xué)鑒定技術(shù),篩選出應(yīng)用于鑒定鉤藤屬物種的最佳DNA條形碼,建立快速、準(zhǔn)確、便捷的鉤藤屬植物鑒定方法。從廣東、廣西等地收集了8個鉤藤屬物種的葉片、莖枝作為材料,共計44份樣品。提取樣品總DNA,分別對條形碼ITS、matK、psbA-trnH、rbcL、trnL-trnF序列進(jìn)行擴(kuò)增、測序、拼接、校對;利用 MEGA 7.0分析比對序列特征;基于TaxonDNA計算種內(nèi)、種間的遺傳距離以分析barcoding gap及Best Match、Best Close Match評估DNA條形碼的鑒別能力;使用MEGA7.0、Phylosuite等軟件構(gòu)建單條形碼及組合條形碼的最大似然法(maximum likelihood,ML)、最大簡約法(maximum parsimony,MP)、貝葉斯推斷法(bayesian inference,BI)系統(tǒng)發(fā)育樹。條形碼ITS、matK、psbA-trnH、rbcL、trnL-trnF序列均擴(kuò)增成功且具有較高的測序成功率,其中psbA-trnH具有最多的變異位點(diǎn),ITS次之,rbcL最少;Best Match、Best Close Match與Barcoding gap分析結(jié)果顯示:5個單一條形碼中,ITS鑒定鉤藤屬物種效果突出且具有明顯的Barcoding gap,而組合條形碼ITS+rbcL序列表現(xiàn)更為優(yōu)異?;谒袉我粭l形碼構(gòu)建的系統(tǒng)發(fā)育樹,ITS序列的物種鑒別成功率最高,能夠準(zhǔn)確鑒定8個鉤藤屬物種;基于組合條形碼構(gòu)建的系統(tǒng)發(fā)育樹,ITS+rbcL序列具有最高的平均節(jié)點(diǎn)支持率,且該序列集包含的11個鉤藤屬物種均能單獨(dú)聚為一支。應(yīng)用ITS+rbcL的序列組合能夠?qū)崿F(xiàn)鉤藤屬不同物種的準(zhǔn)確鑒定。
鉤藤屬;DNA條形碼;物種鑒定;ITS;rbcL;TaxonDNA;系統(tǒng)發(fā)育分析
鉤藤是茜草科(Rubiaceae)鉤藤屬L.的多年常綠木質(zhì)藤本植物。目前,全世界共發(fā)現(xiàn)鉤藤屬植物34種,其中我國有11種及1變異種,對鉤藤的記載最早可追溯至漢末陶景弘的《名醫(yī)別錄》[1],其氣微,味淡,性甘、涼,歸肝、心包經(jīng),具有息風(fēng)定驚、清熱平肝等功效[2]?!吨袊幍洹?020年版規(guī)定鉤藤(Miq.) Miq. ex Havil.、華鉤藤(Oliv.) Havil.、毛鉤藤Havil.、無柄果鉤藤Roxb.和大葉鉤藤Wall.的干燥帶鉤莖枝為中藥材鉤藤[2]。
鉤藤因其較高的藥用價值而受到廣泛關(guān)注。以往人們認(rèn)為它的葉子、鉤莖具有治療哮喘、癌癥、肝硬化、糖尿病、高血壓、中風(fēng)和風(fēng)濕病的功效[3]。過往研究發(fā)現(xiàn)鉤藤具有多種化學(xué)成分,其中主要成分生物堿類、三萜類和黃酮類具有抗高血壓、鎮(zhèn)痛和抗氧化等特性。而現(xiàn)代藥理學(xué)研究表明,鉤藤屬植物具有降壓、鎮(zhèn)靜催眠、抗驚厥、抗癲癇、抗炎、抗癌、抗腫瘤、抗氧化、免疫調(diào)節(jié)、治療偏頭痛等多種作用[4-9]。
列入《中國藥典》的5種藥用鉤藤臨床表現(xiàn)優(yōu)異、用途廣泛,因此需求量亦是劇增。但鉤藤屬物種繁多,且不同種的化學(xué)活性成分與生物活性存在顯著差異,而屬內(nèi)各物種植物形態(tài)相似,難以分辨,因此不良商家常將平滑鉤藤Wal.ex G. Don、攀莖鉤藤(Smith) Hutchins等未列入《中國藥典》的鉤藤植物充當(dāng)藥用鉤藤進(jìn)行銷售販賣[10],此舉不僅銳減鉤藤療效,還嚴(yán)重影響用藥安全,不利于鉤藤藥材市場的良性發(fā)展。以往鉤藤屬植物藥材鑒定多基于傳統(tǒng)形態(tài)學(xué)、顯微結(jié)構(gòu)觀察,也有研究引入分子標(biāo)記方法鑒定鉤藤屬植物,如限制片段長度多態(tài)性(restriction fragment length polymorphism,RFL)、隨機(jī)擴(kuò)增的多態(tài)性DNA (random amplified polymorphic DNA,RAPD)等[11-12]。但以上列舉的方法均具有一定的局限性,當(dāng)植物形態(tài)特征高度相似時,難以用傳統(tǒng)形態(tài)學(xué)、顯微結(jié)構(gòu)觀察等方法進(jìn)行區(qū)分。因此為保證鉤藤用藥安全和消費(fèi)者生命健康,亟需建立一種通用、快速、準(zhǔn)確的鉤藤藥材鑒別方法。
DNA條形碼是將生物體基因組內(nèi)一段較短的、標(biāo)準(zhǔn)的DNA序列作為分子標(biāo)記來對物種進(jìn)行鑒定的技術(shù)。DNA條形碼技術(shù)能夠克服形態(tài)學(xué)鑒定干擾因素多、鑒定準(zhǔn)確率偏低等不足。DNA條形碼在藥用植物鑒定的應(yīng)用具有以下意義:(1)從分子遺傳學(xué)角度鑒定物種,避免主觀因素造成的錯誤鑒定。(2)在分子水平上確保中藥材資源的純正性,保障用藥安全。(3)為傳統(tǒng)中藥材市場的監(jiān)督管理提供行而有效、快捷便利的鑒別方法[13-14]。
DNA條形碼技術(shù)為鉤藤屬植物鑒定提供了嶄新的思路。Tang等[15]基于BLAST1和最近距離法評估5種DNA條形碼(ITS、ITS2、matK、psbA-trnH、rbcL)的鉤藤鑒定能力,得出在這2種方法下 ITS2、psbA-trnH達(dá)到87.0%~95.9%鑒定成功率,適合用于鑒別鉤藤屬物種的結(jié)論。Zhu等[16]使用ITS、ITS2序列,采用Taxon DNA、構(gòu)建系統(tǒng)發(fā)育樹、分析ITS2二級結(jié)構(gòu)等方法鑒定鉤藤屬物種,得到的結(jié)果表明基于Taxon DNA方法的ITS、ITS2序列達(dá)到94.69%~96.97%的鑒定成功率,且ITS系統(tǒng)發(fā)育樹較ITS2具有更多單系支;通過觀察ITS2二級結(jié)構(gòu)可以區(qū)分恒春鉤藤Wall. f.(Benth.) Ridsd和云南鉤藤K. C. Hsia。但以往研究大多基于單條形碼,針對組合條形碼鑒定能力的探究甚微。因此本研究采集涵蓋8個鉤藤物種的44份樣品,結(jié)合從GenBank下載的鉤藤序列構(gòu)建鉤藤屬物種單一條形碼(ITS、matK、rbcL、psbA-trnH、trnL-trnF)及組合條碼數(shù)據(jù)集,并利用基于距離(TaxonDNA)、系統(tǒng)發(fā)育方法分析篩選出鑒定鉤藤屬植物的最佳DNA條形碼。
本研究從廣東、廣西、貴州、云南、湖南、重慶等地收集了涵蓋8個鉤藤物種的44份樣品,并交由廣東藥科大學(xué)曾常青教授鑒定分類。樣品信息詳見表1。
DNA由廣東美格基因科技提供的植物總DNA提取試劑盒提取。使用5種條形碼(ITS、matK、rbcL、psbA-trnH、trnL-trnF)的通用引物對其進(jìn)行PCR擴(kuò)增。PCR反應(yīng)體系、擴(kuò)增引物等詳見表2和表3。所有擴(kuò)增產(chǎn)物交由北京睿博興科生物技術(shù)有限公司純化、雙向測序。
表1 樣品信息
Table 1 Experimental sample information
樣品憑證號樣品類型采集地樣品憑證號樣品類型采集地 侯鉤藤U. rhynchophylloidesGT-1葉片廣東肇慶華鉤藤U. sinensisGT-6枝干廣西梧州 GT-16枝干廣東肇慶GT-7枝干貴州 GT-35葉片廣東肇慶GT-34葉片貴州安順 鉤藤U. rhynchophyllaGT-8枝干廣東廣州北越鉤藤U. homomallaGT-M葉片廣東廣州 GT-17葉片廣東清遠(yuǎn)GT-I葉片云南昆明 GT-18葉片廣東韶關(guān)毛鉤藤U. hirsutaGT-2葉片廣東廣州 GT-19葉片貴州貴陽GT-12葉片廣西梧州 GT-20葉片廣東梅州GT-13枝干廣東肇慶 GT-21葉片廣東清遠(yuǎn)無柄果鉤藤U. sessilifructusGT-10葉片廣西南寧 GT-22葉片廣西梧州GT-15枝干廣西南寧 GT-24葉片廣西梧州GT-23葉片廣西南寧 GT-25葉片廣東廣州GT-30葉片廣西南寧 GT-26葉片廣東梅州GT-B葉片廣西南寧 GT-27葉片貴州天柱GT-K4葉片云南昆明 GT-28葉片貴州麻江GT-KB葉片云南昆明 GT-31葉片貴州開陽大葉鉤藤U. macrophyllaGT-3葉片廣東肇慶 GT-32葉片廣西南寧GT-11葉片廣西南寧 GT-H葉片重慶金佛GT-14枝干廣東肇慶 GT-Hunan葉片湖南懷化GT-29葉片廣東廣州 GT-GZY葉片廣東廣州GT-33葉片廣西南寧 GT-MZh葉片廣東梅州GT-A葉片云南昆明 華鉤藤U. sinensisGT-4葉片重慶金佛平滑鉤藤U. laevigataGT-K6葉片云南昆明
表2 PCR擴(kuò)增體系
Table 2 PCR amplification procedures
條形碼PCR擴(kuò)增反應(yīng)參數(shù)PCR擴(kuò)增反應(yīng)體系 ITS95 ℃、3 min;95 ℃、1 min,56 ℃、50 s,72 ℃、55 s,30 循環(huán);72 ℃、10 min0.2 μL HiFi DNA聚合酶 (5 U·μL?1) atK95 ℃、4 min;92 ℃、30 s,55 ℃、30 s,0.4 μL 正向引物(10 μmol·L?1) psbA-trnH72 ℃、1 min,35循環(huán);72 ℃、10 min0.4 μL 反向引物 (10 μmol·L?1) rbcL72 ℃、1 min,35循環(huán);72 ℃、10 min1.6 μL dNTPs (2.5 mmol·L?1) 2.0 μL 10×Buffer I trnL-trnF94 ℃、5 min;94 ℃、45 s,50 ℃、45 s,72 ℃、90 s,30循環(huán);72 ℃、5 min2.0 μL DNA模板15.4 μL ddH2O
表3 PCR擴(kuò)增引物
Table 3 PCR amplification primers
條形碼引物名稱引物序列 (5’-3’)文獻(xiàn) ITSITS5(F)GGAAGTAAAAGTCGTAACAAGG17 ITS4(R)TCCTCCGCTTATTGATATGC18 matKmatK_FCGTACAGTACTTTTGTGTTTACGAG18 matK_RACCCAGTCCATCTGGAAATCTTGGTTC psbA-trnHpsbA_FGTTATGCATGAACGTAATGCTC19 trnH_RCGCGCATGGTGGATTCACAATCC20 rbcLrbcLa_FATGTCACCACAAACAGAGACTAAAGC21 rbcLa_RGTAAAATCAAGTCCACCYCG trnL-trnFe (F)GGTTCAAGTCCCTCTATCCC22 f (R)ATTTGAACTGGTGACACGAG
測序后得到的原始序列經(jīng)DNAstar 7.1軟件拼接、校對,拼接所得的序列再通過與GenBank已有的鉤藤序列進(jìn)行比對,以確保所得序列的正確性。測序所得序列協(xié)同GenBank下載的鉤藤序列按所屬條形碼歸類并導(dǎo)入MEGA7.0進(jìn)行多序列比對,計算序列長度、變異和信息位點(diǎn)等。本研究從GenBank所獲取的序列列于表4。基于憑證號(voucher number)組合鉤藤屬各單條形碼,拼接形成雙組合、3組合條形碼。而后對完成拼接的組合條形碼進(jìn)行初步篩選,篩選的標(biāo)準(zhǔn)包括條形碼所覆蓋的物種數(shù)和條形碼數(shù)。篩選的意義在于避免實(shí)驗(yàn)結(jié)果因樣本容量過小而出現(xiàn)偏差,保證實(shí)驗(yàn)的客觀性及結(jié)果的可信度。單條形碼或組合條形碼中僅含有一條序列的物種將被剔除,因其缺乏同類參照,在分析過程中必然會歸到錯誤的種類。
表4 從GenBank獲取的鉤藤條形碼序列
Table 4 Uncaria barcodes sequences downloaded from GenBank
條形碼物種拉丁名登錄號 ITSU. hirsutaKM057049-51、GU937110、HW521823、HW521850-52 U. homomallaKF881250-6、KM057053、HW521822、HW521849 U. laevigataKF881266、KF881269-70、HW521826、HW521862-3 U. lancifoliaKF881262-4、KM057052、HW521824、HW521853-5 U. macrophyllaKF881257-61、KM057045-7、HW521827、HW521864-8 U. rhynchophyllaKF881265、KM057043、AJ346900、HW521818、HW521829-38 U. scandensKF881274、KF881276-80、HW521821、HW521845-8 U. sessilifructusKF881249、KM057048、HW521825、HW521856-61 U. sinensisKF881271-73、FJ980386、HW521819、HW521839-42 U. yunnanensisKF881281-4、HW521828、HW521869 matKU. hirsutaKM057059-60 U. homomallaKM057062 U. laevigataKX911093 U. macrophyllaKM057055-7 U. rhynchophyllaKM057054、KP093879-80 U. sessilifructusKM057058 U. tomentosaKJ594075-7 psbA-trnHU. hirsutaKM057038-40 U. homomallaKF881163-9、KM057042 U. laevigataKF881179-82 U. macrophyllaKF881170-5、KM057033-5、GQ435234-5 U. rhynchophyllaKM057031-2、KX346922、KX346980 U. scandensKF881185-9、KF881160-2、KM057036-7 U. sinensisKF881183-4、GQ435236 U. yunnanensisKF881191、KF881193-4 rbcLU. appendiculataJF738676、JF738785、JF739007 U. ellipticaMG816978、MG816980 U. hirsutaKM057026-8 U. homomallaKF881129-33、KM057030、KC737739 U. laevigataKF881142、KF881144、KX910917、KF181471 U. lancifoliaKF881140-1、KC737740、KF181540 U. lanosaKC737741、KU853145 U. macrophyllaKF881134-9、KM057021-3、GQ436558-9 U. rhynchophyllaKM057019-20、KP094819-20 U. scandensKF881149-55、KC737742 U. sessilifructusKF881122-8、KM057024 U. sinensisKF881146-8、GQ436560 U. tomentosaGQ852363、KJ594549-52 U. yunnanensisKF881156-9 trnL-trnFU. homomallaKC737835 U. lanosaKC737837、KU853207 U. rhynchophyllaAB178636、KT218954、AJ346959 U. tomentosaGQ852564、AF152690
鉤藤屬物種的種間、種內(nèi)距離由軟件TaxonDNA基于Kimura-2-Parameter(K2P)雙參數(shù)算法模型計算。使用TaxonDNA的“extreme pairwise”函數(shù)計算每個物種所有序列的最小種間距離和最大種內(nèi)距離,再將不同序列的距離信息繪成散點(diǎn)圖;若序列最大種內(nèi)距離與最小種間距離有較大差值,則認(rèn)為其具有較為顯著的Barcoding gap。
本研究采用TaxonDNA軟件的“Best Match (BM)”“Best Closed Match(BCM)”功能計算鉤藤屬各條形碼的鑒別成功率,并以此作為DNA條形碼鑒別能力的指標(biāo)之一。BM通過查詢目標(biāo)序列與所有同種序列具有的最小距離,以此為基準(zhǔn)分配目標(biāo)序列;BCM則在BM算法的基礎(chǔ)上設(shè)置了5%的閾值(即所有種內(nèi)距離的95%)[23],超過這個閾值的查詢序列被分配為“without any match”,即“no match”。
本研究采用最大似然法(maximum likelihood,ML)、最大簡約法(maximum parsimony,MP)、貝葉斯推斷法(bayesian inference,BI)構(gòu)建序列數(shù)據(jù)集系統(tǒng)發(fā)育樹。使用MEGA7.0軟件構(gòu)建 ML 系統(tǒng)發(fā)育樹,算法模型由MEGA7.0的“Find best DNA/Protein model”功能演算決定,設(shè)置1000次步長檢驗(yàn)并刪除空位(Gap)或缺失數(shù)據(jù)(Missing data)。同樣使用MEGA構(gòu)建MP系統(tǒng)發(fā)育樹,采用Subtree-Pruning-Regrafting(SPR)算法,設(shè)置1000次步長檢驗(yàn)并刪除空位(gap)或缺失數(shù)據(jù)(missing data)。
基于貝葉斯原理結(jié)合Phylosuite軟件構(gòu)建Mrbayes系統(tǒng)發(fā)育樹,選擇WorkFlow“Selete best-fit model then build BI tree”;Modelfinder 序列類型選擇“DNA”,Mrbayes 所用MCMC參數(shù):代數(shù)(generations)=5 000 000、取樣頻率(sampling freq)=100、鏈數(shù)(number of chains)=4、Burnin Fraction=0.25。運(yùn)算結(jié)果保存為*tre格式。
本實(shí)驗(yàn)對所有樣品的條形碼ITS、matK、psbA-trnH、rbcL、trnL-trnF序列進(jìn)行PCR擴(kuò)增與測序,得到相應(yīng)的擴(kuò)增、測序成功率和序列特征信息列于表5。經(jīng)實(shí)驗(yàn)從44份樣品中獲取了213條序列。將實(shí)驗(yàn)得到的序列與GenBank下載的248條序列整合為序列總數(shù)為461的數(shù)據(jù)集,數(shù)據(jù)集涵蓋鉤藤屬19個種。其中matK序列比對長度最長,為841 bp。psbA-trnH序列的變異位點(diǎn)數(shù)量最多,ITS序列變異位點(diǎn)數(shù)僅次于psbA-trnH。rbcL序列涵蓋最多鉤藤種,但變異位點(diǎn)、簡約信息位點(diǎn)均少于其他4個條形碼。
表5 序列特征
Table 5 Sequence characteristic
項(xiàng)目ITSmatKpsbA-trnHrbcLtrnL-trnF 擴(kuò)增成功率/%100.00100100100100 測序成功率/%97.7386.36100100100 物種數(shù)1510111914 比對長度/bp687842356553403 變異位點(diǎn)數(shù)90471411530 簡約信息位點(diǎn)數(shù)6338901120 種內(nèi)距離0~2.480~1.330~7.920~0.790~0.81 種間距離0~5.380~3.182.32~9.250~1.630~4.32
理想的DNA條形碼種內(nèi)距離應(yīng)明顯小于種間距離,兩者之間存在著顯著的差距,即為“Barcoding gap”[24]。本研究運(yùn)用TaxonDNA的“extreme pairwise”函數(shù)得到的物種距離數(shù)據(jù),以物種最大種內(nèi)距離為軸,以最小種間距離為軸繪制散點(diǎn)圖,如圖1所示。散點(diǎn)圖上另繪一條1∶1斜線,落在斜線之上的數(shù)據(jù)呈現(xiàn)出Barcoding gap。各條形碼中每條序列對應(yīng)的最大種內(nèi)距離數(shù)值小于其最小種間距離的數(shù)據(jù)個數(shù)與總序列數(shù)的比值代表該條形碼的Barcoding gap的顯著程度,比值越大則該條形碼Barcoding gap越顯著。單條形碼中 ITS(67.3%)的Barcoding gap最為顯著,隨后依次是trnL-trnF(37.3%)>matK(23.6%)>psbA-trnH(17.6%)>rbcL(6.03%)。組合條形碼ITS+rbcL(74.6%)>ITS+psbA-trnH(69.9%)>ITS+psbA-trnH+rbcL(63.4%)>matK+rbcL(44.2%)>psbA-trnH+rbcL (38.3%)。
圖1 Barcoding gap分布
采用TaxonDNA軟件的BM、BCM功能計算鉤藤屬各條形碼的鑒別成功率。結(jié)果顯示,BM中單條形碼ITS的鑒別成功率最高(97.19%),psbA-trnH(94.44%)、matK(89.09%)次之,rbcL(21.55%)表現(xiàn)最差,鑒別成功率僅21.55%;在BCM中ITS、matK等DNA條碼鑒別成功率與在BM中得到的結(jié)果基本一致。但psbA-trnH的鑒別率跌至77.7%,其原因是psbA-trnH在BCM分析中,部分序列超過閾值5%被歸為“no match”;BM、BCM算法中組合條形碼的ITS+rbcL(98.73%)、ITS+psbA-trnH(97.26%)、matK+rbcL(96.15%)均具有優(yōu)異的鑒別率。其中ITS+rbcL表現(xiàn)最佳且覆蓋鉤藤屬種最多(11種),鑒別成功率高達(dá)98.73%。見圖2。
利用軟件MEGA7.0、Phylosuite構(gòu)建ITS、matK、psbA-trnH、rbcL、trnL-trnF 5個DNA條形碼及其組合條形碼的ML、MP、BI 3類系統(tǒng)發(fā)育樹。系統(tǒng)發(fā)育分析鑒別結(jié)果詳見表6。ITS序列在5個單條形碼中的表現(xiàn)最為優(yōu)異,將基于核基因的ITS序列構(gòu)建MP、BI的分析結(jié)果整合到ML樹上,最終結(jié)果以ML法構(gòu)建的系統(tǒng)發(fā)育樹展示,見圖3;ML樹以T92+G模型構(gòu)建發(fā)育樹;MP樹中CI(consistency index)和RI(retention index)分別為0.780和0.980;ML、MP、BI 3類系統(tǒng)發(fā)育分析的平均節(jié)點(diǎn)支持率分別為79.94%、59.8%、0.932。在 ITS 構(gòu)建的系統(tǒng)發(fā)育樹、、、4種藥用鉤藤均單獨(dú)聚為一支?;贗TS序列建立的系統(tǒng)發(fā)育樹能夠在11個鉤藤屬物種中準(zhǔn)確區(qū)分8個物種,但未能準(zhǔn)確地鑒定藥典中的5種藥用鉤藤?;诤嘶虻腎TS與基于葉綠體基因的rbcL的組合條形碼ITS+rbcL在3類系統(tǒng)發(fā)育分析方法下(ML、MP、BI)5種藥用鉤藤均單獨(dú)聚為一支,且ITS+rbcL序列所覆蓋的11種鉤藤屬種均單獨(dú)聚為一支。同樣構(gòu)建MP、BI系統(tǒng)發(fā)育樹并將分析結(jié)果整合到ML樹上,最終結(jié)果以ML法構(gòu)建的系統(tǒng)發(fā)育樹展示,見圖4。ML樹以T92+G模型構(gòu)建系統(tǒng)發(fā)育樹;MP樹中CI和RI分別為0.892和0.988;ML、MP、BI 3類系統(tǒng)發(fā)育分析的平均節(jié)點(diǎn)支持率分別為86.0%、78.1%、0.98。與聚為一支(自展支持率>90%),、、各自聚為一支后再與和聚為一大支(自展支持率>90%)。與聚為一支,再和、聚為一大支。組合條碼篩選過程中發(fā)現(xiàn)其他組合條形碼如ITS+psbA-trnH所構(gòu)建的系統(tǒng)發(fā)育樹中5類藥用鉤藤雖能單獨(dú)聚為一支,且在ITS+psbA-trnH所覆蓋的10個鉤藤屬物種中能夠準(zhǔn)確區(qū)分9種,但整體上ITS+rbcL在鑒定準(zhǔn)確性、覆蓋物種數(shù)有著更為優(yōu)異的表現(xiàn)。
圖2 各DNA條碼物種鑒定率
表6 系統(tǒng)發(fā)育分析鑒別結(jié)果
Table 6 Results of identification based on phylogenetic analysis
條碼比對長度/bp覆蓋物種數(shù)1鑒別成功率2/%鑒別藥用鉤藤物種數(shù) ITS 68711 72.734 matK 842 9 22.221 psbA-trnH 35610 10.001 rbcL 55315 6.670 trnL-trnF 403 9 55.562 ITS+rbcL125711100.005 ITS+psbA-trnH104410 90.005 matK+rbcL1399 8 50.002 psbA-trnH+rbcL 89810 50.003 ITS+psbA-trnH+rbcL159610 90.005
1-刪除僅有一條序列的物種后得到的物種覆蓋數(shù) 2-系統(tǒng)發(fā)育樹中單獨(dú)聚為一支的物種數(shù)與覆蓋物種數(shù)的比值
1-Number of species was gotten by deleting the species that only have one single sequence 2-success rate is the ratio of the number of species clustered into a single branch in a phylogenetic tree to the number of species
本實(shí)驗(yàn)選用5個條形碼(ITS、matK、psbA-trnH、rbcL、trnL-trnF)進(jìn)行鑒定鉤藤屬物種最佳DNA條形碼的篩選研究,在全國范圍內(nèi)采集的44份樣品中,5個條形碼均PCR擴(kuò)增成功且具有較高的測序成功率。應(yīng)用Barcoding gap分析、Best Match和Best Close Match物種鑒定、系統(tǒng)發(fā)育分析等分析方法綜合評估各條形碼的鑒別能力,以此篩選出鑒定鉤藤屬物種最佳的DNA條形碼。在本研究的評價體系中,理想的DNA條形碼應(yīng)具有顯著的Barcoding gap且BM、BCM中獲得較高的鑒定成功率,同時該條形碼所構(gòu)建系統(tǒng)發(fā)育樹能夠?qū)⑵渌你^藤屬各個種區(qū)分開且單獨(dú)聚為一支。DNA條形碼在屬內(nèi)種間需要有明顯的遺傳變異和分化[13],同時種內(nèi)變異足夠小。若序列過于保守,未能產(chǎn)生足夠的變異,則不利于物種鑒定。因此要求DNA條形碼具有一定的進(jìn)化速度。DNA條形碼可分為核糖體基因片段(ITS)和葉綠體基因片段(如psbA-trnH、matK、rbcL等)。核糖體基因片段ITS展現(xiàn)了較高的擴(kuò)增、測序成功率,且較之其他片段擁有較多的變異位點(diǎn),具有足夠的遺傳變異。姚能等[25]建立了基于ITS2序列的多基原藥材鉤藤DNA條形碼鑒定技術(shù)方法,能夠成功用于鉤藤藥材及其混偽品的鑒定。ITS序列由ITS1、5.8 S基因、ITS2 區(qū)序列構(gòu)成,因而ITS較之ITS2序列具有更多的變異位點(diǎn)。本研究發(fā)現(xiàn)ITS序列具有顯著的 Barcoding gap且在BM、BCM中取得單條形碼中最高的鑒定率(97.73%),但3類系統(tǒng)發(fā)育分析表明包括ITS在內(nèi)的任何單條形碼均無法準(zhǔn)確地鑒定5種藥用鉤藤。
圖3 基于ITS序列構(gòu)建的系統(tǒng)發(fā)育樹
圖4 基于ITS+rbcL序列構(gòu)建的系統(tǒng)發(fā)育樹
核糖體基因片段ITS具有較好的穩(wěn)定性和準(zhǔn)確性。但同樣存在局限性,如植物細(xì)胞內(nèi)不同核糖體的進(jìn)化水平可能存在差異,擴(kuò)增產(chǎn)物可能被細(xì)菌、真菌等微生物的核糖體污染等。而葉綠體在結(jié)構(gòu)、序列上相對保守[26],進(jìn)化水平較為一致且擴(kuò)增產(chǎn)物不受微生物影響。psbA-trnH序列是葉綠體基因psbA與trnH之間的一段非編碼區(qū),具有較快的進(jìn)化速度。Tang等[15]通過BLAST1方法與最近距離法得出psbA-trnH序列鑒定鉤藤屬物種成功率高達(dá)95.9%,推薦psbA-trnH序列用于鑒定鉤藤屬物種。而本研究的結(jié)果表明psbA-trnH具有最多的變異位點(diǎn),但其鉤藤屬物種鑒定成功率并不高,且基于psbA-trnH所構(gòu)建的系統(tǒng)發(fā)育樹僅成功區(qū)分1種藥用鉤藤植物。有研究表明部分物種的psbA-trnH序列具有polyA/T結(jié)構(gòu),該結(jié)構(gòu)致使序列較難進(jìn)行雙向測序,也因此限制了psbA-trnH序列的應(yīng)用[27]。
matK基因是葉綠體賴氨酸t(yī)RNA基因高度保守的2個外顯子之間的內(nèi)含子序列[13],進(jìn)化速率略弱于ITS,通用性較差,不易擴(kuò)增、測序。本實(shí)驗(yàn)中matK測序成功率最低,所構(gòu)建的系統(tǒng)發(fā)育樹也僅能區(qū)分1種藥用鉤藤。
rbcL序列位于植物葉綠體基因組的大單拷貝區(qū),具有通用性高、易擴(kuò)增等特點(diǎn),但低變異程度限制了其在低分類水平物種鑒定中的應(yīng)用,適合與其他序列片段組合形成組合條形碼[27-28]。2009年國際生命條形碼聯(lián)盟提議將組合條形碼matK+rbcL作為植物界的通用條形碼[27],本研究結(jié)果顯示組合條形碼matK+rbcL雖在BM、BCM下有著較高的鑒別成功率,但通過樹法所構(gòu)建的系統(tǒng)發(fā)育樹只能成功區(qū)分4種鉤藤物種,其中僅包含2種藥用鉤藤。因而matK+rcbL并不是最佳的鉤藤屬物種鑒定組合條形碼。在進(jìn)一步探究組合條形碼的鑒定潛能時,筆者發(fā)現(xiàn)結(jié)合了核糖體基因ITS與葉綠體基因rbcL得到的組合條形碼ITS+rbcL在BM、BCM中均具有高于ITS序列的物種鑒別率(98.73%),同時具有更為顯著的Barcoding gap;在3類系統(tǒng)發(fā)育分析方法中均能準(zhǔn)確區(qū)分5種藥用鉤藤植物,而且其所涵蓋的11種鉤藤屬物種均單獨(dú)聚為一支。ITS+rbcL在與其他組合條形碼相比較時,無論是物種鑒定成功率亦或是系統(tǒng)發(fā)育分析聚類都有更為突出的指征。綜上所述,筆者推薦使用ITS+rbcL的組合條形碼作為鑒定鉤藤屬物種首選序列,該組合條形碼能提供更多遺傳信息以準(zhǔn)確鑒定鉤藤屬物種,為鉤藤屬藥材的種類鑒定和種間分類地位提供分子生物學(xué)依據(jù)。
利益沖突 所有作者均聲明不存在利益沖突
[1] 梁·陶弘景集. 尚志鈞輯校. 名醫(yī)別錄 [M]. 北京: 人民衛(wèi)生出版社, 1986: 23.
[2] 中國藥典 [S]. 一部. 2020: 23.
[3] Zhang Z L, Song M F, Guan Y H,. DNA barcoding in medicinal plants: Testing the potential of a proposed barcoding marker for identification ofspecies from China [J]., 2015, 60: 8-14.
[4] 黃寶媛. 鉤藤生物堿逆轉(zhuǎn)腫瘤多藥耐藥活性及機(jī)制研究 [D]. 廣州: 廣東藥科大學(xué), 2017.
[5] 李博, 李慶, 宋素異, 等. 鉤藤總生物堿對腹腔粘連大鼠內(nèi)皮功能、炎性介質(zhì)和粘連組織相關(guān)因子表達(dá)的影響 [J]. 世界臨床藥物, 2017, 38(12): 815-821.
[6] 孫娜, 黃晏, 周文霞, 等. 鉤藤源生物堿對LPS所致認(rèn)知功能損傷的作用初探 [J]. 中國藥理學(xué)與毒理學(xué)雜志, 2019, 33(6): 463-464.
[7] 彭春燕. 基于ADME和Lipidomics探討巴利森苷A-異鉤藤堿組分中藥對偏頭痛模型大鼠的作用 [D]. 南昌: 江西中醫(yī)藥大學(xué), 2019.
[8] 嚴(yán)愉妙. 廣東鉤藤屬植物的活性成分含量測定及其藥理作用的研究 [D]. 廣州: 南方醫(yī)科大學(xué), 2012.
[9] 江芳, 郭娜, 童文琴, 等. 鉤藤屬植物研究進(jìn)展 [J]. 海峽藥學(xué), 2017, 29(4): 5-13.
[10] 楊楠楠, 黃小敏, 蓋亞男, 等. 6種不同基源鉤藤藥材的顯微鑒別 [J]. 中國實(shí)驗(yàn)方劑學(xué)雜志, 2018, 24(23): 52-58.
[11] 朱爽, 陳劍平, 劉嘉敏, 等. 兩種大葉鉤藤ITS序列的RFLP分析 [J]. 海峽藥學(xué), 2012, 24(1): 42-44.
[12] 徐鵬, 吳耀生, 黃瑞松, 等. 3種廣西鉤藤屬藥用植物的RAPD多態(tài)性分析 [J]. 時珍國醫(yī)國藥, 2012, 23(3): 703-705.
[13] 蔡金龍, 謝世清, 張廣輝, 等. 藥用植物DNA條形碼鑒定研究進(jìn)展 [J]. 植物科學(xué)學(xué)報, 2017, 35(3): 452-464.
[14] Han J P, Pang X H, Liao B S,. An authenticity survey of herbal medicines from markets in China using DNA barcoding [J]., 2016, 6: 18723.
[15] Tang Y L, Wu Y S, Huang R S,. Molecular identification of(Gouteng) through DNA barcoding [J]., 2016, 11: 3.
[16] Zhu S, Li Q W, Chen S C,. Phylogenetic analysis ofspecies based on internal transcribed spacer (ITS) region and ITS2 secondary structure [J]., 2018, 56(1): 548-558.
[17] Uler G. PCR protocols—A guide to methods and applications [J]., 1990, 15(10): 405-406.
[18] Chiou S J, Yen J H, Fang C L,. Authentication of medicinal herbs using PCR-amplified ITS2 with specific primers [J]., 2007, 73(13): 1421-1426.
[19] Sang T, Crawford D J, Stuessy T F. Chloroplast DNA phylogeny, reticulate evolution, and biogeography of(Paeoniaceae) [J]., 1997, 84(8): 1120-1136.
[20] Tate J A, Simpson B B. Paraphyly of(Malvaceae) and diverse origins of the polyploid species [J]., 2003, 28(4): 723-737.
[21] Kress W J, Erickson D L. A two-locus global DNA barcode for land plants: The coding rbcL gene complements the non-coding trnH-psbA spacer region [J]., 2007, 2(6): e508.
[22] Taberlet P, Gielly L, Pautou G,. Universal primers for amplification of three non-coding regions of chloroplast DNA [J]., 1991, 17(5): 1105-1109.
[23] Meier R, Shiyang K, Vaidya G,. DNA barcoding and taxonomy in Diptera: A tale of high intraspecific variability and low identification success [J]., 2006, 55(5): 715-728.
[24] 熊瑤, 金晨, 王曉云, 等. 雞血藤及其混偽品的DNA條形碼分子鑒定研究 [J]. 中草藥, 2020, 51(12): 3274-3283.
[25] 姚能, 胡超逸, 魏一丁, 等. 基于ITS2序列鑒別中藥材鉤藤及其同屬近緣混偽品 [J]. 時珍國醫(yī)國藥, 2019, 30(2): 361-364.
[26] Group C P W, Hollingsworth P M, Forrest L L,. A DNA barcode for land plants [J]., 2009, 106(31): 12794-12797.
[27] 趙志浩, 王杰, 李振山, 等. 灰棗和酸棗葉綠體trnL-trnF基因序列分析 [J]. 河南科學(xué), 2013, 31(11): 1883-1886.
[28] 李奇威. 基于DNA條形碼的三種藥用植物分子系統(tǒng)學(xué)研究 [D]. 廣州: 廣東藥科大學(xué), 2018.
Screening of DNA barcoding sequences for molecular identification ofgenus
CAI Yi-ming1, DAI Jiang-peng1, ZHENG Yu-xin1, REN Ying-yi1, CHEN Hao-ming1, FENG Ting-ting1, GAO Xiao-xia2, ZHU Shuang1
1. Guangdong Province Key Laboratory for Biotechnology Drug Candidates, School of Biosciences and Biopharmaceutics, Guangdong Pharmaceutical University, Guangzhou 510006, China 2. School of Pharmacy, Guangdong Pharmaceutical University, Guangzhou 510006, China
In order to establish a rapid, accurate, and convenient approach for identifying species in thegenus, DNA barcoding analysis and molecular biology techniques were performed to screen the best DNA barcode sequences forspecies authentication.Genomic DNA was extracted from a total of 44 leaf and stem specimens collected from different regions throughout China. The barcodes for ITS, matK, psbA-trnH, rbcl, and trnL-trnF were amplified, sequenced, assembled, and refined. The sequences were aligned and analyzed using MEGA 7.0. Intraspecific and interspecific genetic distances were calculated to analyze barcoding gaps using TaxonDNA software. The ability of the DNA barcodes to identify species was evaluated using the “Best Match” and “Best Close Match” functions in TaxonDNA. MEGA 7.0 and Phylosuite were used to design phylogenetic trees from single and combinations of barcodes based on Maximum Parsimony (MP), Maximum Likelihood (ML), and Bayesian Inference (BI) methods.The ITS, matK, psbA-trnH, rbcL, and trnL-trnF sequences were successfully amplified and had a high sequencing success rate. The psbA-trnH sequence had the highest number of variation sites, followed by ITS and rbcL, which had the lowest number of variation sites. Best Match, Best Close Match, and Barcoding gap analysis showed that ITS had the most prominent species discriminatory effect among the five single barcodes, while the combination of ITS + rbcL with even better discriminatory performance than any single barcodes. Based on the phylogenetic tree constructed using all of the single barcodes, ITS accurately identified eightspecies and had the highest identification success rate when compared to the other barcodes. The combination of ITS + rbcL had the highest average bootstrap support rate based on the phylogenetic tree. All the 11species clustered separately into monophyletic clades.The combination barcodes of ITS + rbcL achieve the accurate identification ofspecies when the DNA barcoding technology is applied to identifyspecies.
; DNA barcoding; species identification; ITS; rbcL;TaxonDNA; phylogenetic analysis
R282.12
A
0253 - 2670(2022)06 - 1828 - 10
10.7501/j.issn.0253-2670.2022.06.026
2021-08-09
國家自然科學(xué)基金資助項(xiàng)目(81102418)
蔡一鳴,男,本科,研究方向?yàn)橹兴幏治雠c鑒定。Tel: (020)39352021 E-mail: 2468270590@qq.com
朱 爽,碩士生導(dǎo)師,副教授,研究方向?yàn)橹兴幏治雠c鑒定。Tel: (020)39352021 E-mail: 15683727@qq.com
[責(zé)任編輯 時圣明]