武鋒 裴男才 廖寶文 管偉 姜仲茂 李玫
(中國林業(yè)科學(xué)研究院熱帶林業(yè)研究所,廣州,510520)
2003年Hebert et al.[1]第一次提出識別物種的新方法——DNA條形碼技術(shù)。兩年后,該技術(shù)的相關(guān)理論被引入植物學(xué)開展科學(xué)研究[2-3]。隨后國際生命條形碼聯(lián)盟植物工作組(Consortium for the Barcode of Life Plant Working Group)初步確定并推薦葉綠體基因片段的rbcL和matK[4]作為的DNA核心條形碼片段。然而該片段并不能像動(dòng)物的COI片段一樣具有普遍適用性。因此葉綠體基因非編碼區(qū)trnH-psbA[5-6]及核基因ITS[7-9]作為核心條形碼的補(bǔ)充片段被提了出來。選擇、比較、推薦合適的DNA條形碼片段的工作也一直在繼續(xù)[10-13]。DNA條形碼技術(shù)不僅能應(yīng)用于相似生物的識別[14-17]。還可以利用DNA條形碼片段測序所獲得的分子序列,構(gòu)建特定生物類群的系統(tǒng)發(fā)育關(guān)系[18-20]。這將促進(jìn)群落生態(tài)學(xué)、系統(tǒng)發(fā)育生物學(xué)、生態(tài)學(xué)與條形碼技術(shù)的交叉融合,帶來進(jìn)化生物學(xué)等相關(guān)學(xué)科的整合與發(fā)展[21-25]。
紅樹林是生長在熱帶、亞熱帶海陸過渡地區(qū)的木本植物群落[26],具有重要的生態(tài)服務(wù)價(jià)值,在世界16種主要生態(tài)系統(tǒng)中排名第四[27]。全世界共有紅樹植物84種[28]。廣東共有紅樹林植物25種[29],占世界紅樹林物種數(shù)的29.76%。相對以往對紅樹林的研究主要集中在宏觀方面,如紅樹林生態(tài)系統(tǒng)服務(wù)功能評價(jià)、碳匯、防風(fēng)消浪等,近年來對紅樹林DNA條形碼[30]、基因組[31-32]等微觀分子方面的研究也越來越多。然而對紅樹林的準(zhǔn)確識別是開展各項(xiàng)研究的基礎(chǔ)。利用紅樹林植物的外部形態(tài)來不能快速、準(zhǔn)確的區(qū)分相同屬相似物種,比如海桑屬(Sonneratia)的杯萼海桑(SonneratiaalbaSm.)、海桑(Sonneratiacaseolaris(L.) Engl.)、海南海桑(SonneratiaxhainanensisW. C. Ko et al.)、擬海桑(SonneratiaparacaseolarisW. C. Ko et al.)等;木欖屬(Bruguiera)的海蓮(Bruguiera.sexangula(Lour.) Poir)、尖瓣海蓮(Bruguiera.sexangulavar.rhynchopetalaKo.)等。傳統(tǒng)的植物群落發(fā)育關(guān)系構(gòu)建中,如APG分類系統(tǒng)(Angiosperm Phylogeny Group),多是以大類群植物間的系統(tǒng)發(fā)育關(guān)系,對大多數(shù)植物只能解決到目或科的水平,不宜于科及以下分類水平的研究,進(jìn)化樹分辨率低[28]。同時(shí)運(yùn)用該方法得出的系統(tǒng)發(fā)育樹容易出現(xiàn)多分枝結(jié)構(gòu)。DNA條形碼以動(dòng)物[33]、熱帶、亞熱帶植物[21,34]、微生物[35]為對象的研究在物種識別和系統(tǒng)發(fā)育關(guān)系構(gòu)建方面都取得了一定的成果。Saddhe et al.[30]利用核心條形碼片段和ITS2片段對印度西海岸5科14種紅樹林的識別也取得了成功,但是該研究對象與分布在中國的紅樹林植物多有不同,同時(shí)該研究的對象僅包含真紅樹,植物種類少。紅樹植物群落物種豐富度較低,類群間關(guān)系比較簡單。是否利用DNA條形碼序列也能成功構(gòu)建紅樹植物系統(tǒng)發(fā)育關(guān)系答案尚不明確。本文嘗試研究DNA條形碼在中國紅樹林(包含真紅樹和半紅樹)植物類群中的通用性,并構(gòu)建紅樹林植物系統(tǒng)發(fā)育關(guān)系,為紅樹林生物多樣性保護(hù)提供科學(xué)依據(jù)。
本研究選取紅樹林在廣東的主要分布地,統(tǒng)籌考慮選取珠三角地區(qū)的深圳、惠州,粵東的汕頭和粵西的湛江等4地市的紅樹林分布區(qū)(珠海淇澳島作為補(bǔ)充采樣點(diǎn)),具體的采樣地信息詳見表1。根據(jù)Li等[9]和高連明等[36]DNA條形碼樣品采集規(guī)范,每個(gè)紅樹林物種采樣2~3個(gè)個(gè)體,主要以采取新鮮葉子、新芽為主,便于提取DNA分子材料,每個(gè)個(gè)體相距20 m以上。采集完試驗(yàn)材料立刻用硅膠干燥。共采集紅樹林植物144個(gè)個(gè)體。經(jīng)廖寶文研究員、李玫副研究員鑒定,確定類屬于16科22屬23種(其中2種屬于紅樹林伴生種),全部正確分類到種。本研究采樣的物種數(shù)占廣東紅樹林植物真紅樹和半紅樹種類25種的84%,因其中人工引種的海蓮和尖瓣海蓮幾乎滅絕、消失,故未采樣;小花老鼠簕(AcanthusebracteatusVahl)、鈍葉臭黃荊(PremnaobtusifoliaR. Br.)未找到。
采用調(diào)整過的CTAB法[37]提取紅樹植物DNA。根據(jù)國際生命條形碼聯(lián)盟推薦以及前人[6,38-39]在區(qū)域性植物DNA條形碼的研究,選取葉綠體基因片段rbcL、matK以及trnH-psbA總計(jì)3個(gè)分子序列作為研究的擴(kuò)增片段。引物信息和擴(kuò)增程序參考表2。所有擴(kuò)增產(chǎn)物經(jīng)凝膠電泳檢測后送廣州美吉生物公司完成測序,3種片段均采取雙向測序,獲得的序列在https://www.ncbi.nlm.nih.gov/上進(jìn)行BLAST搜索,如發(fā)現(xiàn)序列與采樣物種存在科、屬不一致的情況,咨詢專家再次確認(rèn)或重新取樣擴(kuò)增,直到所有序列的BLAST結(jié)果與采集樣品為同屬或者同科植物。使用DNAstar中的SeqMan(5.0.0)對測序獲得的序列進(jìn)行拼接和校對。然后在Geneious11.1.3中選擇MAFFT Aligement插件,按默認(rèn)參數(shù)進(jìn)行序列比對。
注:A代表湛江;B代表深圳;C代表惠州;D代表汕頭;E代表珠海。
參考Kress et al.[40]計(jì)算PCR擴(kuò)增成功率和測序成功率方法。PCR擴(kuò)增成功率是指某片段擴(kuò)增的成功個(gè)體數(shù)占該片段所有個(gè)體的百分?jǐn)?shù)。測序成功率是指獲得的高質(zhì)量序列數(shù)占所有個(gè)體的百分?jǐn)?shù)。研究中采用了序列相似法(Basic Local Alignment Search Tool,BLAST)和系統(tǒng)發(fā)育樹法中的鄰接樹(Neighbor-Joining tree,NJ tree)法來評估紅樹林植物種的鑒定能力。(1)BLAST方法,首先在Geneious 11.1.3中將3種DNA片段分別建立一個(gè)本地?cái)?shù)據(jù)庫[40],將所有序列比對后另存為*fasta文件,調(diào)整序列方向,清除序列間gap。再用blast+2.7.1+把每條序列與數(shù)據(jù)庫內(nèi)的所有序列進(jìn)行BLAST,以相同位點(diǎn)(Identical Sites)的百分比作為量化標(biāo)準(zhǔn)。若同物種的Identical Sites最小值都大于與其他所有物種個(gè)體間的Identical Sites值,那么我們認(rèn)為這個(gè)物種的序列得到了準(zhǔn)確鑒定,若該物種只包含一個(gè)樣品,為避免過高估計(jì)鑒定成功率,標(biāo)記為鑒定失敗[41]。鑒定成功率是通過成功鑒定物種數(shù)的百分比再乘以該片段的測序成功率得到的。聯(lián)合片段的鑒定成功率與單個(gè)片段計(jì)算方法相同。(2)NJ tree方法,用rbcL、matK、trnH-psbA3個(gè)單片段或者片段組合,在MEGA6中利用基于Kimra’2-parameter model的NJ法構(gòu)建系統(tǒng)發(fā)育樹,并完成1000次運(yùn)算獲得節(jié)點(diǎn)支持率。當(dāng)同一物種的所有個(gè)體聚為一枝,并且節(jié)點(diǎn)支持率≥70%,則認(rèn)為鑒定成功[39,42]。所有單個(gè)個(gè)體的物種被用來構(gòu)建NJ樹,但是在分辨率計(jì)算時(shí)不被計(jì)算在內(nèi)[43]。
從NCBI網(wǎng)站下載小花老鼠簕、鈍葉臭黃荊、海蓮的rbcL、matK和trnH-psbA片段信息各1條(無尖瓣海蓮相關(guān)條形碼片段信息),與采集到的紅樹林植物的序列信息拼接,組成一個(gè)包含26種物種,49個(gè)個(gè)體的序列文件。用于構(gòu)建紅樹林植物系統(tǒng)發(fā)育樹。
對23種紅樹林植物的144個(gè)個(gè)體進(jìn)行序列統(tǒng)計(jì),共獲得3種DNA條形碼片段可用序列386條(表3),序列獲得率89.35%。其中,在湛江紅樹林保護(hù)區(qū)共收集紅樹植物16種,35個(gè)個(gè)體,測序后共得到89條序列。PCR擴(kuò)增后發(fā)現(xiàn)rbcL和trnH-psbA片段的擴(kuò)增成功率同為最高100%,其次是matK71.43%。測序成功率最高為rbcL片段100%,trnH-psbA片段次之88.57%,最低為matK片段65.71%。
在深圳紅樹林保護(hù)區(qū)共收集紅樹植物12種,36個(gè)個(gè)體,測序手得到99條序列。PCR擴(kuò)增后3片段的擴(kuò)增成功率由高到低依次為rbcL和trnH-psbA100%、matK(80.56%)。測序成功率最高為rbcL片段(100%),trnH-psbA片段次之(97.22%),最低為matK片段(77.78%)。
在惠州紅樹林保護(hù)區(qū)共收集紅樹植物14種,40個(gè)個(gè)體,測序后得到108條序列。3個(gè)片段擴(kuò)增成功率由高到低依次為rbcL片段100%、trnH-psbA97.5%,matK77.5%。測序成功率最高為rbcL片段100%,trnH-psbA次之92.5%,最低為matK77.5%。
在汕頭紅樹林保護(hù)區(qū)采集到紅樹植物9種,24個(gè)個(gè)體,測序后共得到67條序列。PCR擴(kuò)增后3片段的擴(kuò)增成功率由高到低依次為rbcL、trnH-psbA(100%)、matK(91.67%)。測序成功率最高為rbcL和trnH-psbA片段100%,matK片段為79.17%。
表3 廣東省紅樹林植物DNA片段擴(kuò)增和測序成功率 %
注:珠海作為補(bǔ)充采樣點(diǎn),共采集植物3種9個(gè)樣品,獲得序列23條,用于后續(xù)構(gòu)建系統(tǒng)發(fā)育樹,此處未做統(tǒng)計(jì)。PCR(Polymerase Chain Reaction):多聚酶鏈?zhǔn)椒磻?yīng);SEQ(Sequence):測序。R為rbcL;M為matK;T為trnH-psbA。
2.2.1 序列相似性分析
因分布在廣東的紅樹、半紅樹植物除海桑屬和老鼠簕屬外均是單屬、單種存在,故這里僅統(tǒng)計(jì)紅樹植物的種的鑒定成功率。BLAST結(jié)果顯示,單個(gè)片段中對物種的鑒別成功率最高為trnH-psbA84.48%±12.09%,其次依次為rbcL片段82.16%±9.68%,最低為matK片段65.09±6.00%,trnH-psbA片段和rbcL片段的物種識別率顯著高于matK片段(表4)。然而除汕頭地區(qū),rbcL片段成功鑒定的物種均高于trnH-psbA片段,主要差別為汕頭地區(qū)紅樹林中trnH-psbA能準(zhǔn)確區(qū)分開無瓣海桑和海桑,而rbcL不行。
對多片段的不同組合統(tǒng)計(jì)分析,發(fā)現(xiàn)核心條形碼rbcL+matK的鑒定成功率最高,為84.58%±10.83%;rbcL+trnH-psbA鑒定成功率次之,為83.71%±15.96%。補(bǔ)充條形碼trnH-psbA聯(lián)合rbcL+matK片段后物種鑒定率反而降低到76.89%±8.07%。
表4 利用序列相似法的單片段和多片段DNA條形碼在紅樹林種上的鑒別成功率 %
注:R為rbcL;M為matK;T為trnH-psbA。
2.2.2 系統(tǒng)發(fā)育分析
運(yùn)用系統(tǒng)發(fā)育方法分析統(tǒng)計(jì)物種識別率結(jié)果如表5。結(jié)果顯示rbcL物種識別率最高,為66.65%±17.35%;其次是trnH-psbA,為61.21%±9.34%,matK最低為47.75%±13.23%。片段聯(lián)合時(shí)rbcL+trnH-psbA的物種識別率為62.23%±9.47%;rbcL+matK62.54%±17.41%,再增加trnH-psbA片段可以提高到65.15%±11.09%。
表5 利用系統(tǒng)發(fā)育法的單片段和多片段DNA條形碼在紅樹林種上的鑒別成功率 %
注:R為rbcL;M為matK;T為trnH-psbA。
利用rbcL、matK和trnH-psbA單個(gè)或3個(gè)片段的聯(lián)合片段,采用NJ法構(gòu)建系統(tǒng)發(fā)育樹(圖1)。結(jié)果發(fā)現(xiàn),利用rbcL單一片段即可構(gòu)建平均節(jié)點(diǎn)支持率最高的紅樹林植物系統(tǒng)發(fā)育樹。除老鼠簕外,同一物種首先聚為一支,同屬物種再聚為一支(綠色標(biāo)記),然后同科的物種關(guān)系最近(黃色標(biāo)記)。
本文嘗試?yán)肈NA條形碼技術(shù)對廣東省紅樹林植物進(jìn)行研究,目的在于評估DNA條形碼在紅樹林植物種的引物通用性、鑒別成功率、系統(tǒng)發(fā)育樹構(gòu)建等方面的表現(xiàn)。
在本研究中,核心條形碼中的rbcL片段在紅樹植物DNA樣品中的PCR擴(kuò)增和測序成功率都達(dá)到了100%,獲得序列條帶信息、質(zhì)量良好。與Kress et al.[21]研究相比、表現(xiàn)出更高的通用性和成功率。與裴男才[44]研究同處于熱帶、亞熱帶的森林植物群落的測序成功率相比(90%-100%)持平。這也與Saddhe et al.[45]研究印度西海岸紅樹植物的擴(kuò)增和測序成功率(97.7%)不相上下。說明通用片段rbcL可變位點(diǎn)最少,所選引物序列通用性強(qiáng)。推薦其成為紅樹林DNA條形碼片段。而另一核心片段matK的PCR擴(kuò)增成功率和測序成功率均是3個(gè)片段中的最低水平,其中利用該片段對角果木、秋茄擴(kuò)增或測序不成功,在木欖、鹵蕨、紅海欖等物種只有少量個(gè)體測序成功,說明該片段引用的通用性不強(qiáng),可能是由于存在單核苷酸重復(fù)序列的原因。如Costion et al.[46]研究中matK片段的擴(kuò)增率也只有68.18%;Parmentier et al.[47]的研究中,matK片段的擴(kuò)增成功率僅為64%。劉娟[39]、盧孟孟等[42]、魏亞男等[41]的研究中也存在類似情況,普遍修正做法是增加引物數(shù)量進(jìn)行多次嘗試。而Saddhe et al.[45]的研究中,matK片段的擴(kuò)增成功率達(dá)到95.5%,這主要是因?yàn)槠洳捎玫囊锊煌?。同時(shí)印度西海岸的紅樹植物與中國廣東分布的紅樹植物種類不同也是造成擴(kuò)增成功率差異較大的原因。在以后的研究中可嘗試?yán)闷溲芯恐胁捎玫膍atK引物。補(bǔ)充條形碼trnH-psbA的引物通用性好,僅用一對引物即可使樣品的擴(kuò)增率和測序成功率保持在88%以上,僅次于rbcL片段,同時(shí)該片段能成功區(qū)分海桑屬植物。綜上所述,推薦rbcL、trnH-psbA作為紅樹林DNA條形碼的研究片段。
圖1 運(yùn)用rbcL片段構(gòu)建的廣東省紅樹林植物群落系統(tǒng)發(fā)育樹
本文采用兩種不同的方法來評價(jià)DNA條形碼對紅樹林植物的識別能力。獲得的結(jié)果也有不同。比如利用BLAST方法物種識別率最高的單片段是trnH-psbA;利用NJ方法物種識別率最高的片段是rbcL。且同一片段或者片段組合的物種識別率均是BLAST法大于NJ樹法,且差距較大。這與盧孟孟等[42]的研究結(jié)論一致。主要因?yàn)榍罢邇H比較位點(diǎn)之間的差異,后者還要兼顧所有個(gè)體是否形成單系,同時(shí)隱存種的存在也會(huì)降低NJ樹獲得的物種識別率。此外相對于前人要求節(jié)點(diǎn)支持率大于50%[41,47]或60%[48],本文要求節(jié)點(diǎn)支持率大于70%,也是NJ法物種識別率降低的一個(gè)原因。同時(shí)多片段的組合分析還會(huì)降低物種識別率,如利用BLAST法rbcL+matK片段物種識別率為84.58%±10.83%,rbcL+matK+trnH-psbA后為76.89%±8.07%;NJ樹法中,單片段rbcL物種識別率為66.65%±17.35%,rbcL+trnH-psbA后為62.23%±9.47%。主要是因?yàn)閠rnH-psbA片段變異較大,存在多個(gè)插入或者缺失的堿基,造成同物種個(gè)體間Identical Site值變小,導(dǎo)致物種識別率下降。
利用BLAST法分析發(fā)現(xiàn)matK片段物種的識別率為65.09%±6.00%,這與前人進(jìn)行植物DNA條形碼的研究結(jié)果大體一致[38,48]。盡管trnH-psbA在不同植物類群間堿基數(shù)目差異很大,存在大量的插入和缺失造成在紅海欖、木欖、闊苞菊等物種中測序困難。但在本研究中trnH-psbA的測序成功率與rbcL無顯著差異,都明顯高于matK片段。同時(shí)該片段能獨(dú)立使用時(shí)成功鑒別海桑屬的海桑和無瓣海桑。Gonzalez et al.[49]等和Tripathi et al.[50]研究也表明trnH-psbA是最具希望和潛力的條形碼之一。
NJ法分析顯示同一物種聚為一枝,4個(gè)地區(qū)存在大量相似的物種,但不同地區(qū)間相似物種的DNA條形碼片段物種識別率率無顯著差異。相似物種的存在可能反映了紅樹林物種起源和系統(tǒng)發(fā)育框架的相似性。同時(shí)由于紅樹林地理位置的不同,所處的環(huán)境條件也不同。這些差異可能導(dǎo)致4個(gè)地區(qū)的紅樹林物種向不同方演變。由南到北,真紅樹植物種類逐步減少。
Burgess et al.[40]在加拿大溫帶植物群的研究中,發(fā)現(xiàn)核心條碼組合可以成功鑒定93%的物種,以及De Vere et al.[43]發(fā)現(xiàn)rbcL+matK可以鑒別威爾士境內(nèi)69.4%~74.1%的有花植物。Kress et al.[21]對Panama區(qū)域內(nèi)296個(gè)木本物種進(jìn)行研究,發(fā)現(xiàn)葉綠體片段rbcL+matK的物種識別率高達(dá)98%。本研究中核心條碼rbcL+matK組合片段物種平均識別率也可以達(dá)到84.58%±10.83%,與rbcL+trnH-psbA片段組合的物種平均識別率無顯著差異。然而無論采用哪種分析方法,片段組合rbcL+matK的物種平均識別率與單片段rbcL的相比無顯著提高。說明rbcL是片段組合rbcL+matK中物種識別的主要片段。綜上所述,本文推薦rbcL、trnH-psbA作為紅樹林植物DNA條形碼片段。
熱帶的巴羅科羅拉多島(Barro Colorado Island,BCI)[21]、海南熱帶云杉林[51],亞熱帶的鼎湖山樣地[44],哀勞山森林[42]等地利用rbcL+matK+trnH-psbA片段組合構(gòu)建系統(tǒng)發(fā)育樹均獲得成功。然而在對處于相同緯度帶紅樹林植物群落構(gòu)建系統(tǒng)發(fā)育樹時(shí)卻未能成功。rbcL+matK片段組合也存在類似情況。
只用單一片段rbcL可成功構(gòu)建系統(tǒng)發(fā)育樹,且發(fā)育樹的節(jié)點(diǎn)平均支持率也最高,該片段在Saddhe et al.[45]研究的印度西海岸的真紅樹群落中也獲得成功。即使加上從網(wǎng)站下載的紅樹林植物DNA條形碼片段信息后,該片段對應(yīng)的物種也能成功歸類,這也印證了系統(tǒng)發(fā)育樹法下rbcL片段的物種識別率最高。此外,我們發(fā)現(xiàn)各分枝上節(jié)點(diǎn)的平均支持率均大于50%,說明紅樹林樹種的進(jìn)化關(guān)系具有較高的可靠性。同時(shí)利用DNA條形碼獲得的系統(tǒng)發(fā)育樹框架末端都獲得了很好的二岐分枝結(jié)構(gòu),系統(tǒng)發(fā)育樹末端分枝為分類單元提供了準(zhǔn)確的系統(tǒng)位置,可根據(jù)DNA條形碼片段來計(jì)算整個(gè)群落內(nèi)所有類群內(nèi)部真實(shí)的分枝長度。相比于傳統(tǒng)的系統(tǒng)發(fā)育樹建樹方法,利用DNA條形碼獲得的系統(tǒng)發(fā)育樹在進(jìn)化樹的分辨率和進(jìn)化時(shí)間的準(zhǔn)確性方面都更具優(yōu)勢。Sahu et al.[52]用rbcL、matK和ITS片段基于最大似然法(Maximun likelihood,ML)成功構(gòu)建印度東、西部海岸37種紅樹林植物和63種非紅樹植物組成的系統(tǒng)發(fā)育樹。相比于最大似然法,鄰接樹法運(yùn)算更快,可以滿足構(gòu)建小群落的系統(tǒng)發(fā)育樹。故推薦用rbcL片段基于鄰接樹法構(gòu)建廣東紅樹林植物系統(tǒng)發(fā)育樹。
總的來說,rbcL和trnH-psbA片段擴(kuò)增成功率、測序成功率高,說明這兩種條碼在紅樹樹種中是通用的。在物種識別方面,3種片段中rbcL和trnH-psbA的物種識別率相對較高,片段組合未能明顯提高紅樹植物物種識別率。同時(shí)僅用一對引物的rbcL片段即可準(zhǔn)確構(gòu)建出廣東省紅樹林植物群落系統(tǒng)發(fā)育關(guān)系。trnH-psbA片段作為葉綠體基因非編碼區(qū)序列,進(jìn)化速率快,且能準(zhǔn)確區(qū)分某些rbcL不能識別的物種,可以作為補(bǔ)充片段。綜合比較,rbcL、trnH-psbA是值得推薦為紅樹林植物DNA條形碼片段。
本研究得到23種紅樹林植物3種DNA條形碼片段386條有效序列,紅樹林植物種類占中國真紅樹和半紅樹的55.26%。后續(xù)可繼續(xù)擴(kuò)大采樣范圍,補(bǔ)充其他紅樹林樹種及紅樹林伴生植物的DNA條形碼,構(gòu)建一個(gè)完整、高覆蓋度的紅樹林植物DNA條形碼數(shù)據(jù)庫。
東北林業(yè)大學(xué)學(xué)報(bào)2020年4期