蔣 明 柯世省 王軍峰
(1. 臺(tái)州學(xué)院生命科學(xué)學(xué)院 臺(tái)州 318000; 2. 麗水市林業(yè)科學(xué)研究院 麗水 323000)
鐵木屬(Ostrya)植物為樺木科(Betulaceae)落葉喬木或小喬木,分布于亞洲東部、歐洲、中美洲和北美洲,木材質(zhì)地致密,用途十分廣泛(中國科學(xué)院中國植物志編委會(huì), 1979)。全世界共有鐵木屬植物7種,我國有4種,分別為鐵木(O.japonica)、多脈鐵木(O.multinervis)、天目鐵木(O.rehderiana)和云南鐵木(O.yunnanensis),其中鐵木、云南鐵木和多脈鐵木的分布相對(duì)較廣,野生株數(shù)量較多,而天目鐵木的數(shù)量十分稀少,野生植株僅5株,分布在浙江臨安的天目山(樂笑瑋等, 2013)。多脈鐵木為落葉大喬木,主要分布在湖北、湖南、四川東南部及貴州等省份,生于海拔650~1 200 m的雜木林中,浙江也有少量分布,但僅在溫州文成縣和麗水慶元縣有記載,植株數(shù)量十分稀少,是浙江極小種群野生植物(張若蕙等, 1994)。近年來,有關(guān)多脈鐵木的研究主要集中在資源調(diào)查、家化栽培、年齡結(jié)構(gòu)、群落結(jié)構(gòu)和物種多樣性等方面(張若蕙等, 1992; 吳世斌等, 2018; 2019)。
葉綠體是綠色植物最重要的細(xì)胞器之一,它不僅是光合作用的場(chǎng)所,也是色素、脂類物質(zhì)、激素和核糖體等合成的重要細(xì)胞器,此外,葉綠體還參與環(huán)境信號(hào)的響應(yīng),在逆境響應(yīng)中起著重要作用(Pogsonetal., 2015)。葉綠體基因組以雙鏈環(huán)狀形式存在于葉綠體中,具有結(jié)構(gòu)保守、母性遺傳和單倍性等特點(diǎn),近年來在遺傳結(jié)構(gòu)、比較基因組、物種鑒定、馴化歷史追溯和遺傳多樣性等方面的研究中得到了廣泛應(yīng)用(Petitetal., 2005; Wickeetal., 2011; Greineretal., 2015; Walkeretal., 2015; Twyfordetal., 2017)。被子植物葉綠體基因組DNA的長度通常在115~165 kb之間,由2個(gè)反向重復(fù)(inverted repeat, IR)、1個(gè)大單拷貝區(qū)(large single copy, LSC)和1個(gè)小單拷貝區(qū)(small single copy, SSC)組成(Yanetal., 2015)。葉綠體基因組的基因包括編碼蛋白基因、rRNA基因和tRNA基因等,它們參與轉(zhuǎn)錄、蛋白質(zhì)的生物合成、光化學(xué)反應(yīng)、淀粉生成和逆境防御等過程(Xieetal., 1996; Wolfetal., 2004; Tillichetal., 2010; Yamburenkoetal., 2015; Danilovaetal., 2018; Songetal., 2018)。目前,有關(guān)多脈鐵木葉綠體基因組相關(guān)的研究未見報(bào)道。本研究以多脈鐵木為材料,在高通量測(cè)序的基礎(chǔ)上,對(duì)葉綠體基因組進(jìn)行組裝、簡單重復(fù)序列(simple sequence repeat, SSR)分析、序列特征和系統(tǒng)發(fā)育分析,為后續(xù)開展遺傳結(jié)構(gòu)和群體遺傳多樣性研究奠定基礎(chǔ)。
多脈鐵木葉片采自麗水市林業(yè)科學(xué)研究院,收集幼嫩、健康的葉片,置于冰盒中帶回實(shí)驗(yàn)室。葉片先用大量的自來水沖洗,再用無菌水沖洗5~6次,置于-80 ℃低溫冰箱中備用。
葉片用適量的液氮速凍后研磨成細(xì)粉末,采用SDS法提取基因組DNA,DNA經(jīng)電泳檢測(cè)合格后,用超聲波破碎儀制備片段,構(gòu)建文庫后用于測(cè)序。高通量測(cè)序在Illumina HiSeq X Ten測(cè)序儀上進(jìn)行,共得到5.96 Gb原始數(shù)據(jù),reads為19 869 412條。利用NGS QC Toolkit v2.3.3對(duì)原始數(shù)據(jù)進(jìn)行處理,移除接頭和低質(zhì)量的reads,共獲得clean reads 19 830 514條,Q20值達(dá)96.86%,Q30為91.96%,數(shù)據(jù)質(zhì)量達(dá)到后續(xù)拼接的要求。
葉綠體基因組的拼接在ThinkPad P52移動(dòng)工作站上進(jìn)行,采用NOVOPlasty的perl程序(Dierckxsensetal., 2017)。利用DOGMA(Dual Organellar GenoMe Annotator, http:∥dogma.ccbb.utexas.edu/)對(duì)序列進(jìn)行注釋(Wymanetal., 2004)。tRNA用tRNAscan-SE(Loweetal., 1997)和ARAGORN(Laslettetal., 2004)預(yù)測(cè)。注釋完成后,利用在線工具OGDRAW(OrganellarGenomeDRAW, http:∥ogdraw.mpimp-golm.mpg.de)繪制葉綠體基因組結(jié)構(gòu)圖(Lohseetal., 2013)。
根據(jù)拼接完成的葉綠體基因組序列,利用Geneious 11.1.5的Find repeats程序獲得IR序列。設(shè)計(jì)4對(duì)PCR引物,用于驗(yàn)證LSC/IRb、IRb/SSC、SSC/IRa和IRa/LSC邊界序列的正確性。它們是LSC/IRbup: 5′-CAACCGATATGCCCTTAGGCAC-3′; LSC/IRbdn: 5′-GATGAATGGTAGAGATGAAATCCC CA-3′; IRb/SSCup: 5′-CGTTGGCCCATTTTTGTCAT TTTC-3′; IRb/SSCdn: 5′-GGATTGGTATTAGTCTGG ATACAGCA-3′; SSC/IRaup: 5′-GGATTGGTATTAGT CTGGATACAGC-3′; SSC/IRadn: 5′-ATAGGGGGTG GCCGAATTTC-3′; IRa/LSCup: 5′-GTAGTACCCTCG TTCTCGTTGAC-3′; IRa/LSCdn: 5′-GGTAAGCGTC CTGTAGTAAGAGG-3′。
PCR體系的總體積為 20 μL,在薄壁離心管中分別加入ddH2O 15.5 μL、10 ×Taq酶緩沖液2.0 μL、10 mmol·L-1的dNTPs 0.5 μL、20 μmol·L-1的上游引物/下游引物各0.4 μL、50 ng·μL-1的模板DNA 0.8 μL和2 U·μL-1TaqDNA聚合酶0.4 μL。PCR反應(yīng)在伯樂C1000型PCR儀上進(jìn)行,程序?yàn)椋?94 ℃預(yù)變性5 min; 94 ℃ 30 s,56.2 ℃ 45 s,72 ℃ 2 min,共32個(gè)循環(huán); 循環(huán)結(jié)束后,72 ℃繼續(xù)延伸10 min。PCR產(chǎn)物用1%的瓊脂糖凝膠電泳檢測(cè),再用潔凈的刀片割取含目的片段的膠塊,經(jīng)試劑盒法回收和純化后,將其與p-GEM T-easy載體(Promega)連接,室溫放置1 h制備連接產(chǎn)物。將重組載體導(dǎo)入大腸桿菌(Escherichiacoli)DH5α感受態(tài)細(xì)胞,經(jīng)涂布、挑取單菌落和液體培養(yǎng)后,吸取0.5 μL菌液用作PCR模板,程序同邊界片段克隆,最后各取3份陽性菌液用于測(cè)序。
以多脈鐵木全基因組序列為材料,利用MIcroSAtellite Identification Tool(MISA)工具包提供的Perl程序鑒定SSR序列,參數(shù)采用默認(rèn)值,即單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重復(fù)次數(shù)分別為10、6、5、5、5、5,2個(gè)SSR 之間的最小距離為100 bp。
從NCBI數(shù)據(jù)庫下載日本榿木(Alnusjaponica)(登錄號(hào): MF136507)、紅榿木(A.rubra)(MG356709)、普陀鵝耳櫪(Carpinusputoensis)(NC_033503)、天臺(tái)鵝耳櫪(C.tientaiensis)(KY174338)、毛榛(Corylusmandshurica)(NC_039127)、滇榛(C.yunnanensis)(NC_039129)、鐵木(NC_039816)、天目鐵木(MG662135)、毛果鐵木(O.trichocarpa)(MG662130)、間型虎榛(Ostryopsisintermedia)(NC_040000)和滇虎榛(O.nobilis)(NC_040001)的葉綠體基因組序列,用于后續(xù)的共線性分析和系統(tǒng)發(fā)育分析。
利用在線工具Circoletto(http:∥tools.bat.infspire.org/circoletto/)對(duì)鐵木屬的多脈鐵木、天目鐵木、鐵木和毛果鐵木的葉綠體基因組進(jìn)行共線性分析,參數(shù)采用默認(rèn)值(Darzentas, 2010)。利用IRscope(https:∥irscope.shinyapps.io/irapp/)繪制鐵木屬4個(gè)種的葉綠體基因組的邊界(Amiryousefietal., 2018)。12種植物的葉綠體基因組經(jīng)多重比較,用PhyML 3.1軟件生成最大似然樹(Guindonetal., 2010)。
以多脈鐵木葉片基因組DNA為模板,利用4對(duì)PCR引物擴(kuò)增葉綠體基因組的邊界序列。電泳結(jié)果表明,4個(gè)片段的PCR產(chǎn)物分別位于600 bp、1 400 bp、800 bp和800 bp處,條帶單一、明亮,大小與預(yù)期一致(圖1)。經(jīng)割膠、片段回收、連接、轉(zhuǎn)化和測(cè)序,獲得各自的測(cè)序結(jié)果。結(jié)果表明,4個(gè)片段的大小分別為638、1 407、891、873 bp,經(jīng)序列比對(duì),與拼接結(jié)果完全一致。
經(jīng)拼接、注釋和繪圖,獲得多脈鐵木葉綠體基因組圖譜(圖2)。多脈鐵木葉綠體基因組具一個(gè)四分體結(jié)構(gòu),LSC、SSC與IR的長度分別為88 514、18 953、26 058 bp; IR的GC值(G和C占總堿基數(shù)的百分比)最大,為42.5%,LSC其次,為34.2%,SSC的GC值最小,僅29.8%。多脈鐵木葉綠體基因組的全長為159 583 bp,GC值為36.4%(表1)。
圖1 PCR產(chǎn)物的電泳
圖2 多脈鐵木葉綠體基因組圖譜
利用MISA軟件檢測(cè)多脈鐵木葉綠體基因組中的SSR,共得到58個(gè)。單堿基重復(fù)的數(shù)量最多,為53個(gè),占總SSR數(shù)量的91.4%,TA重復(fù)次之,為3個(gè),AT重復(fù)最少,僅2個(gè)。單堿基重復(fù)中,T重復(fù)的數(shù)量最多,為30個(gè),A堿基重復(fù)的數(shù)量次之,為21個(gè),C重復(fù)最少,僅2個(gè)。
基因注釋結(jié)果表明,多脈鐵木葉綠體基因組共有131個(gè)基因,包括87個(gè)蛋白編碼基因、36個(gè)tRNA基因、8個(gè)rRNA基因和2個(gè)假基因。蛋白編碼基因中,光系統(tǒng)Ⅱ亞基基因的數(shù)量最多,為15個(gè),核糖體蛋白小亞基基因次之,共14個(gè),Rubisco大亞基、成熟酶、蛋白酶、被膜蛋白、乙酰CoA亞基、細(xì)胞色素C合成酶和翻譯起始因子基因的數(shù)量最少,均只有1個(gè)(表2)。多脈鐵木葉綠體基因中,trnA-UGC、trnI-CAT、trnI-GAU、trnL-CAA、trnN-GTT、trnR-ACG、trnV-GAC、rps7、rps12、rpl2、rpl23、ndhB、ycf2、ycf1及4種rRNA基因各有2份拷貝。rps12、clpP和ycf3基因具2個(gè)內(nèi)含子,trnA-UGC、trnI-GAU、trnL-UAA、trnS-CGA、trnV-UAC、rpl2、rpl16、rps16、rpoC1、ndhA、ndhB、petB、petD和atpF有1個(gè)內(nèi)含子,其余基因均沒有內(nèi)含子。未知功能蛋白基因ycf1有2份拷貝,但位于IRb/SSC邊界的ycf1長度僅1 194 bp,為假基因; 另外,ycf15的序列長度顯著短于正?;?,也是假基因。
表1 多脈鐵木葉綠體基因組的堿基組成
表2 多脈鐵木葉綠體基因組基因信息①
① ×2: 2份拷貝; Ψ: 假基因; *: 1個(gè)內(nèi)含子; **: 2個(gè)內(nèi)含子?!?: Two copies; Ψ: Pseudogene; *: One intron; **: Two introns.
利用在線工具Circoletto對(duì)4種鐵木屬植物的葉綠體基因組進(jìn)行比對(duì),結(jié)果表明,多脈鐵木與其他3個(gè)種的葉綠體基因組的結(jié)構(gòu)十分相似,并且具有較好的共線性關(guān)系(圖3)。序列多重比對(duì)的結(jié)果表明,4個(gè)種的葉綠體基因組序列之間的相似性較高,其中,多脈鐵木與天目鐵木的相似性達(dá)99.1%,與鐵木的相似性最低,為98.7%; 而毛果鐵木與鐵木的序列相似性高達(dá)99.5%。
借助IRscope工具生成4種鐵木屬植物的邊界圖(圖4),4種植物IRb/SSC和SSC/IRa邊界上的基因分布十分相似,各有一個(gè)ycf1基因,SSC/IRa邊界上的ycf1全長為5 744 bp或5 750 bp,而IRb/SSC邊界的ycf1基因較短,僅1 193 bp,它們均為假基因。多脈鐵木與另外3種鐵木屬植物在LSC/IRb及IRa/LSC邊界存在較大差別,鐵木、天目鐵木和毛果鐵木在2個(gè)邊界上的基因均為rpl23,而多脈鐵木葉綠體基因組中為rps19和trnH(圖4)。
系統(tǒng)發(fā)育分析結(jié)果表明,構(gòu)建系統(tǒng)發(fā)育樹的最佳模型為GTR + G + I,AIC(Akaike information criterion, 赤池信息標(biāo)準(zhǔn))為556 643.629 64,BIC(Bayesian information criterion, 貝葉斯信息標(biāo)準(zhǔn))為556 954.642 07。系統(tǒng)發(fā)育分析結(jié)果表明,12種植物在發(fā)育樹上可分為兩大組,樺木族(Betuleae)的日本榿木和紅榿木為一組(I),榛族(Coryleae)的10種植物聚于另一組; 榛族植物中,榛屬(Corylus)的毛榛和滇榛聚于組II,鵝耳櫪屬(Carpinus)的天臺(tái)鵝耳櫪和普陀鵝耳櫪聚于組III,虎榛子屬(Ostryopsis)的間型虎榛和滇虎榛聚于組V,而多脈鐵木與其他3種鐵木屬植物聚于組IV,支持率均為100%(圖5)。
圖3 多脈鐵木與3種鐵木屬植物葉綠體基因組的比對(duì)
圖4 鐵木屬植物葉綠體基因組的邊界
圖5 基于葉綠體基因組序列構(gòu)建的系統(tǒng)發(fā)育樹
多脈鐵木由于數(shù)量稀少,已列入浙江省珍稀瀕危野生植物和極小種群保護(hù)對(duì)象; 經(jīng)科研人員多年的野外調(diào)查和研究發(fā)現(xiàn),多脈鐵木低齡個(gè)體數(shù)量不足,種群面臨衰退,物種亟待保護(hù)(吳世斌等, 2018)。吳世斌等(2019)對(duì)多脈鐵木群落結(jié)構(gòu)進(jìn)行研究,發(fā)現(xiàn)該物種的垂直和徑階結(jié)構(gòu)均呈正態(tài)分布,群落具有較高的物種多樣性。葉綠體基因組因結(jié)構(gòu)保守、組成穩(wěn)定、信息位點(diǎn)豐富和母性遺傳等特點(diǎn),近年來在瀕危植物保護(hù)生物學(xué)方面得到了一些應(yīng)用,并取得了一定的成果(Lietal., 2017; Yangetal., 2017; Kyaloetal., 2018)。
植物葉綠體基因組的結(jié)構(gòu)通常十分保守,具有典型的四分體結(jié)構(gòu),由2個(gè)IR區(qū)域?qū)SC和SSC隔開(Wickeetal., 2011)。LSC上分布的基因數(shù)量最多,而IR上的基因相對(duì)較少,在被子植物中,IR的長度約20~30 kb,而大多數(shù)非種子植物中僅為10~15 kb(Wolfetal., 2010)。珍稀植物浙江楠(Phoebechekiangensis)和閩楠(P.bournei)葉綠體基因組大小分別為152 849 bp和152 853 bp,它們的IR長度為18 927 bp和18 928 bp(Lietal., 2017); 喙核桃(Caryasinensis)葉綠體基因組全長為160 195 bp,其IR較長,為26 058 bp(Huetal., 2016)。在某些植物中,IR區(qū)域存在完全缺失現(xiàn)象。南方紅豆杉(Taxuswallichianavar.mairei)葉綠體基因組全長為129 513 bp,其中的一個(gè)IR發(fā)生缺失(Zhangetal., 2014),類似的現(xiàn)象也發(fā)生在日本柳杉(Cryptomeriajaponica)和油松(Pinustabulaeformis)中(Hiraoetal., 2008; Yuetal., 2017)。本研究中,多脈鐵木具有一個(gè)完整的四分體結(jié)構(gòu),IR長度為26 058 bp,較天目鐵木、鐵木和毛果鐵木的IR長1 670 bp左右,說明該區(qū)域在多脈鐵木葉綠體基因組中存在擴(kuò)張現(xiàn)象,IR的擴(kuò)張?jiān)陂熑~十大功勞(Mahoniabealei)及含羞草亞科(Mimosoideae)植物Acacialigulata和Ingaleiocalycina中也有發(fā)現(xiàn)(Guisingeretal., 2010; Maetal., 2013; Dugasetal., 2015)。
與核糖體內(nèi)轉(zhuǎn)錄間隔區(qū)(internal transcribed spacer, ITS)、葉綠體基因和基因間隔區(qū)相比,葉綠體基因組的信息量更為豐富,基于它構(gòu)建的系統(tǒng)發(fā)育樹更為科學(xué),目前,葉綠體基因組已廣泛應(yīng)用于植物的系統(tǒng)發(fā)育分析(Danielletal., 2016)。Thode等(2019)利用葉綠體基因組對(duì)杯領(lǐng)藤屬(Amphilophium)植物進(jìn)行分子進(jìn)化研究,推測(cè)該屬植物起源于早始新世,分化于晚始新世。Chen等(1999)利用核糖體內(nèi)轉(zhuǎn)錄間隔區(qū)和葉綠體rbcL基因?qū)迥究浦参镞M(jìn)行系統(tǒng)發(fā)育分析,結(jié)果表明,虎榛子屬、鵝耳櫪屬和鐵木屬植物聚于一組,支持率為60%~88%,榛屬植物為它們的姐妹群,支持率達(dá)99%。本研究中,利用葉綠體基因組進(jìn)行系統(tǒng)發(fā)育分析,也得到了類似的結(jié)果,但支持率更高,達(dá)100%。SSR也稱微衛(wèi)星序列,廣泛分布于生物體的基因組上,由于重復(fù)單位數(shù)量的不同而形成多態(tài)性,SSR在遺傳多樣性、保護(hù)生物學(xué)和物種鑒定等方面得到了廣泛應(yīng)用(Tuleretal., 2015; Lietal., 2018)。與核基因組相比,葉綠體基因組相對(duì)較小,但也存在一定數(shù)量的SSR(Kuangetal., 2011)。多脈鐵木葉綠體基因組共鑒定出58個(gè)SSR,其中大部分為單堿基重復(fù),主要為polyA或polyT重復(fù),雙堿基及更多堿基的重復(fù)頻率很低,與前人的研究結(jié)果(Wangetal., 2013)一致。多脈鐵木葉綠體SSR的檢測(cè)和分析,為后續(xù)開發(fā)SSR分子標(biāo)記奠定了基礎(chǔ)。
在高通量測(cè)序的基礎(chǔ)上,利用NOVOplasty等軟件進(jìn)行組裝,并通過PCR擴(kuò)增和測(cè)序驗(yàn)證,獲得多脈鐵木完整的葉綠體基因組序列。多脈鐵木葉綠體基因組的全長為159 583 bp,LSC、SSC和IR的長度分別為88 514 bp、18 953 bp和26 058 bp; 多脈鐵木葉綠體基因組有131個(gè)基因,包括87個(gè)蛋白編碼基因、36個(gè)tRNA基因、8個(gè)rRNA基因,其中的2個(gè)蛋白編碼基因?yàn)榧倩?。葉綠體基因組中,共有SSR位點(diǎn)58個(gè),其中大部分為單堿基重復(fù)。在系統(tǒng)發(fā)育樹上,多脈鐵木與鐵木、毛果鐵木及天目鐵目聚為一組,支持率均為100%,并與鵝耳櫪屬互為姊妹群。多脈鐵木葉綠體基因組的組裝、序列比對(duì)和系統(tǒng)發(fā)育分析,為將來開展該植物的遺傳結(jié)構(gòu)和群體遺傳多樣性研究奠定了基礎(chǔ)。