周蕓蕓 郭敏 彭英權(quán) 金晨鐘 張雪嬌 胡一鴻 陳功 龔意輝
關(guān)鍵詞:一年蓬;葉綠體;基因組;結(jié)構(gòu)特征;系統(tǒng)發(fā)育
中圖分類號:S668.3 文獻(xiàn)標(biāo)識碼:A
一年蓬[Erigeron annuus (L.) Pers.]隸屬于菊科(Asteraceae),紫菀族(Astereae),飛蓬屬(Erigeron),一年或兩年生植物,原產(chǎn)于北美洲,早年作為觀賞植物進(jìn)入我國,現(xiàn)廣泛分布于我國[1]。一年蓬的花形似小雛菊,民間用全草或根可入藥,具有清熱解毒、消食止瀉的功效[1]。近年來有研究報道一年蓬植株提取液具有抗炎、抑菌、止血、鎮(zhèn)痛的效果[2-5],在一年蓬水提物的研究中還發(fā)現(xiàn)其對高脂肪飲食的小鼠具有抗肥胖的作用[6]。一年蓬被認(rèn)為是一種修復(fù)金屬和類金屬污染土壤的潛能植物,對Cd 和Zn 等金屬及柴油具有較好的富集和耐受效果[7-8]。然而它作為一種入侵植物,對我國農(nóng)林業(yè)發(fā)展、本地物種多樣性及生態(tài)系統(tǒng)具有嚴(yán)重的影響,被我國生態(tài)環(huán)境部列入第三批外來入侵物種名單[1, 9]。目前國內(nèi)外對一年蓬活性化合物[10-12]、入侵及適應(yīng)機(jī)制[13-15]、防除[16-17]等方面研究較多,而有關(guān)一年蓬葉綠體全基因組特征、序列分析及其相關(guān)系統(tǒng)發(fā)育分析等尚未見報道。
葉綠體(chloroplast, CP)是為綠色植物提供能量的光合細(xì)胞器,它們在光合作用及相關(guān)代謝活動中起重要作用[18]。被子植物中典型的葉綠體基因組為雙鏈共價閉合環(huán)狀分子,具有典型的四分體結(jié)構(gòu),其中一個大單拷貝區(qū)(large single copyregion, LSC),小單拷貝區(qū)(small single copyregion, SSC),反向重復(fù)區(qū)A(inverted repeat regionA, IRA),反向重復(fù)區(qū)B(inverted repeat region B,IRB)[19]。基因組的長度一般在120~ 170 kb 之間,通常編碼110~130 個基因,約40 個基因是參與光合作用、轉(zhuǎn)錄和翻譯[20]。葉綠體基因具自我復(fù)制的特點,在大多數(shù)植物中為母系遺傳,進(jìn)化過程中不經(jīng)歷重組,能直接反映植物在長期的進(jìn)化過程中積累的遺傳變異,已被廣泛用于闡明物種遺傳多樣性、進(jìn)化歷程、系統(tǒng)發(fā)育地位及近緣種間和種內(nèi)的遺傳關(guān)系等相關(guān)研究[21-22]。隨著新一代測序技術(shù)的發(fā)展,植物基因組得到了廣泛的研究,多種菊科植物的葉綠體基因組研究都已被報道,涉及到的屬有紫菀屬( Aster )、向日葵屬( Heloanthus )、飛蓬屬( Erigeron )、蒿屬( Artemisia )、菜薊屬( Cynara )、萵苣屬(Lactuca)、禾葉金菀屬(Pityopsis)等[23-27]。本研究以一年蓬為試材,利用高通量測序,對組裝后的一年蓬葉綠體基因組結(jié)構(gòu)、序列特征、與近緣物種序列的差異,在紫菀族族中的地位及與該屬其他植物的親緣關(guān)系等方面進(jìn)行分析與研究,旨在為后續(xù)一年蓬的遺傳、系統(tǒng)發(fā)育、進(jìn)化歷程及資源開發(fā)利用與防除等研究奠定分子理論基礎(chǔ)。
1 材料與方法
1.1 材料
供試材料一年蓬采集于湖南省婁底市婁星區(qū)湖南人文科技學(xué)院校園內(nèi)( 27°5331"N ,111°542"E),植物樣本經(jīng)湖南人文科技學(xué)院金晨鐘、胡一鴻教授進(jìn)行植物分類學(xué)鑒定。采摘一年蓬健康植株幼嫩綠色葉片,用液氮速凍后放置于–80 ℃的超低溫冰箱中,備用。
1.2 方法
1.2.1 DNA 提取與測序分析 植物全基因組DNA 用天根生化科技(北京)有限公司的植物基因組DNA 提取試劑盒(DP305)提取,并通過NanoDrop2000 分光光度計和瓊脂糖凝膠電泳檢測總DNA 的質(zhì)量和濃度。將高質(zhì)量的DNA 樣本送南京集思慧遠(yuǎn)生物科技有限公司進(jìn)行測序,測序采用Illumina NovaSeq 6000 平臺,使用fastp0.20.0( https://github.com/OpenGene/fastp)軟件對原始數(shù)據(jù)進(jìn)行過濾得到高質(zhì)量reads,得到18 635 007 條reads(Q20 為97.49%,Q30 為93.02%)供后續(xù)組裝和注釋用。
1.2.2 葉綠體基因組組裝與注釋 從NCBI 上下載已發(fā)表的小蓬草( Erigeron canadensis, MT806101.1)的葉綠體全基因組序列為參照,采用SPAdes[28]v3.10.1(http://cab.spbu.ru/software/spades/)、SSPACE v2.0(https://www.baseclear.com/sevices/bioinformatics/basetools/sspace-standard/)、Gapfillerv2.1.1[29](https://sourceforge. net/projects/gapfiller/)在線組裝軟件對葉綠體基因組進(jìn)行組裝、校正,得到完整的一年蓬葉綠體環(huán)狀基因組序列。使用在線軟件prodigal v2.6.3(https://www.github.com/hyattpd/Prodigal)注釋葉綠體的CDS,使用hmmer v3.1b2(http://www.hmmer.org/)在線軟件預(yù)測rRNA,使用在線軟件aragorn v1.2.38(http://130.235.244.92/ARA GORN/)預(yù)測tRNA,再使用blastv2.6(https:// blast.ncbi.nlm.nih.gov/Blast.cgi)比對組裝的序列,獲得最終的注釋。將注釋完成的一年蓬葉綠體基因組序列,用在線軟件OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)制作葉綠體基因組圖譜。
1.2.3 葉 綠 體基因組特征及對比分析 使用MISA v1.0 ( MIcroSAtellite identification tool,http://pgrc.ipk-gatersleben.de/misa/misa.html)在線軟件分析一年蓬葉綠體全基因組SSR 位點,利用Find repeats 工具獲得小蓬草、多舌飛蓬(E. multiradiatus)、短葶飛蓬(E. breviscapus)、香絲草(E. bonariensis)等4 種基因組的LSC 序列、SSC 序列和IR 序列,采用MAFFT 軟件[30]進(jìn)行多序列比對, 最后使用RAxML v8.2.10( https://cme.h-its.org/exelixis/software.html ) 軟件,選用GTRGAMMA 模型,rapid Bootstrap 分析,bootstrap=1000,構(gòu)建最大似然系統(tǒng)發(fā)育樹。
2 結(jié)果與分析
2.1 一年蓬葉綠體基因組結(jié)構(gòu)
一年蓬葉綠體基因組是一個典型的四分體結(jié)構(gòu),其基因組全長為153 283 bp,AT、GC 含量分別為62.95%、37.05%。其中包括大單拷貝區(qū)(LSC)84 833 bp,GC 含量為34.87%;小單拷貝區(qū)(SSC)18 412 bp,GC 含量為30.95%;反向重復(fù)區(qū)(IRa和IRb)長25 019 bp,GC 含量為42.98%(表1,圖1)。一年蓬葉綠體基因組共注釋出132 種基因,編碼蛋白質(zhì)基因、tRNA 基因和rRNA 基因分別為88、36、8(表1)。
2.2 葉綠體基因的組成和特點
按照功能分類將已注釋到的這些基因分為光合作用相關(guān)基因(photosynthesis genes)、自我復(fù)制基因(self-replication genes )、其他基因(othergenes)、未知功能基因(genes of unknown function)四大類(表2)。光合作用相關(guān)基因主要包括5 個光合系統(tǒng)I 基因(subunits of photosystem I)、15 個光合系統(tǒng) II 基因(subunits of photosystem II)、12 個NADH 脫氫酶基因(subunits of NADH dehydrogenase)、6 個細(xì)胞色素復(fù)合物編碼基因(subunits of cytochrome b/f complex)、6 個ATP合酶基因(subunits of ATP synthase)、1 個二磷酸核酮糖羧化酶大亞基基因( large subunit ofrubisco);自我復(fù)制基因主要包括11 個核糖體蛋白大亞基基因(proteins of large ribosomal subunit)、14 個核糖體小亞基基因(proteins of smallribosomal subunit)、4 個RNA 聚合酶亞基基因(subunits of RNA polymerase)、8 個rRNA 基因和36 個tRNA 基因;此外還有6 個其他功能基因及8 個未知功能基因。其中ndhB、rpl2、rpl23、rps12、rps7、rrn16、rrn23、rrn4.5、rrn5、trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnRACG、trnV-GAC、ycf1、ycf15 和ycf2 均含2 個拷貝基因。18 個基因含有1 個內(nèi)含子,分別為ndhA、ndhB(2)、petB、petD、atpF、rps12*(2)、rps16、rpoC1、trnA-UGC(2)、trnG-UCC、trnI-GAU(2)、trnK-UUU、trnL-UAA、trnV-UAC。2 個基因含有2 個內(nèi)含子,分別為clpP 和ycf3。值得注意的是,本研究所注釋到8 個未知功能基因(ycf1(2)、ycf15(2)、ycf2(2)、ycf3、ycf4)仍需利用先進(jìn)的分子技術(shù)手段對其功能進(jìn)行鑒定。
2.3 IR 邊界的特征
使用在線網(wǎng)站IRscope(https://irscope. shinyapps.io/irapp/)繪制對比圖,比較一年蓬與多舌飛蓬(E. multiradiatus)、香絲草(E. bonariensis)、短莛飛蓬(E. breviscapus)、小蓬草(E. canadensis)4 個物種的LSC、SSC 和IR 區(qū)的邊界位置(圖2),這5 個菊科物種葉綠體基因組4 個區(qū)域中,IR 區(qū)較為保守,其片段大小為24 326~25 019 bp。rps19基因位于LSC/IRb 區(qū)域中,其中一年蓬、香絲草、短莛飛蓬和小蓬草中LSC 和IRb 區(qū)向擴(kuò)張程度相同,均為217、62 bp,多舌飛蓬在LSC 和IRb 區(qū)向擴(kuò)張分別為212、67 bp。這5 種植物中的rpl2基因均位于IR 區(qū)域內(nèi)。一年蓬中的tmN 基因位于IRa 區(qū)域內(nèi),而多舌飛蓬、香絲草、短莛飛蓬和小蓬草中位于IRb 區(qū)域內(nèi);一年蓬存在2 個ycf1基因,分別在SSC/IRb 邊界擴(kuò)張,距離JSB 邊界567、12 bp,SSC/IRa 邊界區(qū)域中擴(kuò)張,距離JSA邊界分別為4482 bp 和15 bp,而其他4 種植物只存在1 個ycf1 基因;SSC/IRb 邊界顯示,一年蓬、多舌飛蓬、短莛飛蓬和小蓬草中的ndhF 基因全部在SSC 區(qū)域內(nèi)擴(kuò)張,而香絲草并沒有檢測到ndhF基因。這5 種植物中的tmH 基因全部在LSC 區(qū)域內(nèi)擴(kuò)張。
2.4 葉綠體基因組SSR 位點分析
使用MISAv1.0(http://pgrc.ipk-gater-sleben.de/misa/misa.html)在線軟件對一年蓬葉綠體基因組進(jìn)行重復(fù)單元(SSR)位點分析(圖3)。共在一年蓬葉綠體基因組中查找到200 個符合條件的SSR 位點,分布在LSC、SSC、IR 區(qū)域的SSR 數(shù)量分別為126、40、34 個,分別占總SSR 位點數(shù)比重為63%、20%、17%。單核苷酸重復(fù)單元共139 個,主要以A 和T 為主,雙核苷酸重復(fù)單元20 個,主要以AT 和TA 為主,三核苷酸重復(fù)單元106 個,主要以TTA、TAA 和TAT 為主。四核苷酸重復(fù)單元13 個,主要以TATT 和 TTAT 為主,五核苷酸重復(fù)單元3 個,分別為TACTA、TATAT、TTAGA。說明一年蓬葉綠體基因組中A/T 堿基占優(yōu)勢,具有堿基偏好性。這與該物種中AT 含量占62.95%的結(jié)果相一致。
2.5 系統(tǒng)發(fā)育分析
將一年蓬與菊科管狀花亞科紫菀族21 種植物葉綠體基因組序列,以舌狀花亞科苦荬菜屬植物苦荬菜(Ixeris polycephala)為外群構(gòu)建發(fā)育樹(圖4)。進(jìn)化樹結(jié)果顯示,一年蓬與一枝黃花(Solidago decurrens)、鉆葉紫菀(Symphyotrichumsubulatum)、多舌飛蓬、短莛飛蓬、香絲草、小蓬草、瓶頭草(Lagenophora cuchumatanica)聚在一個分支上,紫菀屬植物聚類在另外一支。從飛蓬屬的5 個物種的親緣關(guān)系來看,一年蓬與同屬的小篷草(MT806101.1)聚在一起,形成2 個姊妹類群。
3 討論
葉綠體細(xì)胞器參與高等植物光合作用和碳固定等生理活動,是承擔(dān)能量轉(zhuǎn)換的重要細(xì)胞器[31]。葉綠體基因組是植物細(xì)胞內(nèi)3 種基因組中最為保守的一類,具有高度的保守性和較慢的進(jìn)化速率,在不同物種間的系統(tǒng)進(jìn)化研究中有更好的統(tǒng)一性[32]。植物葉綠體基因組長度一般為107~218 kb,不同物種之間長度略有不同,其長度的變化主要是由IR 區(qū)的收縮和擴(kuò)張導(dǎo)致[33]。本研究所獲得的一年蓬葉綠體基因組大小與結(jié)構(gòu)與已報道的被子植物研究結(jié)果相符。一年蓬葉綠體基因組是一個典型的四分體結(jié)構(gòu),全長為153 283 bp,與同屬植物小蓬草( 152 721 bp )、多舌飛蓬(152 281 bp)、短葶飛蓬(152 357 bp)、香絲草(153 014 bp)差異小,與已報道的菊科植物葉綠體基因組長度(149.51~153.20 kb)相比較,一年蓬及其所屬的飛蓬屬植物葉綠體基因組長度較長[23-34]。一年蓬葉綠體基因組中AT、GC 含量分別為62.95%、37.05%,其中反向重復(fù)區(qū)(IRs)中GC 含量達(dá)到最高(42.98%),這與其他菊科植物葉綠體基因組特征一致[25]。一年蓬基因組大單拷貝區(qū)(LSC)84 833 bp,小單拷貝區(qū)(SSC)18 412 bp,反向重復(fù)區(qū)(IRs)25 019 bp,與多舌飛蓬(AT:62.90%、GC:37.10%;LSC:84 881 bp、SSC:18 102 bp、IRs:24 692 bp)、短葶飛蓬(AT:62.80%、GC:37.20%;LSC:84 789 bp、SSC:18 110 bp、IRs:24 691 bp)遺傳差異很小,主要差異在SSC 和IRs 區(qū)域,相差300 bp 左右[35]。通過IRscope 比較分析,發(fā)現(xiàn)飛蓬屬的幾個物種葉綠體基因組結(jié)構(gòu)和大小高度保守,但是SC 和IR邊界仍會有細(xì)微區(qū)別。這與蘇玥等[36]對乳苣葉綠體基因組特征研究結(jié)果一致,乳苣與其他5 種菊科近緣種植物葉綠體基因組進(jìn)行比較分析時發(fā)現(xiàn)基因組序列整體高度相似,但是在rps19、rpl2、ycf1、trnN、ndhF、trnH 和rpl23 等基因上有變化。
一年蓬葉綠體基因組共注釋出132 種基因,其中編碼蛋白質(zhì)基因、tRNA 基因和rRNA 基因數(shù)量分別為88、36、8 個。梁鳳萍等[23]對27 種菊科植物葉綠體基因組進(jìn)行注釋,發(fā)現(xiàn)菊科植物葉綠體基因組共有基因一般為125~138 個,編碼蛋白基因為83~90 個,tRNA 基因32~43 個,rRNA基因7~9 個。同屬多舌飛蓬和短葶飛蓬葉綠體基因組共注釋129 個基因,編碼蛋白質(zhì)基因84 個、tRNA 基因37 個和rRNA 基因8 個[35]。一年蓬葉綠體基因組基因數(shù)目特征與其他菊科植物一致,值得提出的是本研究注釋到8 個未知功能基因[ycf1(2)、ycf15(2)、ycf2(2)、ycf3、ycf4],需進(jìn)一步利用先進(jìn)的分子技術(shù)手段對其功能進(jìn)行鑒定。
葉綠體SSR(cp SSR)通常是短的單核苷酸串聯(lián)重復(fù)序列,當(dāng)位于線粒體基因組的非編碼區(qū)域時,通常顯示種內(nèi)變異重復(fù)次數(shù)[37]。cp SSR 可以在同一物種內(nèi)表現(xiàn)出高度變異,被廣泛應(yīng)用于群體遺傳學(xué)和系統(tǒng)發(fā)育分析等領(lǐng)域[38-39]。在一年蓬葉綠體基因組LSC、SSC、IR 區(qū)域的SSR 數(shù)量分別為126、40、34 個,單核苷酸重復(fù)單元最多,其次是三核苷酸重復(fù)單元,A/T 堿基占優(yōu)勢,在菊科[40-41]和其他植物科[42-43]中研究結(jié)果一致。這些SSR 可為飛蓬屬物種分子標(biāo)記開發(fā)及物種鑒定提供理論依據(jù)。
隨著葉綠體基因組測序數(shù)量的增加,很多學(xué)者通過該類基因組重建了菊科植物的系統(tǒng)發(fā)育關(guān)系。本研究在NCBI 上下載了22 種紫菀族植物,以舌狀花亞科苦荬菜屬植物苦荬菜為外群,構(gòu)建系統(tǒng)發(fā)育樹。一年蓬在內(nèi)的飛蓬屬與聯(lián)毛紫菀屬、一枝黃花屬和瓶頭草屬的植物聚類在一個分支上,紫菀屬植物另聚類為一支。這與基于ITS 等分子標(biāo)記建立的分子系統(tǒng)發(fā)育樹顯示的小蓬草與飛蓬屬、一枝黃花屬等構(gòu)成一個分支的結(jié)果一致[44]。一年蓬與同屬小蓬草聚在一起,認(rèn)為基于葉綠體基因組數(shù)據(jù),同屬植物的親緣關(guān)系最近。本研究對一年蓬綠體基因組基因結(jié)構(gòu)、SSRs 數(shù)量及分布和基因功能等進(jìn)行了分析,結(jié)合已公布的紫菀族族物種葉綠體基因組序列構(gòu)建了系統(tǒng)發(fā)育樹,闡明了一年蓬和紫菀族不同物種之間的系統(tǒng)發(fā)育關(guān)系,豐富了菊科植物的進(jìn)化關(guān)系,為植物分類、遺傳進(jìn)化、系統(tǒng)發(fā)育及一年蓬的開發(fā)和防除等研究奠定了分子基礎(chǔ)。