樓天靈,袁莉霞,張國(guó)芳,吳 浩,沈 嵐
(1.浙江藥科職業(yè)大學(xué),浙江 寧波 315100; 2.寧波市農(nóng)業(yè)科學(xué)研究院,浙江 寧波 315100)
鐵皮石斛(Dendrobiumcandidum)是多年生草本植物,屬于蘭科(Orchidaceae)石斛屬(Dendrobium),是一種傳統(tǒng)的名貴中草藥。其具有益胃生津、滋陰清熱之功效,富含多糖及幾十種微量元素,素有“千金草”“神仙草”之稱[1]。近年來,通過藥理及有效成分分析發(fā)現(xiàn),鐵皮石斛中的有效成分主要為多糖類物質(zhì),能提高免疫力,降低血糖,抗氧自由基及保護(hù)胃等功效[2]。隨著中藥在臨床用藥中的增加,野生資源的過度開采,野生資源蘊(yùn)藏量顯著下降,難以滿足加工和臨床使用的需求。人工種養(yǎng)規(guī)模和產(chǎn)區(qū)范圍隨之均逐步擴(kuò)大,藥材質(zhì)量不穩(wěn)定、品種退化問題也隨之嚴(yán)峻。因此,篩選培育優(yōu)良種源,擴(kuò)大新的藥源迫在眉睫。而植物物種間的遺傳親緣關(guān)系越接近,其所含的化學(xué)有效成分類型及含量也越相近[3],能較快地發(fā)現(xiàn)新藥源[4]。但目前有關(guān)鐵皮石斛的研究主要集中于藥理藥效、有效成分分析等方面[5-6],系統(tǒng)發(fā)育方面的研究較少。
葉綠體在植物細(xì)胞中起著至關(guān)重要的作用,能進(jìn)行植物的光合作用,具有一套自主的遺傳物質(zhì),有研究表明,其源于內(nèi)共生藍(lán)藻[7]。大量研究表明,多數(shù)被子植物的葉綠體基因組為雙鏈環(huán)狀四分體結(jié)構(gòu)[8],大單拷貝區(qū)(Large Single Copy Region, LSC)、小單拷貝區(qū)(Small Single Copy Region, SSC)和反向重復(fù)區(qū)(Inverted Repeat Regions, IRa/IRb)。葉綠體基因組較核基因組及線粒體基因組更為保守,其長(zhǎng)度在120~160 kb之間,總基因個(gè)數(shù)約為130個(gè)[9],具有單親遺傳不存在重組、序列變異度適中等特點(diǎn)[10]。近年來,隨著高通量測(cè)序的發(fā)展,葉綠體基因組的研究也越來越多,自1986年煙草[11]和地錢[12]首次公布以來,已有超3 000條葉綠體基因組被公布[13]。
本研究基于Illumina二代測(cè)序技術(shù)及生物信息學(xué)方法,分析了鐵皮石斛的葉綠體基因組全序列測(cè)序、基因功能注釋、圖譜構(gòu)建,并對(duì)其結(jié)構(gòu)特征作出解析。選取了已發(fā)表的13個(gè)蘭科植物以及2個(gè)外類群葉綠體基因組序列,做了親緣關(guān)系分析,為鐵皮石斛的藥用資源開發(fā)、遺傳多樣性、種間系統(tǒng)親緣關(guān)系及新藥源的開發(fā)等研究奠定理論基礎(chǔ)。
鐵皮石斛樣品采集自寧波市寧??h小宋村1個(gè)野生居群,由浙江省寧波市農(nóng)業(yè)科學(xué)研究院沈嵐高級(jí)農(nóng)藝師鑒定。標(biāo)本存放于浙江省寧波市農(nóng)業(yè)科學(xué)研究院石斛種質(zhì)資源庫中。
取鮮嫩幼葉約2 g,液氮冷凍研磨至粉末,利用植物基因組DNA提取試劑盒(生工生物工程(上海)股份有限公司),參照說明書完成提取。根據(jù)1.5%的瓊脂糖凝膠電泳的條帶亮度及Nanodrop 1000檢測(cè)的D260/D280的比值和濃度,經(jīng)檢驗(yàn)合格的樣本送生工生物工程(上海)股份有限公司,通過Illumina HiSeq 2500-PE 150平臺(tái)進(jìn)行建庫測(cè)序。
DNA質(zhì)量檢測(cè)合格后,通過超聲波的方法將其破碎,純化并修復(fù)破碎的DNA片段,完成3′-端加ployA處理,連接測(cè)序頭[14],并利用1.5%的瓊脂糖凝膠電泳,區(qū)分不同大小的片段,完成PCR擴(kuò)增。通過基因文庫質(zhì)檢,獲得基因測(cè)序文庫。經(jīng)檢測(cè)合格的文庫利用Illumina Hi Seq 2500完成基因測(cè)序。
對(duì)Illumina測(cè)序獲得的原始測(cè)序文件數(shù)據(jù)進(jìn)行過濾,利用NGS QC ToolKit[15]除去測(cè)序接頭以及低質(zhì)量的片段,盡可能保證序列的準(zhǔn)確性,獲得高質(zhì)量的測(cè)序結(jié)果。采用NOVOPlasty軟件[16],設(shè)定K-mer值為39,參考蘭科石斛屬石斛Dendrobiumnobile(Genebank No.:KX 377961.1)的葉綠體基因組(https://www.ncbi.nlm.nih.gov/nuccore/KX 377961.1/)的保守序列對(duì)鐵皮石斛的葉綠體基因組進(jìn)行組裝,獲得完整的葉綠體基因組。得到的葉綠體組基因用Mitofy[17]完成基因功能注釋并利用CpGAVASpipeline[18]進(jìn)行準(zhǔn)確性驗(yàn)證。最后再利用在線工具OGDraw[19](https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)繪制鐵皮石斛的葉綠體基因組物理圖譜,并上傳至NCBI(https://www.ncbi.nlm.nih.gov),獲得登錄號(hào)(MZ 129032)。
利用在線軟件REPuter[20](https://bibiserv.cebitec.uni-bielefeld.de/reputer)驗(yàn)證鐵皮石斛的重復(fù)序列:正向重復(fù)序列(F)、反向重復(fù)序列(R)、正向互補(bǔ)序列(C)和回文序列(P),參數(shù)設(shè)置為:Minimal repeat size=30,Hamming distance=3;以及利用在線軟件MISA[21](http://pgrc.ipk-gatersleben.de/misa/)檢測(cè)簡(jiǎn)單重復(fù)序列(SSR),設(shè)置參數(shù)為:?jiǎn)魏塑账嶂貜?fù)≥10,二核苷酸重復(fù)≥5,三核苷酸重復(fù)≥4,四核苷酸重復(fù)≥3,五核苷酸及六核苷酸重復(fù)≥3。所有搜索得到的序列結(jié)果均通過人工予以驗(yàn)證。
利用在線軟件VISTA[22](http://genome.lbl.gov/vista/mvista/instructions.shtml)中的mVISTA工具對(duì)鐵皮石斛及石斛屬的其他3個(gè)物種(霍山石斛Dendrobiumhuoshanense、細(xì)莖石斛Dendrobiummoniliforme、石斛Dendrobiumnobile)的葉綠體全基因組進(jìn)行對(duì)比分析并繪制比對(duì)圖。
為了解鐵皮石斛在蘭科植物中的系統(tǒng)位置,從NCBI(https://www.ncbi.nlm.nih.gov)數(shù)據(jù)庫中下載了13個(gè)已發(fā)表的蘭科葉綠體基因組,2個(gè)百合科植物(外類群),分別為:長(zhǎng)距蝦脊蘭(CalanthesylvaticaNC 044633)、通麥蝦脊蘭(CalanthegriffithiiMZ 474966)、伏生石豆蘭(BulbophyllumreptansMW 800884)、杜鵑蘭(CremastraappendiculataNC 037439)、霍山石斛(DendrobiumhuoshanenseMN 617016)、細(xì)莖石斛(DendrobiummoniliformeMN 617018)、石斛(DendrobiumnobileKX 377961)、沼蘭(LiparisjaponicaMK 886513)、箬葉蘭(SobraliacallosaKM 032623)、疏花火燒蘭(EpipactisveratrifoliaNC 030708)、大葉火燒蘭(EpipactismaireiNC030705)、日本對(duì)葉蘭(NeottiajaponicaMH 321184)、小葉兜蘭(PaphiopedilumbarbigerumNC 050870),蒜(AlliumsativumMK 335928)、韭(AlliumtuberosumNC 044709),與鐵皮石斛葉綠體基因組,通過MAFFT軟件[23]完成基因組序列的比對(duì),再利用MEGA 7.0軟件[24]構(gòu)建系統(tǒng)進(jìn)化關(guān)系,確定鐵皮石斛與其他蘭科植物之間的親緣關(guān)系。
通過Illumina Hi Seq 2500平臺(tái)獲得6.98 GB的高質(zhì)量測(cè)序數(shù)據(jù),鐵皮石斛葉綠體基因組結(jié)構(gòu)與大多數(shù)被子植物類似,為雙鏈環(huán)狀的四分體結(jié)構(gòu)(圖1),其大小為153 508 bp,大單拷貝區(qū)域(LSC)為85 759 bp,小單拷貝區(qū)域(SSC)為14 973 bp,兩個(gè)反向重復(fù)區(qū)域(IRs)為26 419 bp。
在鐵皮石斛葉綠體基因組中共被注釋了133個(gè)基因,其中包括93個(gè)蛋白編碼基因(CDS),32個(gè)轉(zhuǎn)運(yùn)RNA(tRNA)基因以及8個(gè)核糖體rRNA(rRNA)基因(表1)。并對(duì)其堿基組成進(jìn)行分析,發(fā)現(xiàn)GC的含量占總共堿基數(shù)量的37.51%,其中LSC區(qū)域?qū)?yīng)的百分比為35.13%,SSC區(qū)域?qū)?yīng)的百分比為30.24%、IRa區(qū)域?qū)?yīng)的百分比為43.35%和IRb區(qū)域?qū)?yīng)的百分比為43.35%。
表1 鐵皮石斛葉綠體基因組結(jié)構(gòu)特征Table 1 Structural characteristics of Dendrobium candidum chloroplast genome
本研究利用在線軟件REPuter檢測(cè)了長(zhǎng)重復(fù)序列(長(zhǎng)度≥30 bp),鐵皮石斛共檢測(cè)到47個(gè)長(zhǎng)重復(fù)序列,其中正向重復(fù)序列19個(gè),反向重復(fù)序列20個(gè),互補(bǔ)重復(fù)序列8個(gè),其間隔序列大小均在30~50 bp之間(表2)。利用在線軟件MISA檢測(cè)鐵皮石斛葉綠體基因組中簡(jiǎn)單重復(fù)序列(SSR),共檢測(cè)到簡(jiǎn)單重復(fù)序列63個(gè),其中單核重復(fù)序列(A/C/T/G)36個(gè),二核苷酸重復(fù)序列(AT/GA/TA/TC)15個(gè),三核苷酸重復(fù)序列(ATA/TAG/TAT)5個(gè),四核苷酸重復(fù)序列(AGAA/ATTA/CTAT/GTCT/TAGT) 5個(gè),五核苷酸重復(fù)序列(TCTAT)1個(gè)、六核苷酸重復(fù)序列(TCCATC)1個(gè)(表2、表3)。
表2 鐵皮石斛葉綠體基因組中長(zhǎng)重復(fù)序列與SSR數(shù)量Table 2 The long repetitive sequences and SSR numbers of Dendrobium candidum chloroplast genomes 單位:個(gè)
表3 鐵皮石斛葉綠體基因組中SSR類型Table 3 SSR types of Dendrobium candidum chloroplast genomes
圖1 鐵皮石斛完整的葉綠體基因組圖譜Fig.1 The whole chloroplast genome map of Dendrobium candidum
以已注釋的鐵皮石斛葉綠體基因組序列(登錄號(hào): MZ 129032)為參考,再通過在線軟件工具 mVISTA 對(duì)鐵皮石斛及石斛屬的其他3個(gè)物種的葉綠體基因組進(jìn)行全基因組比較分析,結(jié)果(圖2)顯示4個(gè)葉綠體基因組均具有高度保守序列,且大部分變異均處于非編碼區(qū)。
圖2 霍山石斛、細(xì)莖石斛、石斛及鐵皮石斛的葉綠體基因組全局比對(duì)Fig.2 Global comparison of D. huoshanense, D. moniliforme, D. nobile and D.candidum chloroplast genomes
利用MAFFT軟件對(duì)從NCBI數(shù)據(jù)庫中發(fā)表的15個(gè)葉綠體基因組完成基因組與鐵皮石斛基因組序列的比對(duì),再通過MEGA 7.0軟件構(gòu)建系統(tǒng)進(jìn)化樹。結(jié)果顯示,鐵皮石斛與霍山石斛、細(xì)莖石斛、石斛成一簇,其中與石斛親緣性最近(圖3)。
圖3 基于16個(gè)葉綠體基因組構(gòu)建的進(jìn)化樹Fig.3 The evolutionary tree contructed based on 16 chloroplast genomes
鐵皮石斛是珍貴的中藥材,藥用價(jià)值與經(jīng)濟(jì)價(jià)值高。鐵皮石斛自然條件下種子與真菌共生才能萌發(fā),加上近年的過度采挖,導(dǎo)致野生石斛瀕臨滅絕,人工栽培面積逐步擴(kuò)大,為保證種源的品質(zhì)及穩(wěn)定性,已有研究人員通過EST-SSR[25]、ISSR[26]、SRAP[27]、TRAP[28]等分子手段為保證鐵皮石斛的品質(zhì)提供了一定的參考。本研究通過葉綠體基因組的發(fā)育關(guān)系分析鐵皮石斛種間系統(tǒng)親緣關(guān)系,對(duì)上述研究進(jìn)行進(jìn)一步補(bǔ)充。基于Illumina高通量測(cè)序及生物信息學(xué)方法分析了鐵皮石斛葉綠體基因組全基因,研究結(jié)果顯示,與大多數(shù)被子植物類似,為雙鏈環(huán)狀的四分體結(jié)構(gòu),大小為153 508 bp,共編碼133個(gè)基因(93個(gè)CDS基因,32個(gè)tRNA基因以及8個(gè)rRNA基因),其結(jié)果符合被子植物葉綠體規(guī)律,編碼基因約為130個(gè)[9]。GC的含量占總堿基數(shù)量的37.51%,與劉潮等[29]研究結(jié)果一致,葉綠體基因組的GC含量區(qū)間為31.0%~38.0%,在LSC區(qū)域?qū)?yīng)的百分比為35.13%,SSC區(qū)域?qū)?yīng)的百分比為30.24%、IRa區(qū)域?qū)?yīng)的百分比為43.35%和IRb區(qū)域?qū)?yīng)的百分比為43.35%,其中IRs區(qū)GC含量最高,具體表現(xiàn)為:IRs區(qū)>LSC區(qū)>SSC區(qū),源于該區(qū)域rRNA基因所含的GC含量高,可能與其區(qū)域含有NADH基因有關(guān)[30]。
葉綠體遺傳多樣性分析對(duì)種質(zhì)資源的收集具有一定的意義。葉綠體基因組中存在的長(zhǎng)重復(fù)序列及簡(jiǎn)單重復(fù)序列在序列變異中發(fā)揮著重要的作用[31],且因其SSR含量極其豐富、分布隨機(jī)、多態(tài)性高,為母系遺傳等優(yōu)點(diǎn),被廣泛用于分子標(biāo)記[32],被用于物種遺傳多樣性,基因組圖譜等的研究[33]。本研究利用在線軟件分析,獲得長(zhǎng)重復(fù)序列47個(gè)(正向重復(fù)序列為19個(gè),反向重復(fù)序列為20個(gè),互補(bǔ)重復(fù)序列為8個(gè)),其結(jié)果與細(xì)莖石斛[34]相一致,與石豆蘭屬結(jié)果[35]不一致,說明植株的親緣性與重復(fù)序列的數(shù)量和類型存在一定的關(guān)聯(lián)性。簡(jiǎn)單重復(fù)序列(SSR)63個(gè)(單核重復(fù)序列36個(gè),二核苷酸重復(fù)序列15個(gè),三核苷酸重復(fù)序列5個(gè),四核苷酸重復(fù)序列5個(gè),五核苷酸重復(fù)序列1個(gè)、六核苷酸重復(fù)序1個(gè)),葉綠體基因組中SSR以單核重復(fù)序列和二核重復(fù)序列較多,且A/T堿基含量較高,其中單核重復(fù)序列以多聚A和多聚T重復(fù)類型較多,多聚G和多聚C重復(fù)類型較少,其符合植物葉綠體基因組SSR序列組成的規(guī)律,該研究結(jié)果與其他物種相一致[36]。所獲得的重復(fù)序列為鐵皮石斛遺傳多樣性研究提供了可選用的分子標(biāo)記。
近年來,對(duì)石斛屬植物利用了多種技術(shù),包括EST-SSR[25]、ISSR[26]、SRAP[27]、TRAP[28]等,做了多項(xiàng)物種多樣性和種間多樣性的研究,但種間關(guān)系仍存在一定疑慮,基于葉綠體基因組的遺傳多樣性分析以及系統(tǒng)進(jìn)化分析能夠在此基礎(chǔ)上提供更有利的證據(jù)。本研究NCBI數(shù)據(jù)庫中下載了13個(gè)已發(fā)表的蘭科葉綠體基因組,2個(gè)百合科植物(外類群),通過MAFF軟件進(jìn)行序列的比對(duì),利用MEGA 7.0軟件構(gòu)建系統(tǒng)進(jìn)化樹,確定鐵皮石斛與其他蘭科植物之間的親緣關(guān)系。結(jié)果顯示,鐵皮石斛與霍山石斛、細(xì)莖石斛、石斛成一簇,其中與石斛親緣性最近。本研究結(jié)果為我國(guó)鐵皮石斛植物資源的保護(hù)和遺傳育種提供了一定的理論依據(jù)。