趙鵬宇,趙 威,侯智揚(yáng),李 瀟,劉博寬,杜 瑤,謝睿琪,曹澤林,王開(kāi)開(kāi)
? 藥材與資源 ?
黃背草與2種菅屬植物葉綠體基因組特征比較及系統(tǒng)發(fā)育分析
趙鵬宇1, 2,趙 威1*,侯智揚(yáng)1,李 瀟1,劉博寬1,杜 瑤1,謝睿琪3,曹澤林1,王開(kāi)開(kāi)1
1. 河南科技大學(xué)農(nóng)學(xué)院,河南 洛陽(yáng) 471000 2. 中國(guó)科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心 植物分子遺傳國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200032 3. 河南科技大學(xué)基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院,河南 洛陽(yáng) 471000
以黃背草為試驗(yàn)材料,比較分析其與阿拉伯黃背草、中華菅2種同屬植物的葉綠體基因組特征及其與近緣物種的系統(tǒng)發(fā)育關(guān)系。采用Illumina HiSeq高通量測(cè)序平臺(tái)首次對(duì)黃背草葉綠體基因組進(jìn)行測(cè)序,使用SPAdes和CpGAVAS2分別對(duì)其進(jìn)行組裝和注釋?zhuān)⒂肅odonW、DnaSP和MISA等對(duì)其與2種同屬植物進(jìn)行一系列比較基因組分析,利用最大似然法(maximum likelihood,ML)構(gòu)建系統(tǒng)進(jìn)化樹(shù)。3個(gè)葉綠體基因組全長(zhǎng)為138 735~138 961 bp,具有典型的四分體結(jié)構(gòu),共注釋出129個(gè)基因;黃背草與其同屬的2個(gè)物種相比,反向重復(fù)區(qū)(inverted repeats,IR)收縮了2132 bp,大單拷貝區(qū)(large single copy region,LSC)擴(kuò)張了約4000 bp,而小單拷貝區(qū)(small single copy region,SSC)變化不大。密碼子偏好性分析顯示,3個(gè)葉綠體基因組相對(duì)豐度最大和最小的密碼子都相同,同義密碼子相對(duì)使用豐度略有不同,但差異不大。核酸多態(tài)性分析顯示,3個(gè)葉綠體基因組間區(qū)序列的核酸多態(tài)性值(Pi)普遍高于共有基因序列,且IR區(qū)域相比于LSC、SSC區(qū)域更為保守。3個(gè)葉綠體基因組中分別檢測(cè)到38、36、37個(gè)簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR)和2種長(zhǎng)重復(fù)序列(long sequence repeat)。系統(tǒng)發(fā)育分析表明,黃背草與阿拉伯黃背草親緣關(guān)系最近。對(duì)黃背草與2種菅屬植物葉綠體基因組特征及其系統(tǒng)發(fā)育進(jìn)行了比較分析,為上述3種植物的物種鑒定及菅屬遺傳多樣性和系統(tǒng)進(jìn)化研究奠定了基礎(chǔ)。
黃背草;菅屬;葉綠體基因組;系統(tǒng)發(fā)育分析;高通量測(cè)序;密碼子偏好性
菅屬Forssk.為禾本科(Gramineae)多年生或一年生草本植物,有30余種[1],其中我國(guó)有13種,主要分布于西南和華南地區(qū)[2]。黃背草(Willd.) Tanaka是最常見(jiàn)的菅屬植物,又被稱(chēng)為進(jìn)肌草、黃背茅、草糖等,是一種進(jìn)行C4光合作用的地面芽叢生草[3]。黃背草是非洲、亞洲、澳大利亞熱帶和亞熱帶地區(qū)生態(tài)及經(jīng)濟(jì)上最重要和最廣泛的多年生草叢之一[4],在全球超過(guò)四分之一的草原上占據(jù)主導(dǎo)地位[5],其分布幾遍中國(guó),多生長(zhǎng)于干燥山坡、路邊、林緣等處[1]。黃背草在《中華本草》和《全國(guó)中草藥匯編》中均有記載,其全草均可入藥[6],味甘性溫,具有活血調(diào)經(jīng)、驅(qū)風(fēng)除濕的功效,主要用于治療閉經(jīng)、風(fēng)濕疼痛[7],具有一定的藥用價(jià)值。黃背草還具有耐旱耐寒、生長(zhǎng)力強(qiáng)、根須繁多等特點(diǎn)[8],其群落通常分布均勻,蓋度較大,在一定的范圍內(nèi)可以調(diào)節(jié)氣候、涵養(yǎng)水源[9],具有良好的生態(tài)價(jià)值。但在藥用方面,同為菅屬的阿拉伯黃背草Forsk.和中華菅(Linnaeus) Kuntze與黃背草相比不具備相應(yīng)的價(jià)值,且上述3種植物形態(tài)學(xué)特征極為相似,利用已有的物種鑒定方法難將三者區(qū)分開(kāi),存在基源植物使用混亂的現(xiàn)象,因此尋找新的方法對(duì)其鑒定手段進(jìn)行補(bǔ)充至為關(guān)鍵。
葉綠體是高等植物和一些藻類(lèi)所特有的一種半自主性細(xì)胞器,也存在于少數(shù)原生生物中,具有獨(dú)立的遺傳物質(zhì)[10]。葉綠體基因組是獨(dú)立于核基因組的一套完整的DNA序列,結(jié)構(gòu)高度保守且易于測(cè)序,其大小介于120~180 kb,共編碼120~130個(gè)基因[11];葉綠體基因組一般為雙鏈環(huán)狀分子,大多是以多拷貝的形式存在于細(xì)胞中,主要參與光合作用的光反應(yīng),在基因表達(dá)過(guò)程中參與轉(zhuǎn)錄和翻譯[12]。由于葉綠體基因組編碼基因種類(lèi)和排列順序穩(wěn)定,相對(duì)分子質(zhì)量較小,通??捎糜谥仓晡锓N鑒定和分類(lèi)、系統(tǒng)發(fā)育研究及遺傳多樣性分析等[13]。近年來(lái),隨著高通量測(cè)序技術(shù)的逐漸成熟,越來(lái)越多的植物的葉綠體基因組被陸續(xù)發(fā)布,可見(jiàn)基于葉綠體基因組的研究成為新趨勢(shì)。在菅屬植物中,除黃背草以外的阿拉伯黃背草、中華菅、瘤菅(Nees ex Steud.) Hack.等13種植物的葉綠體基因組也已完成測(cè)序[14-16],隨著菅屬葉綠體基因組數(shù)量的增加,同屬其他物種的葉綠體基因組也越來(lái)越容易組裝,這也為黃背草葉綠體基因組的組裝提供了條件。目前,國(guó)內(nèi)外大量學(xué)者對(duì)黃背草的研究多集中在生物學(xué)特性[17]、種子萌發(fā)[18]和繁殖[19]、生理生態(tài)和生產(chǎn)[20]、種群空間分布[21]、對(duì)環(huán)境因素的生態(tài)響應(yīng)[22]、性狀與環(huán)境的關(guān)系[23]及其作為牧草的適口性和可接受性[24]等方面,然而關(guān)于黃背草葉綠體基因組的系統(tǒng)研究尚未見(jiàn)報(bào)道,因此,完成黃背草葉綠體基因組圖譜的構(gòu)建和分析,對(duì)于后續(xù)的物種鑒定以及生物的遺傳和進(jìn)化等一系列研究具有重要意義。
本研究基于Illumina HiSeq高通量測(cè)序技術(shù),以黃背草葉片為試驗(yàn)材料,首次對(duì)黃背草葉綠體基因組進(jìn)行測(cè)序、組裝和注釋。同時(shí),將黃背草與其他2種菅屬植物葉綠體基因組進(jìn)行比較,分析了這3種菅屬植物的葉綠體基因組特征結(jié)構(gòu)、密碼子偏好性、核酸多態(tài)性、簡(jiǎn)單重復(fù)序列及其系統(tǒng)發(fā)育等信息,進(jìn)一步促進(jìn)了黃背草與其他2種菅屬植物之間的遺傳學(xué)和分子鑒定研究,明確了黃背草葉綠體基因組的序列特征、基因組成及系統(tǒng)發(fā)育關(guān)系,為菅屬植物遺傳多樣性與系統(tǒng)進(jìn)化研究提供理論依據(jù)。
黃背草植物樣本采集于河南省沁陽(yáng)市紫陵鎮(zhèn)宋寨村附近太行山系(35°11′33″N,112°45′56″E),由河南科技大學(xué)農(nóng)學(xué)院生物科學(xué)系洪亞平副教授和戴攀峰博士鑒定為禾本科菅屬植物黃背草(Willd.) Tanak,樣本保存于河南科技大學(xué)標(biāo)本館,憑證標(biāo)本號(hào)為T(mén)J-2022101206。部分葉片樣本經(jīng)硅膠干燥后,裝入自封袋帶回實(shí)驗(yàn)室,用無(wú)菌水沖洗至表面潔凈后置于?80 ℃冰箱保存?zhèn)溆?。在NCBI數(shù)據(jù)庫(kù)中下載黃背草近緣物種葉綠體基因組序列,試驗(yàn)材料詳細(xì)信息見(jiàn)表1。
表1 植物樣本來(lái)源
取100 mg樣本新鮮葉片,液氮研磨后使用植物DNA提取試劑盒(上海聯(lián)邁生物工程有限公司)進(jìn)行全基因組DNA提取。將質(zhì)量濃度大于200 ng/μL且260/280值在1.8~2.0的DNA送至武漢菲沙基因信息有限公司質(zhì)檢,合格的DNA用于文庫(kù)構(gòu)建和Illumina HiSeq雙端測(cè)序,其測(cè)序長(zhǎng)度為150 bp,去除低質(zhì)量reads后得到clean reads。
使用SPAdes(v 3.11)軟件對(duì)上一步得到的clean reads進(jìn)行基因組組裝[25],使用Bandage(v 0.8.1)軟件解環(huán)并輸出完整的葉綠體基因組序列文件[26]。以阿拉伯黃背草葉綠體基因組(GenBank登錄號(hào):MT505020)為參考序列,使用在線工具CpGAVAS2(http://47.96.249.172:16019/analyzer/home)對(duì)黃背草葉綠體基因組進(jìn)行注釋[27]。注釋結(jié)果經(jīng)手動(dòng)校正后,上傳至NCBI數(shù)據(jù)庫(kù),其登錄號(hào)為OP897809。最后使用在線工具Chloroplot(https://irscope.shinyapps. io/Chloroplot/)繪制其葉綠體基因組圈圖[28]。
使用IRscope軟件對(duì)黃背草、阿拉伯黃背草和中華菅(GenBank登錄號(hào):NC_035492)葉綠體基因組4個(gè)邊界的收縮與擴(kuò)張進(jìn)行可視化分析[29],并使用在線工具CPJSdraw繪制這3個(gè)葉綠體基因組的邊界圖。使用CodonW(v 1.42)軟件對(duì)上述3種植物的葉綠體基因組序列進(jìn)行同義密碼子相對(duì)使用豐度比較[30],其編碼基因按照以下校準(zhǔn)進(jìn)行過(guò)濾:(1)基因的起始密碼子為ATG;(2)基因長(zhǎng)度須大于等于300 bp;(3)處于重復(fù)區(qū)域的基因只選取1個(gè)且去除假基因。使用在線工具mVISTA(https://genome.lbl.gov/vista/mvista/submit.shtml)的Shuffle-LAGAN模式對(duì)上述3種植物進(jìn)行葉綠體基因組比較分析[31]。使用MISA軟件對(duì)上述3種植物的葉綠體基因組進(jìn)行簡(jiǎn)單重復(fù)序列分析[32],其參數(shù)為單核苷酸SSR:重復(fù)單元為10,二核苷酸SSR:重復(fù)單元為6,三核苷酸SSR:重復(fù)單元為5,四核苷酸、五核苷酸和六核苷酸SSRs:重復(fù)單元為4。使用在線軟件REPuter(https:// bibiserv.cebitec.uni-bielefeld.de/session Timeout.jsf)對(duì)上述3種植物的葉綠體基因組進(jìn)行長(zhǎng)重復(fù)序列分析[33],其參數(shù):Hamming Distance為3,最小重復(fù)單元為30個(gè)堿基。
使用上述已從NCBI數(shù)據(jù)庫(kù)中下載的15條黃背草近緣植物葉綠體基因組序列,以Hook. f.和Stapf作為外群進(jìn)行全葉綠體基因組系統(tǒng)發(fā)育分析。調(diào)整序列LSC第一個(gè)堿基作為序列起始后,使用MAFFT進(jìn)行全葉綠體基因組多序列比對(duì),對(duì)齊好的文件使用Modeltest軟件進(jìn)行模型檢測(cè)后,使用RaxML(v 8.2.12)軟件在GTR+GAMMA模型下[34],以最大似然法(maximum likelihood,ML)進(jìn)行系統(tǒng)發(fā)育分析,自展值為1000。
原始數(shù)據(jù)經(jīng)過(guò)過(guò)濾后,共得到251 兆條clean reads,且clean reads質(zhì)量值大于30的堿基占比為88.7%,代表測(cè)序質(zhì)量較好,可用于黃背草的組裝。如圖1和表2所示,黃背草葉綠體基因組全長(zhǎng)為138 736 bp,具有典型的四分體結(jié)構(gòu),由2個(gè)單拷貝區(qū)(LSC:84 883 bp,SSC:12 549 bp)和一對(duì)重復(fù)區(qū)(IR:20 652 bp)組成。
在黃背草、阿拉伯黃背草和中華菅序列中,葉綠體基因組長(zhǎng)度在138 735~138 961 bp內(nèi),阿拉伯黃背草的葉綠體基因組最短。這3種植物葉綠體基因組全長(zhǎng)僅相差226 bp,黃背草與其他2種植物IR區(qū)域相比收縮了2132 bp,LSC區(qū)域擴(kuò)張了約4000 bp,而SSC區(qū)域變化不大。3種植物葉綠體IR區(qū)域的GC在43.94%~44.18%,高于LSC區(qū)域(36.43%~36.69%)和SSC區(qū)域(32.76%~32.78%),這可能是由于IR中含有4個(gè)GC含量較高的核糖體RNA(rRNA)基因。
如表3和表4所示,黃背草葉綠體基因組共注釋出129個(gè)基因,含有82個(gè)編碼蛋白基因,8個(gè)rRNA基因和39個(gè)tRNA基因,且IR區(qū)域中含有16個(gè)重復(fù)基因。其中82個(gè)編碼蛋白基因可以根據(jù)不同的功能分為4類(lèi):46個(gè)光合作用相關(guān)基因(photosynthesis related genes),30個(gè)自我復(fù)制相關(guān)基因(self-replication related genes),1個(gè)未知功能基因(unknown function genes)和5個(gè)其他基因(other genes)。在tRNA基因中,、、、、、、、存在雙拷貝,rRNA的4種基因(、、、)存在雙拷貝。黃背草IR區(qū)注釋出16個(gè)基因,和阿拉伯黃背草及中華菅相比少了3個(gè)基因,分別為、和基因。基因的缺失主要是由于重復(fù)區(qū)域的收縮引起的,因此本課題組對(duì)這3個(gè)物種進(jìn)行了邊界分析。由圖2可知,黃背草IR區(qū)域出現(xiàn)了明顯的收縮現(xiàn)象,這導(dǎo)致LSC與IRb及LSC與IRa的邊界基因與其他2個(gè)物種不同。
外環(huán)基因?yàn)槟鏁r(shí)針轉(zhuǎn)錄,內(nèi)環(huán)基因?yàn)轫槙r(shí)針轉(zhuǎn)錄,相同功能的基因以相同的顏色表示
表2 黃背草、阿拉伯黃背草和中華菅葉綠體基因組堿基組成
表3 黃背草葉綠體基因組注釋基因信息
表4 黃背草、阿拉伯黃背草和中華菅葉綠體基因組的基因數(shù)及重復(fù)基因數(shù)目
JLB、JSB、JSA、JLA分別代表葉綠體基因組4個(gè)邊界的連接位點(diǎn)
按照方法中的3個(gè)條件,3種葉綠體基因組經(jīng)過(guò)過(guò)濾都只保留了50條蛋白編碼序列。其同義密碼子相對(duì)使用豐度結(jié)果見(jiàn)圖3,在3種葉綠體基因組中,在三者中相對(duì)豐度最大的密碼子都為編碼亮氨酸(Leu)的UUA;相對(duì)豐度最小的密碼子在三者中也相同,都為編碼亮氨酸Leu的CUG。3種葉綠體基因組的同義密碼子相對(duì)使用豐度略有不同,但差異不大。由圖3可以看出,除了編碼色氨酸的(UGG)和甲硫氨酸的(AUG)外,其他氨基酸都有多個(gè)密碼子。Leu、精氨酸(Arg)和絲氨酸(Ser)有6個(gè)同義密碼子;甘氨酸(Gly)、纈氨酸(Val)、蘇氨酸(Thr)、脯氨酸(Pro)和丙氨酸(Ala)有4個(gè)同義密碼子;異亮氨酸(Ile)和終止密碼子都有3個(gè)同義密碼子;而其余的氨基酸都有2個(gè)同義密碼子且同義密碼子通常只在密碼子第3位不同。
每個(gè)氨基酸柱狀圖從左到右分別為黃背草、阿拉伯黃背草、中華菅
從3種葉綠體基因組中分別提取到105個(gè)共有基因和110個(gè)共有間區(qū),經(jīng)MAFFT對(duì)齊后,使用DnaSP 6.0軟件計(jì)算核酸多態(tài)性值(Pi)[35],最后按照基因和基因間區(qū)在葉綠體基因組中的位置繪制圖譜。由圖4可以看出,間區(qū)序列的Pi值普遍高于共有基因序列,且IR區(qū)域相比于LSC、SSC區(qū)域更為保守,這與圖5結(jié)果相同。在基因序列中,篩選出10個(gè)Pi值大于0.001的高突變區(qū)域(、、、、、、、、、);在間區(qū)序列中,篩選出9個(gè)Pi值大于0.003的高突變區(qū)域(、、、、、、、、)。突變?yōu)檫M(jìn)化提供了基礎(chǔ),因此這些高突變區(qū)域可用于研究物種進(jìn)化和物種鑒定。
如圖6所示,從3個(gè)葉綠體基因組中分別檢測(cè)到38、36、37個(gè)SSR。3個(gè)葉綠體基因組中都只檢測(cè)到2種微衛(wèi)星序列(單核苷酸重復(fù)和四核苷酸重復(fù)),且大多為單堿基重復(fù)型微衛(wèi)星序列。單核苷酸重復(fù)多為A/T重復(fù),其重復(fù)單元數(shù)目的范圍為10~17,四核苷酸重復(fù)在三者中都為GTAG重復(fù),中華菅中其重復(fù)單元數(shù)目為6,而黃背草和阿拉伯黃背草中其重復(fù)單元數(shù)目為5。SSR廣泛分布于葉綠體基因組不同的位置,這些SSR區(qū)域可用于物種的分子標(biāo)記,為遺傳圖譜構(gòu)建和目的基因定位提供參考依據(jù)。如圖7所示,3個(gè)葉綠體基因組中都只檢測(cè)到2種長(zhǎng)重復(fù)序列(long sequence repeat),包括正向重復(fù)序列(forward repeat sequence)和回文重復(fù)序列(palindromic repeat sequence),且重復(fù)序列長(zhǎng)度多為40 bp以下,這些長(zhǎng)重復(fù)序列可用于研究葉綠體基因組的結(jié)構(gòu)變異。
A-共有基因的核酸多態(tài)性分析 B-共有間區(qū)基因的核酸多態(tài)性分析
橫軸代表葉綠體基因組序列長(zhǎng)度,縱軸表示序列相似度
圖6 黃背草、阿拉伯黃背草和中華菅葉綠體基因組SSR分析
以和作為外群,經(jīng)Modeltest軟件進(jìn)行模型檢測(cè)后,使用RaxML(v 8.2.12)軟件在GTR+GAMMA模型下[34],以最大似然法(ML)構(gòu)建黃背草及13種菅屬植物葉綠體全基因組的系統(tǒng)發(fā)育樹(shù)(圖8)。系統(tǒng)發(fā)育分析結(jié)果顯示,鄰接樹(shù)分支上支持值均大于80%,并具有很好的聚類(lèi)效果,說(shuō)明結(jié)果的可靠性。所有物種共聚為3大類(lèi),分別是外類(lèi)的和以及菅屬,菅屬又分為2支。根據(jù)進(jìn)化距離可以看出,相比與禾本科假鐵稈草屬與苞茅屬植物,菅屬植物是最后分化出來(lái)的一個(gè)支系,且黃背草、阿拉伯黃背草和中華菅在菅屬植物形成穩(wěn)定的單系分支,三者中,黃背草與阿拉伯黃背草互為姐妹支,親緣關(guān)系最近。上述結(jié)果與《中國(guó)植物志》[1]中所記載的分類(lèi)結(jié)果相同。
F-正向重復(fù) P-回文重復(fù) R-反向重復(fù) C-互補(bǔ)重復(fù)
葉綠體基因組作為獨(dú)立于核基因組的完整DNA序列,在進(jìn)化過(guò)程中具有高度的保守性和穩(wěn)定性,近年來(lái)廣泛應(yīng)用于植物種類(lèi)鑒定和系統(tǒng)進(jìn)化研究[36]。目前已有關(guān)于姜屬、藜蘆屬、扁果草屬植物中近緣物種葉綠體基因組差異分析及系統(tǒng)發(fā)育關(guān)系的相關(guān)報(bào)道[37-38],同時(shí),黃背草與其同屬的阿拉伯黃背草、中華菅形態(tài)學(xué)特征極為相近,以現(xiàn)有的鑒定方法很難區(qū)分,這為補(bǔ)充其鑒定方法提供了新思路。
本研究首次完成了黃背草葉綠體基因組的測(cè)序、組裝和注釋工作,將黃背草和已報(bào)道的菅屬植物阿拉伯黃背草、中華菅的葉綠體基因組進(jìn)行比較,結(jié)果顯示其具有典型的四分體結(jié)構(gòu),3個(gè)葉綠體基因組序列全長(zhǎng)在138 735~138 961 bp,基因組大小相似度較高,最大僅相差226 bp。同時(shí)發(fā)現(xiàn)3種菅屬植物葉綠體基因組總GC含量(38.53%~38.57%)及LSC區(qū)(36.43%~36.69%)、SSC區(qū)(32.76%~32.78%)、IR區(qū)(43.94%~44.18%)的GC含量也高度相似。對(duì)黃背草葉綠體基因組進(jìn)行注釋后得到129個(gè)功能基因,其中包括82個(gè)蛋白編碼基因、39個(gè)tRNA基因和8個(gè)rRNA基因,與已報(bào)道的阿拉伯黃背草、中華菅的葉綠體基因數(shù)目一致。黃背草、阿拉伯黃背草和中華菅葉綠體基因組序列的高度相似性在一定程度上解釋了三者形態(tài)學(xué)特征的近似性。IR區(qū)被認(rèn)為是葉綠體基因組中最保守的區(qū)域,但生物進(jìn)化過(guò)程中仍經(jīng)常伴隨著IR區(qū)的擴(kuò)張和收縮,這往往會(huì)造就葉綠體基因組的差異性[39]。本研究通過(guò)邊界分析發(fā)現(xiàn),黃背草葉綠體基因組IR區(qū)出現(xiàn)了明顯的收縮現(xiàn)象,其IR區(qū)收縮了2132 bp,LSC區(qū)域擴(kuò)張了約4000 bp,與阿拉伯黃背草及中華菅相比在IR區(qū)少了3個(gè)基因(、和)。這導(dǎo)致了黃背草LSC/IRb及LSC/IRa的邊界基因與其他兩個(gè)物種的較大差異,而其余2個(gè)邊界兩側(cè)基因完全相同。該差異性可為黃背草物種鑒定及系統(tǒng)發(fā)育關(guān)系的深入研究提供思路。
密碼子使用偏性在解釋生物基因組進(jìn)化規(guī)律方面具有重要意義[40]。本研究發(fā)現(xiàn)黃背草葉綠體密碼子偏好性較低,除了編碼色氨酸的和甲硫氨酸外,其他氨基酸都有多個(gè)同義密碼子,同義密碼子之間通常只在第3位存在差異且更傾向于以A/T堿基結(jié)尾。同時(shí),黃背草與阿拉伯黃背草、中華菅的葉綠體基因組的同義密碼子相對(duì)使用豐度具有較高一致性。有研究認(rèn)為密碼子偏性與基因長(zhǎng)度、氨基酸組分、GC含量、tRNA豐度等因素有關(guān)[40],本研究中3種菅屬植物葉綠體基因組的總GC含量及各拷貝區(qū)GC含量均低于50%,表明3個(gè)葉綠體基因組傾向于使用A/T堿基,這與本實(shí)驗(yàn)發(fā)現(xiàn)的黃背草密碼子更傾向于以A/T堿基結(jié)尾這一結(jié)論相吻合。本研究從3種葉綠體基因組中共提取到105個(gè)共有基因和110個(gè)共有間區(qū)。經(jīng)mVISTA工具和DnaSP 6.0軟件分析發(fā)現(xiàn),共有間區(qū)序列的Pi值普遍高于共有基因序列,且IR區(qū)較LSC、SSC區(qū)更為保守,這可能是由于IR區(qū)的重復(fù)基因能夠通過(guò)基因轉(zhuǎn)換對(duì)此區(qū)發(fā)生的變異進(jìn)行修正[41]。在基因序列中篩選出10個(gè)高突變區(qū)域(Pi>0.001),在間區(qū)序列中篩選出9個(gè)高突變區(qū)域(Pi>0.003),這些核酸多態(tài)性值較高的變異位點(diǎn),能夠?yàn)辄S背草物種鑒定的DNA條形碼篩選提供參考依據(jù),并且在黃背草及其近緣物種的系統(tǒng)進(jìn)化研究方面發(fā)揮重要作用。
植物葉綠體基因SSR具有數(shù)量大、保守性高、遺傳信息豐富等特點(diǎn),其拷貝數(shù)的變異是一種重要的分子標(biāo)記,在植物多態(tài)性研究、群體結(jié)構(gòu)分析、種群遺傳進(jìn)化等方面的研究具有重要意義[42]。黃背草、阿拉伯黃背草和中華菅葉綠體基因組中分別檢出38、36、37個(gè)SSR位點(diǎn),包括單核苷酸SSR和四核苷酸SRR 2種類(lèi)型。單核苷酸SSR多為A/T重復(fù),重復(fù)單元范圍10~17。四核苷酸SSR在三者中均為GTAG重復(fù),其中中華菅重復(fù)單元數(shù)目為6,其余兩者均為5。目前已報(bào)道了多種植物葉綠體基因組SSR主要由A/T堿基構(gòu)成[37-38],這與本實(shí)驗(yàn)的研究結(jié)果相一致。此外,黃背草、阿拉伯黃背草和中華菅葉綠體基因組中分別檢測(cè)到51、45、46個(gè)長(zhǎng)重復(fù)序列,且都只檢測(cè)到正向重復(fù)型和回文重復(fù)型兩種長(zhǎng)重復(fù)序列,長(zhǎng)重復(fù)序列是導(dǎo)致葉綠體基因組結(jié)構(gòu)變異的重要因素[43]。這些SSR位點(diǎn)以及長(zhǎng)重復(fù)序列為黃背草的分子鑒定、物種演化、群體遺傳學(xué)研究等方面提供了候選分子標(biāo)記。為進(jìn)一步確定黃背草在菅屬植物中的系統(tǒng)位置,基于黃背草及其15種近緣植物葉綠體全基因組構(gòu)建ML系統(tǒng)發(fā)育樹(shù)。結(jié)果表明,14種菅屬植物聚為一類(lèi),菅屬又分為2支,且黃背草、阿拉伯黃背草和中華菅在菅屬植物中形成穩(wěn)定的單系分支,支持值為100%。其中,黃背草與阿拉伯黃背草互為姐妹支,親緣關(guān)系最為密切。同時(shí),黃背草與阿拉伯黃背草在形態(tài)上也較中華菅更為相似,且黃背草與除上述2種植物外的菅屬物種相比,形態(tài)差異更大,對(duì)系統(tǒng)發(fā)育分析的結(jié)果也起到一定的支撐作用。該研究也表明葉綠體基因組可有效區(qū)分菅屬植物的系統(tǒng)發(fā)育關(guān)系,為后續(xù)菅屬植物的種群分類(lèi)、系統(tǒng)進(jìn)化和遺傳多樣性研究提供材料。
隨著高通量DNA測(cè)序技術(shù)和生物信息學(xué)的快速發(fā)展,葉綠體基因組因其豐富的遺傳信息和高度的保守性,在藥用植物的近緣物種鑒定及系統(tǒng)進(jìn)化研究領(lǐng)域廣受關(guān)注[36]。本研究首次完成了黃背草葉綠體基因組的序列測(cè)序、組裝和注釋工作,詳細(xì)介紹了黃背草葉綠體基因組基本特征,闡明了黃背草在菅屬植物中的系統(tǒng)位置。同時(shí)將黃背草、阿拉伯黃背草和中華菅3種在形態(tài)學(xué)特征上難以區(qū)分的菅屬植物的葉綠體基因組進(jìn)行比較分析,為黃背草的物種鑒定、群體遺傳學(xué)研究等方面所需的DNA條形碼和分子標(biāo)記篩選提供了參考方向。完成了對(duì)菅屬植物的遺傳多樣性與功能基因組學(xué)研究的關(guān)鍵補(bǔ)充,為后續(xù)開(kāi)展菅屬植物的分子鑒定、系統(tǒng)進(jìn)化研究以及綜合開(kāi)發(fā)利用奠定了理論基礎(chǔ)。
利益沖突 所有作者均聲明不存在利益沖突
[1] 中國(guó)科學(xué)院中國(guó)植物志編輯委員會(huì). 中國(guó)植物志(第九卷. 第二分冊(cè))[M]. 北京: 科學(xué)出版社, 2002: 23.
[2] 張煜, 劉青. 菅屬植物的地理分布 [J]. 熱帶亞熱帶植物學(xué)報(bào), 2012, 20(3): 221-228.
[3] Christenhusz M J M. The Kew Plant Glossary, an illustrated dictionary of plant terms [J]., 2010, 164(4): 440-441.
[4] Snyman H A, Ingram L J, Kirkman K P.: A keystone grass species [J]., 2013, 30(3): 99-125.
[5] B H, Downing,. Growth and development of fourpopulations from southern Africa in response to temperature [J]., 1985, 51(5): 350-354.
[6] 國(guó)家中醫(yī)藥管理局《中華本草》編委會(huì). 中華本草-9 [M]. 上海: 上海科學(xué)技術(shù)出版社, 1999: 8-429.
[7] 《全國(guó)中草藥匯編》編寫(xiě)組. 全國(guó)中草藥匯編(上)[M]. 第2版. 北京: 人民衛(wèi)生出版社, 1996: 873.
[8] Evans L T, Knox R B. Environmental control of reproduction in[J]., 1969, 17(3): 375.
[9] 趙威, 王馨, 王艷杰, 等. 河南黃背草群落碳、氮密度空間變化及其驅(qū)動(dòng)因素分析 [J]. 草地學(xué)報(bào), 2018, 26(4): 846-852.
[10] 熱伊漢古麗·圖爾迪, 慕麗紅, 田新民. 扁果草葉綠體基因組特征分析 [J]. 生物工程學(xué)報(bào), 2022, 38(8): 2999-3013.
[11] Tonti-Filippini J, Nevill P G, Dixon K,. What can we do with 1000 plastid genomes? [J]., 2017, 90(4): 808-818.
[12] Khan I A, Zhang Y. Characterization of mango (L.) transcriptome and chloroplast genome [J]., 2014, 85(1): 193-208.
[13] Suparman S, Pancoro A, Hidayat T. Phylogenetic analysis ofbased on rbcL sequences, chloroplast DNA [J]., 2013, 57: 235-240.
[14] Arthan W, Dunning L T, Besnard G,. Complex evolutionary history of two ecologically significant grass Genera,and(Poaceae: Panicoideae: Andropogoneae) [J]., 2021, 196(4): 437-455.
[15] Dunning L T, Liabot A L, Olofsson J K,. The recent and rapid spread of[J]., 2017, 164(4): 327-337.
[16] Dunning L T, Olofsson J K, Papadopulos A S T,. Hybridisation and chloroplast capture between distinctlineages in Australia [J]., 2022, 31(22): 5846-5860.
[17] Tomlinson K, O'Connor T. The effect of defoliation environment on primary growth allocation and secondary tiller recruitment of two bunchgrasses [J]., 2005, 22(1): 29-36.
[18] 趙金輝, 王奎玲, 劉慶華, 等. 黃背草種子萌發(fā)特性研究 [J]. 西北農(nóng)業(yè)學(xué)報(bào), 2009, 18(3): 245-248.
[19] 岳喜成, 鄭觀玉, 劉耀曾, 等. 野生黃背草人工繁殖及開(kāi)發(fā)利用試驗(yàn)研究 [J]. 中國(guó)水土保持, 1994(12): 29-30.
[20] Ruppert J C, Holm A, Miehe S,. Meta-analysis of ANPP and rain-use efficiency confirms indicative value for degradation and supports non-linear response along precipitation gradients in drylands [J]., 2012, 23(6): 1035-1050.
[21] 王馨, 趙威. 區(qū)域尺度下黃背草種群空間分布格局及其與土壤因子的關(guān)系 [J]. 草業(yè)科學(xué), 2019, 36(2): 335-345.
[22] H A, Snyman,. Transpiration and water-use efficiency in response to water stress inand[J]., 1997, 63(1): 55-59.
[23] Fynn R, Morris C, Ward D,. Trait-environment relations for dominant grasses in South African mesic grassland support a general leaf economic model [J]., 2011, 22(3): 528-540.
[24] van der Westhuizen H, Snyman H, van Rensburg W,. The quantification of grazing capacity from grazing—and production values for forage species in semi-arid grasslands of southern Africa [J]., 2001, 18(1): 43-52.
[25] Prjibelski A, Antipov D, Meleshko D,. Using SPAdes de novo assembler [J]., 2020, 70(1): e102.
[26] Wick R R, Schultz M B, Zobel J,. Bandage: Interactive visualization of de novo genome assemblies [J]., 2015, 31(20): 3350-3352.
[27] Liu C, Shi L C, Zhu Y J,. CpGAVAS, an integrated web server for the annotation, visualization, analysis, and GenBank submission of completely sequenced chloroplast genome sequences [J]., 2012, 13: 715.
[28] Zheng S Y, Poczai P, Hyv?nen J,. Chloroplot: An online program for the versatile plotting of organelle genomes [J]., 2020, 11: 576124.
[29] Amiryousefi A, Hyv?nen J, Poczai P. IRscope: An online program to visualize the junction sites of chloroplast genomes [J]., 2018, 34(17): 3030-3031.
[30] Sharp P M, Li W H.usage in regulatory genes indoes not reflect selection for ‘rare’ codons [J]., 1986, 14(19): 7737-7749.
[31] Frazer K A, Pachter L, Poliakov A,. VISTA: Computational tools for comparative genomics [J]., 2004, 32: W273-W279.
[32] Beier S, Thiel T, Münch T,. MISA-web: A web server for microsatellite prediction [J]., 2017, 33(16): 2583-2585.
[33] Kurtz S, Choudhuri J V, Ohlebusch E,. REPuter: The manifold applications of repeat analysis on a genomic scale [J]., 2001, 29(22): 4633-4642.
[34] Stamatakis A. RAxML version 8: A tool for phylogenetic analysis and post-analysis of large phylogenies [J]., 2014, 30(9): 1312-1313.
[35] Rozas J, Ferrer-Mata A, Sánchez-DelBarrio J C,. DnaSP 6: DNA sequence polymorphism analysis of large data sets [J]., 2017, 34(12): 3299-3302.
[36] 姜汶君, 郭夢(mèng)月, 龐曉慧. 葉綠體基因組在藥用植物鑒定及系統(tǒng)進(jìn)化研究中的應(yīng)用 [J]. 世界中醫(yī)藥, 2020, 15(5): 702-708.
[37] 馬孟莉, 張薇, 孟衡玲, 等. 草果葉綠體基因組特征及系統(tǒng)發(fā)育分析 [J]. 中草藥, 2021, 52(19): 6023-6031.
[38] 田星, 劉瑩瑩, 張穎敏, 等. 藜蘆屬藥用植物的葉綠體基因組比較分析和系統(tǒng)發(fā)育研究 [J]. 中草藥, 2022, 53(4): 1127-1137.
[39] Odintsova M S, Yurina N P. Plastid genomes of higher plants and algae: Structure and functions [J]., 2003, 37(5): 649-662.
[40] 吳憲明, 吳松鋒, 任大明, 等. 密碼子偏性的分析方法及相關(guān)研究進(jìn)展 [J]. 遺傳, 2007, 29(4): 420-426.
[41] Chen J H, Hao Z D, Xu H B,. The complete chloroplast genome sequence of the relict woody plantHu et Cheng [J]., 2015, 6: 447.
[42] 王化坤, 婁曉鳴, 章鎮(zhèn). 葉綠體微衛(wèi)星在植物種質(zhì)資源研究中的應(yīng)用 [J]. 分子植物育種, 2006, 4(S1): 92-98.
[43] Asaf S, Khan A L, Khan M A,. Complete chloroplast genome sequence and comparative analysis of loblolly pine (L.) with related species [J]., 2018, 13(3): e0192966.
Comparison of chloroplast genome characteristics and phylogenetic analysis betweenand two species of
ZHAO Peng-yu1, 2, ZHAO Wei1, HOU Zhi-yang1, LI Xiao1, LIU Bo-kuan1, DU Yao1, XIE Rui-qi3, CAO Ze-lin1, WANG Kai-kai1
1. College of Agriculture, Henan University of Science and Technology, Luoyang 471000, China 2. National Key Laboratory of Plant Molecular Genetics, CAS Center for Excellence in Molecular Plant Sciences, Chinese Academy of Sciences, Shanghai 200032, China 3. College of Basic Medicine and Forensic Medicine, Henan University of Science and Technology, Luoyang 471000, China
was used as the experimental material to compare its chloroplast genome characteristics with those of two congeners,and, and their phylogenetic relationships with the closely related species.Using the Illumina HiSeq high throughput sequencing platform, the chloroplast genome ofwas sequenced for the first time. SPAdes and CpGAVAS2 were used to assemble and annotate it, respectively. CodonW, DnaSP, and MISA were used to perform a series of comparative genomic analysis with two species of plants of the same genus, and the maximum likelihood (ML) method was used to construct a phylogenetic tree.The three chloroplast genomes were 138 735—138 961 bp in length, with a typical tetrad structure, and a total of 129 genes were annotated; compared with the two species of the same genus, the inverted repeats (IR) contracted by 2 132 bp, the large single copy region (LSC) expanded by about 4 000 bp, and the small single copy region (SSC) did not change much. Codon preference analysis showed that the codons with the highest and lowest relative abundance in the three chloroplast genomes were the same, while the relative abundance of synonymous codons was slightly different, but the difference was not significant. Nucleic acid polymorphism analysis showed that the nucleic acid polymorphism values (Pi) of the sequences in the inter-region of the three chloroplast genomes were generally higher than those of the shared gene sequences, and the IR region was more conserved than the LSC and SSC regions. A total of 38, 36 and 37 simple sequence repeats (SSR) and two long sequence repeats were detected in the three chloroplast genomes, respectively. Phylogenetic analysis indicated thatwas most closely related to.The comparative analysis of chloroplast genome characteristics and phylogeny betweenand two species ofwas carried out, laying the foundation for the species identification of the three species and the study of genetic diversity and phylogeny of.
(Willd.) Tanaka;; chloroplast genome; phylogenetic analysis; high-throughput sequencing; codon preference
R286.12
A
0253 - 2670(2023)10 - 3261 - 12
10.7501/j.issn.0253-2670.2023.10.023
2023-02-26
中國(guó)科學(xué)院大學(xué)生創(chuàng)新實(shí)踐訓(xùn)練計(jì)劃項(xiàng)目(20224001686);河南省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(202210464086);河南省特色骨干學(xué)科建設(shè)——旱地綠色智慧農(nóng)業(yè)學(xué)科群(17100001);NSFC-河南人才培養(yǎng)聯(lián)合基金項(xiàng)目(U1304306)
趙鵬宇(2001—),男,在讀本科生,主持中國(guó)科學(xué)院大學(xué)生創(chuàng)新實(shí)踐訓(xùn)練計(jì)劃項(xiàng)目,研究方向?yàn)樗幱弥参锓肿由飳W(xué)。E-mail: zhaopengyu122601@163.com
趙 威(1975—),男,教授,研究方向?yàn)橹参锷鷳B(tài)學(xué)。E-mail: zhaowei1@haust.edu.cn
[責(zé)任編輯 時(shí)圣明]