劉潮 韓利紅 代小波 劉宸語(yǔ)
摘? 要:辣椒( L.)屬于重要的蔬菜和香料作物,在世界范圍廣泛栽培。種質(zhì)資源是育種和生產(chǎn)的基礎(chǔ),開(kāi)展辣椒屬葉綠體基因組特征研究對(duì)闡明辣椒種質(zhì)資源遺傳多樣性、培育和改良栽培品種具有重要的理論和實(shí)踐價(jià)值。本研究從NCBI數(shù)據(jù)庫(kù)下載13個(gè)辣椒屬物種葉綠體基因組序列,利用REPuter、MISA和mVISTA等軟件,對(duì)辣椒屬葉綠體基因組特征、序列重復(fù)、結(jié)構(gòu)變異和系統(tǒng)發(fā)育進(jìn)行分析。結(jié)果顯示:辣椒屬葉綠體基因組均具有保守的四分體結(jié)構(gòu),一對(duì)反向重復(fù)區(qū)(IRs)將大單拷貝區(qū)(LSC)和小單拷貝區(qū)(SSC)分開(kāi),基因組全長(zhǎng)介于156?583~158?077?bp之間,包含113個(gè)unique基因,其中蛋白編碼基因、tRNA基因和rRNA基因數(shù)分別為79、30和4;含有60~127對(duì)長(zhǎng)重復(fù)序列,其中正向重復(fù)序列和回文重復(fù)序列比例較高,30~39 bp的重復(fù)序列含量較高;發(fā)現(xiàn)150~164個(gè)SSR位點(diǎn),以單核苷酸和二核苷酸重復(fù)為主,多為A或T堿基重復(fù);基因組序列同源性較高,未發(fā)現(xiàn)基因重排現(xiàn)象,非編碼區(qū)序列變異高于基因編碼區(qū),LSC和SSC的多樣性位點(diǎn)多于IR;發(fā)現(xiàn)-、、--和等4個(gè)核苷酸多態(tài)性熱點(diǎn),LSC和SSC的序列多樣性高于IR;主要栽培種辣椒()與多花辣椒()親緣關(guān)系較近,中華辣椒()與灌木狀辣椒()和紫綠花辣椒()親緣關(guān)系較近。研究中篩選的SSR和核苷酸多態(tài)性熱點(diǎn)可作為辣椒屬物種鑒定和遺傳多樣性分析的分子標(biāo)記,研究明確了辣椒屬物種的系統(tǒng)發(fā)育關(guān)系,為辣椒屬物種遺傳多樣性和生物育種奠定基礎(chǔ)。
關(guān)鍵詞:辣椒屬;葉綠體基因組;核苷酸多態(tài)性熱點(diǎn);系統(tǒng)發(fā)育中圖分類號(hào):S718.46 ?????文獻(xiàn)標(biāo)識(shí)碼:A
Characteristics and Phylogenetics of the Complete Chloroplast Genomes of Species
LIU Chao, HAN Lihong, DAI Xiaobo, LIU Chenyu
Yunnan Engineering Research Center of Fruit Wine, College of Biological Resource and Food Engineering, Qujing Normal University, Qujing, Yunnan 655011, China
Pepper ( spp.) is widely used as food, spice, decoration, and medicine. Multiple cultivated species belong to important vegetable and spice crops. The analysis of the chloroplast genome of has important theoretical and practical value for clarifying the genetic diversity of germplasm resources and cultivating and improving cultivated varieties. The availability of complete chloroplast genome sequences has offered enormous opportunity to researchers to study the details of gene number, characterization, phylogenetic relationships and diversification of species. The complete chloroplast genome sequences of 13 species were downloaded from the NCBI database, and analyzed by online softwares, such as REPuter, MISA, and mVISTA. The chloroplast genome of had a conserved quadripartite structure, a pair of inverted repeats (IRs) separated a large single copy (LSC) region and a small single copy (SSC) region. The size of chloroplast genome sequences ranged from 156?583?bp ()-158?077?bp (). A total of 113 unique genes were predicted, including 79 protein-coding genes, 30 tRNA genes, and four rRNA genes. About 60-127 pairs of repeats were identified in chloroplast genomes, and the proportion of forward repeats and palindromic repeats and 30-39 bp repeats were all high in the chloroplast genomes. About 150-164 potential SSRs were reported in chloroplast genomes, and SSRs mainly consisted of mononucleotide and dinucleotide repeats, and most of the repeats were composed of A or T base. Comparative genomics of the 13 species revealed a high sequence similarity in genome-wide organization and a lower sequence divergence in the IRs than LSC and SSC. The fragments of r-,,-- and were identified as variable regions in species, and the nucleotide variability of LSC and SSC was higher than that of IR. The phylogenetic analysis showed that the main cultivated species was closely related to , and was closely related to and . The SSR and variable hotspots identified could be used as molecular markers for species identification and genetic diversity analysis of species. Overall, our study would highlight the taxonomic utility of the chloroplast genomes in species, and lay a foundation for the evolution, genetic diversity, conservation and biological breeding of species.
; chloroplast genome; variable hotspots; phylogeny
10.3969/j.issn.1000-2561.2022.03.002
辣椒屬( L.)屬于茄科一年或有限多年生植物,由約30余個(gè)物種構(gòu)成。辣椒起源于中美洲和安第斯山脈區(qū)域,目前在熱帶和溫帶地區(qū)廣泛栽培。辣椒屬物種包含多個(gè)野生馴化種,其果實(shí)外形和風(fēng)味高度不同。辣椒屬的5個(gè)栽培種為重要的蔬菜和香料作物,包括辣椒()、燈籠辣椒()、中華辣椒()、灌木狀辣椒()和絨毛辣椒(),其果實(shí)富含多種生物活性物質(zhì),其中類胡蘿卜素可作為天然色素和抗氧化劑,廣泛應(yīng)用于多種疾病的防控和治療。
葉綠體是綠色植物進(jìn)行光合作用的場(chǎng)所,具有獨(dú)立的遺傳系統(tǒng),其遺傳結(jié)構(gòu)相對(duì)穩(wěn)定,較少發(fā)生基因重組,因此葉綠體基因組序列被廣泛用于植物系統(tǒng)發(fā)育和物種鑒定。被子植物的葉綠體基因組高度保守,由一個(gè)大單拷貝區(qū)(large single copy region,LSC)、一個(gè)小單拷貝區(qū)(small single copy region,SSC)和一對(duì)反向重復(fù)區(qū)(inverted repeat regions,IRs)構(gòu)成。細(xì)胞核核糖體DNA內(nèi)部轉(zhuǎn)錄間隔區(qū)(rDNA-ITS)作為DNA條形碼,被廣泛用于物種鑒定和遺傳多樣性評(píng)估。研究發(fā)現(xiàn)辣椒的rDNA-ITS發(fā)生了不完全協(xié)同進(jìn)化,辣椒的遺傳多樣性是所有辣椒屬物種中最低的,中華辣椒可能是灌木狀辣椒的栽培變種。CAROLINA等使用葉綠體基因、和核基因?qū)?4個(gè)辣椒屬物種的種間關(guān)系、地理起源和擴(kuò)散進(jìn)行系統(tǒng)研究。TANG等對(duì)辣椒的線粒體基因家族進(jìn)行了鑒定和表征。ZHONG等利用SSR標(biāo)記對(duì)147份辣椒屬種質(zhì)資源的遺傳多樣性進(jìn)行研究。MAGDY等通過(guò)
泛質(zhì)體基因組對(duì)辣椒屬分類和鑒定進(jìn)行研究,發(fā)現(xiàn)、、位點(diǎn)多態(tài)性可用于辣椒屬物種系統(tǒng)進(jìn)化分析。BARBOZA等在南美安第斯熱帶森林中發(fā)現(xiàn)了4個(gè)辣椒屬新種,并利用、rpl32-trnL、、和對(duì)該屬物種進(jìn)行系統(tǒng)發(fā)育分析。D’AGOSTINO等測(cè)序了8個(gè)辣椒屬葉綠體基因組,發(fā)現(xiàn)、、、和位于高變區(qū),可用于辣椒屬物種的鑒定。
種質(zhì)資源是辣椒育種和生產(chǎn)的基礎(chǔ)。對(duì)基因組數(shù)據(jù)庫(kù)1618份分子材料的分析表明,分類學(xué)上的模糊性和錯(cuò)誤通常給辣椒屬物種的形態(tài)學(xué)分類帶來(lái)困難。辣椒由多個(gè)商業(yè)栽培品種組成,經(jīng)過(guò)長(zhǎng)期的人工馴化和連續(xù)栽培,品種遺傳背景變窄,遺傳多樣性降低,人類對(duì)辛辣等性狀的偏好為馴化辣椒遺傳變異產(chǎn)生了重要影響。因此,了解辣椒屬種質(zhì)資源間的遺傳多樣性,對(duì)于物種資源的收集、保護(hù)和利用至關(guān)重要。目前,辣椒屬的系統(tǒng)發(fā)育關(guān)系已被廣泛研究,多個(gè)辣椒屬物種葉綠體基因組被公布,但由于分子數(shù)據(jù)的限制,辣椒屬的種間關(guān)系仍存在較大爭(zhēng)議。本研究基于葉綠體基因組序列,針對(duì)辣椒屬物種資源親緣關(guān)系和遺傳多樣性展開(kāi)分析,將為我國(guó)現(xiàn)有辣椒栽培品種的改良選育提供理論依據(jù)。
? 序列獲取
從NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih. gov/)下載13個(gè)辣椒屬物種的葉綠體基因組信息,見(jiàn)表1。
? 方法
1.2.1? 重復(fù)序列分析? 使用REPuter軟件分析葉綠體基因組序列重復(fù),包括互補(bǔ)(complementary,C)、正向(forward,F(xiàn))、反向(reverse,R)和回文(palindromic,P)重復(fù),最小重復(fù)長(zhǎng)度30 bp,序列同源性90%,Hamming距離為3。使用MISA在線工具檢測(cè)SSR數(shù)量及位置分布,設(shè)置最小閾值為單核苷酸重復(fù)次數(shù)為8,二核苷酸和三核苷酸重復(fù)次數(shù)均為4,四核苷酸、五核苷酸和六核苷酸重復(fù)次數(shù)均為3。
1.2.2? 序列多樣性分析? 使用mVISTA在線軟件,以辣椒葉綠體基因組(JX270811)序列為參照,對(duì)辣椒屬物種葉綠體基因組序列變異進(jìn)行可視化比對(duì)。使用MAFFT v. 7.450軟件對(duì)辣椒屬物種葉綠體基因組序列進(jìn)行多序列比對(duì),使用DnaSP v. 6.10軟件分析葉綠體基因組序列核苷酸多樣性(),以確定辣椒屬的高度可變區(qū),設(shè)置搜索窗口長(zhǎng)度為600 bp,步長(zhǎng)為200 bp,使用R程序繪圖。
1.2.3? 系統(tǒng)發(fā)育分析? 利用13個(gè)辣椒屬物種的葉綠體基因組序列,以番茄(,AM087200)和馬鈴薯(,DQ386163)為外類群,使用MAFFT v. 7.450軟件進(jìn)行多序列比對(duì),通過(guò)IQ-TREE v. 2.1.1軟件基于
最大似然法(maximum likelihood,ML)構(gòu)建系統(tǒng)進(jìn)化樹(shù),建樹(shù)模型為KPu+F+R,步長(zhǎng)值為1000。
? 葉綠體基因組特征
所有辣椒屬葉綠體基因組均具有完整的LSC、SSC、IRa和IRb四部分(表1)。葉綠體基因組全長(zhǎng)介于156?583()~158?077 bp(),平均GC含量為37.70%。LSC長(zhǎng)度介于86?813()~87?688 bp(),SSC長(zhǎng)度介于17?849(var. )~19?040 bp(),IR長(zhǎng)度介于25?624()~25?910 bp(),各部分平均GC含量依次為35.75%、32.03%和43.01%。所有辣椒屬葉綠體基因組均包含113個(gè)unique基因,其中蛋白編碼基因79個(gè)、tRNA基因30個(gè)、rRNA基因4個(gè)(表1)。蛋白編碼基因、、、、、和均含有2個(gè)拷貝,、、、、、、、、和均含有1個(gè)內(nèi)含子,和含有2個(gè)內(nèi)含子。
?葉綠體基因組重復(fù)序列
由圖1可看出,辣椒屬物種含有60~127對(duì)長(zhǎng)重復(fù)序列,明顯多于番茄和馬鈴薯的40對(duì)和33對(duì)。與茄科代表物種不同,辣椒屬物種正向重復(fù)序列普遍占比均超過(guò)50%(除萊森素德辣椒外)(圖1A)。與茄科代表物種相比,辣椒屬長(zhǎng)重復(fù)序列長(zhǎng)度分布更加多樣化,30~39 bp長(zhǎng)度的序列最多,占42%~60%,其次為40~49 bp序列(圖1B)。
辣椒屬物種葉綠體基因組中含有150~164個(gè)SSR位點(diǎn)(圖2)。主要以單核苷酸和二核苷酸重復(fù)為主,其中單核苷酸均大于100個(gè),二核苷酸平均43個(gè),四核苷酸重復(fù)略多于三核苷酸,僅有辣椒、多花辣椒和萊森素德辣椒含有六核苷酸重復(fù)(圖2A)。辣椒屬二核苷酸SSR明顯多于番茄和馬鈴薯。單核苷酸主要為A/T重復(fù),占單堿基重復(fù)的98%,C/G重復(fù)僅占2%;二核苷酸重復(fù)主要為AT/AT、AG/CT和AC/GT 3種類型,未檢測(cè)到CG/GC重復(fù),其中AT/AT重復(fù)占60%,AG/CT占38%;三、四、五和六核苷酸重復(fù)序列相對(duì)較少,且均含有較高的A或T堿基(圖2B)。
2.3? 葉綠體基因組結(jié)構(gòu)變異
以辣椒葉綠體基因組JX270811為參考,利用mVISTA軟件比較辣椒屬葉綠體基因組序列的同源性(圖3)。結(jié)果顯示,辣椒屬葉綠體基因組未發(fā)生基因重排現(xiàn)象,非編碼區(qū)序列變異高于基因編碼區(qū),LSC和SSC的多樣性位點(diǎn)多于IR。與其他物種相比,萊森素德辣椒具有較高的序列變異。
使用DnaSP軟件對(duì)辣椒屬13個(gè)物種葉綠體基因組核苷酸多態(tài)性()進(jìn)行分析(圖4)。共檢測(cè)到1514個(gè)多態(tài)性位點(diǎn),LSC、SSC和IR區(qū)平均值分別為0.002?39、0.003?83和0.000?86,發(fā)現(xiàn)3個(gè)非編碼區(qū)核苷酸多態(tài)性熱點(diǎn)(hotspots)r-、、--和1個(gè)編碼區(qū)熱點(diǎn),其中r-(=0.016?37)和(=0.010?30)位于LSC,-- (=0.014?57)和(=0.008?06)位于SSC?;蚪M中LSC和SSC區(qū)多態(tài)性位點(diǎn)數(shù)較多,IR區(qū)變異較少,表現(xiàn)為相對(duì)保守。
? 辣椒屬系統(tǒng)發(fā)育
基于葉綠素基因組數(shù)據(jù),構(gòu)建了辣椒屬物種系統(tǒng)發(fā)育關(guān)系(圖5)。萊森素德辣椒位于辣椒屬系統(tǒng)發(fā)育樹(shù)的基部,隨后是絨毛辣椒,節(jié)點(diǎn)支持率均為100%。辣椒和多花辣椒以100%的支持率聚成一支,中華辣椒以89%的支持率與灌木狀辣椒和紫綠花辣椒聚成一支,密毛辣椒以100%的支持率與燈籠辣椒和垂花燈籠辣椒聚成一支。
隨著高通量測(cè)序技術(shù)的發(fā)展,植物葉綠體基因組序列為分類學(xué)、物種鑒定和系統(tǒng)發(fā)育提供了有價(jià)值的遺傳信息,并被廣泛用于評(píng)估物種遺傳多樣性和物種親緣關(guān)系。目前,多個(gè)辣椒屬葉綠體基因組已被公布,本研究對(duì)辣椒屬物種葉綠體基因組序列特征、結(jié)構(gòu)變異和系統(tǒng)發(fā)育進(jìn)行分析,發(fā)現(xiàn)13個(gè)辣椒屬物種葉綠體基因組均具有典型的四分體結(jié)構(gòu),2個(gè)IR將LSC和SSC分開(kāi),物種間葉綠體基因組大小差異1.5?kb以內(nèi),編碼的基因種類和數(shù)目一致,顯示基因組結(jié)構(gòu)高度保守。
遺傳多樣性評(píng)價(jià)對(duì)于種質(zhì)資源的收集和高效利用具有重要意義。重復(fù)序列在葉綠體基因組重排和序列變異中發(fā)揮重要作用,基因組SSR標(biāo)記可用作物種群體遺傳多樣性、遺傳演化和基因組圖譜分析,在植物群體遺傳學(xué)和分子育種中具有重要的應(yīng)用價(jià)值。辣椒屬葉綠體基因組中正向重復(fù)比例最高,其次是回文重復(fù),反向重復(fù)和互補(bǔ)重復(fù)比例較低,這與其他茄科物種一致,而與楊屬、蕓苔屬等結(jié)果不同,說(shuō)明物種的親緣關(guān)系與重復(fù)序列的種類及數(shù)量存在一定的相關(guān)性。辣椒屬葉綠體基因組中以單核苷酸和二核苷酸SSR為主,且含有較高的AT含量,這支持了植物葉綠體基因組中的SSR通常由多聚A或多聚T重復(fù)組成,較少包含串聯(lián)G或C重復(fù),這些結(jié)果與其他物種類似。不同科或?qū)俚闹参锶~綠體基因組核苷酸多態(tài)性位點(diǎn)有較大差異,但一般情況下,非編碼區(qū)的變異位點(diǎn)比例高于編碼區(qū),2個(gè)IR區(qū)相對(duì)LSC或SSC含有較少的序列變異。辣椒屬葉綠體基因組LSC和SSC序列變異高于IR,識(shí)別的4個(gè)核苷酸多態(tài)性熱點(diǎn)位于LSC或SSC。熱點(diǎn)和與D’AGOSTINO等對(duì)11個(gè)辣椒物種葉綠體基因組變異的研究結(jié)果一致。蒿屬()、茄科枸杞屬()和木蘭科(Magnoliaceae)葉綠體基因組中也分別鑒定到了、和屬于核苷酸多態(tài)性熱點(diǎn)。本研究中鑒定的重復(fù)序列和核苷酸多態(tài)性位點(diǎn)可作為遺傳多樣性標(biāo)記,用于辣椒屬種間物種鑒定和譜系分析。
目前,基于DNA條形碼、質(zhì)體基因和SSR標(biāo)記等對(duì)辣椒屬物種多樣性和種間關(guān)系開(kāi)展了多項(xiàng)研究,然而辣椒屬種間關(guān)系仍存在爭(zhēng)議,基于葉綠體基因組的遺傳多樣性和序列多態(tài)性分析對(duì)辣椒品種改良具有重要意義。本研究基于已公布的辣椒屬物種葉綠體基因組序列構(gòu)建系統(tǒng)發(fā)育樹(shù),中華辣椒與灌木狀辣椒聚成一個(gè)高支持率的系統(tǒng)發(fā)育支,二者葉綠體基因組SSC和IR區(qū)大小一致,僅在LSC區(qū)相差7 bp,結(jié)果支持了中華辣椒可能是灌木狀辣椒的栽培變種的結(jié)論。辣椒與多花辣椒親緣關(guān)系較近,二者葉綠體基因組僅相差35 bp。本研究結(jié)果可為辣椒屬植物系統(tǒng)發(fā)育關(guān)系和遺傳育種提供理論參考。
本研究結(jié)果表明,辣椒屬植物葉綠體基因組全長(zhǎng)介于156?583?bp~158?077?bp之間,平均GC含量為37.70%,基因組結(jié)構(gòu)保守。長(zhǎng)重復(fù)序列以正向重復(fù)和回文重復(fù)為主,30~39?bp長(zhǎng)度的序列比較最高。SSR位點(diǎn)主要為單核苷酸和二核苷酸重復(fù),通常由多聚A或多聚T組成?;蚪M非編碼區(qū)序列變異高于基因編碼區(qū),4個(gè)核苷酸多態(tài)性熱點(diǎn)中,r-和位于LSC,--和位于SSC。辣椒與多花辣椒、中華辣椒與灌木狀辣椒和紫綠花辣椒、密毛辣椒與燈籠辣椒和垂花燈籠辣椒分別具有較近的親緣關(guān)系。
參考文獻(xiàn)