俞超 陳煜 汪財(cái)生 陳佳怡 金從標(biāo)
摘 要 為分析不同品種紅心火龍果的遺傳關(guān)系,本研究采集國(guó)內(nèi)14種紅心火龍果品種,通過(guò)生物信息學(xué)分析進(jìn)行實(shí)驗(yàn)方案的系統(tǒng)設(shè)計(jì),將所提取基因組進(jìn)行酶切,篩選特異長(zhǎng)度的DNA片斷,構(gòu)建SLAF-seq文庫(kù)后進(jìn)行高通量測(cè)序,將獲得的序列進(jìn)行分析比較后得到多態(tài)SLAF標(biāo)簽,在此標(biāo)簽基礎(chǔ)上進(jìn)一步開發(fā)特異性SNP位點(diǎn),最后建立14種紅心火龍果品種的進(jìn)化樹。本研究共開發(fā)159 560個(gè)SLAF標(biāo)簽,樣品的平均測(cè)序深度為5.26×;共得到120 294個(gè)群體SNP,其中高一致性的群體SNP 51 859個(gè)。12種紅心火龍果聚類結(jié)果發(fā)現(xiàn),樣品1、2、6、8、10同緣關(guān)系相近;樣品3、5、7、9同緣關(guān)系相近;樣品4、14同緣關(guān)系相對(duì)較近。研究表明應(yīng)用SLAF-seq技術(shù)開發(fā)分子標(biāo)記的效率比ISSR、RAPD、AFLP等常規(guī)技術(shù)更高。12種紅心火龍果的聚類結(jié)果從基因組水平揭示不同地區(qū)品種之間的遺傳分化關(guān)系,為火龍果種質(zhì)的保護(hù)和遺傳改良提供參考。
關(guān)鍵詞 紅心火龍果;SLAF-seq;SNP位點(diǎn);遺傳分析
中圖分類號(hào) S667.9 文獻(xiàn)標(biāo)識(shí)碼 A
Abstract To analyze the genetic relationship among different cultivars, 14 red pitaya varieties were collected and sequenced by SLAF-seq technology. The scheme of the experiment was designed based on bio-informatics technology. Genome was extracted and digested by enzyme, specific size of DNA were chosen to construct the SLAF-seq library. After high-throughput sequencing, a great amount of sequences were obtained and used to gain the polymorphism SLAF tags by software alignment, then found the distribution of specific SNP sites. Finally evolutionary tree of 14 red pitaya varieties was constructed. In the end, 159 560 SLAFs were produced, and the average sequencing depth was 5.26×. 51 859 high consistency SNP sites was obtained based on the analysis of total 120 294 SNP. The clustering results of 12 red pitaya varieties showed the sample 1, 2, 6, 8, 10 had a greatly close relationship between each other, the same as the sample 3, 5, 7, 9 and sample 4, 14. This paper provided results that SLAF-seq technology could be applied in developing SNP sites in red pitaya, much more efficiently than markers like SSR, RAPD and AFLP. The clustering results revealed the relationships of population genetic evolution in the genomic level among red pitaya varieties come from different area,and provided reference for the protection of red pitaya's germplasm and genetic improvement.
Key words red pitaya; SLAF-seq; SNP sites; genetic analysis
doi 10.3969/j.issn.1000-2561.2017.04.002
火龍果(Hylocereus undulates Britt. & Rose)是一種原產(chǎn)于墨西哥等中美洲地區(qū)的典型熱帶水果,近幾年引入中國(guó)內(nèi)地栽培并逐漸受到消費(fèi)者青睞,規(guī)?;N植前景廣闊,有著良好的發(fā)展空間。火龍果品種大體上可分為紅皮紅心、紅皮白心、黃皮白心等3種類型[1],紅皮紅心火龍果的果肉中尤其含有大量花青素,可用于天然色素的提取,具有抗氧化抗衰老作用,經(jīng)濟(jì)價(jià)值高,對(duì)其研究日益增加[2-6]。
2003年,國(guó)外TEL-ZUR等[7]首次采用RAPD技術(shù)分析兩大屬火龍果的遺傳關(guān)系,設(shè)計(jì)9條引物得到了173個(gè)多態(tài)標(biāo)記;此后,AFLP技術(shù)同樣被認(rèn)為能較好地區(qū)分不同品種火龍果[8-9]。從2012年開始,國(guó)內(nèi)逐漸開展火龍果種質(zhì)相關(guān)的研究,如采用RAPD分子標(biāo)記技術(shù),從1196條引物中篩選出1條引物能夠區(qū)分紅肉和白肉火龍果[10];ISSR技術(shù)可獲得約一至兩百個(gè)多態(tài)性分子標(biāo)記[11-13],對(duì)本地火龍果的遺傳多樣性評(píng)價(jià)、種質(zhì)鑒定等研究效果較好。但這些分子標(biāo)記技術(shù)都存在一定的局限性,如RAPD技術(shù)易受許多因素影響,實(shí)驗(yàn)的穩(wěn)定性和重復(fù)性較差,而ISSR標(biāo)記對(duì)體細(xì)胞遺傳變異的檢測(cè)效率較低[14]。因此,進(jìn)一步大量開發(fā)火龍果分子標(biāo)記需要有更高效的技術(shù)支持。近十年,隨著高通量測(cè)序技術(shù)的快速發(fā)展,其簡(jiǎn)便快捷、低成本的特點(diǎn)在遺傳研究中具有重要的地位,大規(guī)?;蚍中徒Y(jié)合高通量測(cè)序技術(shù)為基因挖掘提供有力的技術(shù)保障[15]。 SLAF-seq(specific-locus amplified fragment sequencing),該技術(shù)利用生物信息學(xué)方法,對(duì)目標(biāo)物種的參考基因組進(jìn)行系統(tǒng)分析,設(shè)計(jì)標(biāo)記開發(fā)方案,構(gòu)建SLAF-seq文庫(kù),篩選特異性長(zhǎng)度片段進(jìn)行高通量測(cè)序,將獲得測(cè)序深度和質(zhì)量滿足要求的SLAF片段來(lái)代表目標(biāo)物種的全基因組信息,進(jìn)而根據(jù)這些特異性SLAF片段開發(fā)出大量分子標(biāo)記,用于遺傳定位、基因表達(dá)調(diào)控、系統(tǒng)進(jìn)化等分子生物學(xué)研究[16-17]。當(dāng)前,尚未有利用高通量測(cè)序技術(shù)開發(fā)火龍果大量分子標(biāo)記的報(bào)道,且不同紅心火龍果品種的植物學(xué)特征及其遺傳關(guān)系的研究很少,嚴(yán)重影響火龍果的推廣和可持續(xù)發(fā)展。
本研究采集國(guó)內(nèi)14種紅心火龍果品種,利用SLAF-seq技術(shù)獲得大量特異性SNP位點(diǎn),并分析紅心火龍果品種間的遺傳關(guān)系,對(duì)于火龍果種質(zhì)的保護(hù)和遺傳改良具有重要的意義。
1 材料與方法
1.1 材料
14種紅心火龍果樣品材料由寧波綠苑農(nóng)業(yè)開發(fā)有限公司的火龍果種植基地提供。
1.2 方法
1.2.1 SLAF-seq技術(shù)開發(fā)特異性SNP 利用植物復(fù)雜基因組提取試劑盒(天根生化科技有限公司)提取火龍果基因組DNA,用1.2%的瓊脂糖電泳檢測(cè)DNA 的完整性。
根據(jù)選定的最適酶切方案,對(duì)檢測(cè)合格的各樣品基因組DNA分別進(jìn)行酶切。對(duì)得到的酶切片段(SLAF標(biāo)簽)進(jìn)行3′端加A處理、連接Dual-index[18]測(cè)序接頭、PCR擴(kuò)增、純化、混樣、切膠選取目的片段,文庫(kù)質(zhì)檢合格后用Illumina HiSeqTM2500進(jìn)行測(cè)序。為評(píng)估酶切實(shí)驗(yàn)的準(zhǔn)確性,選用日本晴水稻(Oryza sativa indica)作為對(duì)照進(jìn)行測(cè)序。
為保證分析質(zhì)量,本試驗(yàn)采用讀長(zhǎng)100 bp×2作為后續(xù)的數(shù)據(jù)評(píng)估和分析數(shù)據(jù)。利用Dual-index 對(duì)測(cè)序得到的原始數(shù)據(jù)進(jìn)行識(shí)別,得到各個(gè)樣品的讀長(zhǎng)。過(guò)濾測(cè)序讀長(zhǎng)的接頭后,進(jìn)行測(cè)序質(zhì)量和數(shù)據(jù)量的評(píng)估。通過(guò)對(duì)照數(shù)據(jù)評(píng)估酶切效率,以此判斷實(shí)驗(yàn)過(guò)程的準(zhǔn)確性和有效性。
測(cè)序產(chǎn)生的讀長(zhǎng)來(lái)源于同一限制性內(nèi)切酶對(duì)不同樣品作用產(chǎn)生的長(zhǎng)度相同的酶切片段,根據(jù)序列相似性將各樣品的讀長(zhǎng)進(jìn)行聚類,聚類到一起的讀長(zhǎng)來(lái)源于一個(gè)SLAF片段(SLAF標(biāo)簽)。SNP標(biāo)記的開發(fā)是以每個(gè)SLAF標(biāo)簽中深度最高的序列類型作為參考序列,利用bwa[19]將測(cè)序reads比對(duì)到參考序列上,并使用GATK[20]和samtools[21]兩種方法開發(fā)SNP,以兩種方法得到的SNP標(biāo)記交集作為最終可靠的SNP標(biāo)記數(shù)據(jù)。
1.2.2 遺傳進(jìn)化分析 將開發(fā)的SNP標(biāo)記,根據(jù)完整度>0.8,MAF>0.05過(guò)濾后獲得高一致性的群體SNP,通過(guò)MEGA5[22]軟件,neighbor-joining[23]算法,做14個(gè)樣品的進(jìn)化分析,計(jì)算得到14個(gè)樣品的進(jìn)化樹。
2 結(jié)果與分析
2.1 火龍果樣品的生物學(xué)特征
從基地采集的14種火龍果樣品,具備不同的主莖、枝條、刺座、果實(shí)特征。主莖特征包括棱數(shù)量、生長(zhǎng)方式;枝條特征包括枝條數(shù)量、邊緣形態(tài);刺座特征包括刺座特征、形狀、顏色;果實(shí)特征包括形狀、顏色、苞片形態(tài),詳見表1,典型樣品形態(tài)見圖1。
2.2 SLAF-seq技術(shù)開發(fā)特異性SNP
14種火龍果基因組DNA基本無(wú)明顯污染,質(zhì)量滿足建庫(kù)要求(圖2)。利用SLAF-seq技術(shù)共開發(fā)159 560個(gè)SLAF標(biāo)簽,樣品的平均測(cè)序深度為5.26×,統(tǒng)計(jì)結(jié)果見表2。最后得到120 294個(gè)群體SNP,根據(jù)完整度>0.8,MAF>0.05過(guò)濾,共得到51 859個(gè)高一致性的群體SNP,信息統(tǒng)計(jì)見表3。
2.3 系統(tǒng)發(fā)育樹分析
基于51 859個(gè)高一致性的群體SNP做14個(gè)樣品的進(jìn)化分析,計(jì)算得到14個(gè)樣品的進(jìn)化樹(圖3)。從聚類結(jié)果來(lái)看,主莖(三棱,直立生長(zhǎng))、枝條特征(均為6支,齒形邊緣)相同,果實(shí)刺座特征略有不同的1、2、6、8、10樣品同緣關(guān)系相近;主莖(三棱,彎曲生長(zhǎng))、枝條特征(均為8支,波浪形邊緣)相同,刺座和果實(shí)特征略有不同的3、5、7、9樣品同緣關(guān)系相近;主莖(四棱,彎曲生長(zhǎng))、枝條特征(均為9支,波浪形邊緣)相同,果實(shí)刺座特征略有不同的4、14樣品同緣關(guān)系相對(duì)較近。由此可知,火龍果的主莖特征(棱數(shù)量、生長(zhǎng)方式)和枝條特征(枝條數(shù)量、邊緣形狀)相似的在較近距離內(nèi)相聚,可做為親緣關(guān)系遠(yuǎn)近的重要依據(jù)。實(shí)驗(yàn)結(jié)果從基因組水平揭示不同地區(qū)的品種之間及同一地區(qū)的不同個(gè)體之間的遺傳分化關(guān)系,解釋不同地區(qū)火龍果的遺傳進(jìn)化地位。
3 討論
SLAF-seq 技術(shù)結(jié)合了位點(diǎn)特異性擴(kuò)增和高通量測(cè)序,可以用于全基因組范圍的SNP開發(fā)和大范圍的基因分型, 并能實(shí)現(xiàn)候選功能區(qū)域的精細(xì)定位。Geng等[24]在油菜中開發(fā)了1 933個(gè)SLAF標(biāo)記,并找到4個(gè)與種子重量高度相關(guān)的基因;Xu等[25]利用SLAF-seq技術(shù)發(fā)現(xiàn)了與黃瓜肉質(zhì)厚度相關(guān)的候補(bǔ)基因;Zhao等[26]利用SLAF-seq技術(shù)篩選到蕃茄葉霉病的抗性基因。
火龍果目前尚無(wú)參考基因組,利用常規(guī)方法開發(fā)火龍果基因組的特異分子標(biāo)記耗時(shí)長(zhǎng),難度大,標(biāo)記數(shù)量不多,ISSR技術(shù)獲得了215個(gè)多態(tài)標(biāo)記[11];RAPD技術(shù)獲得了173個(gè)多態(tài)標(biāo)記[7];AFLP技術(shù)獲得了51個(gè)多態(tài)標(biāo)記[9]。而SLAF-seq技術(shù)獲得的特異DNA序列和分子標(biāo)記數(shù)量都相當(dāng)龐大。本次研究利用該技術(shù)共開發(fā)159 560個(gè)SLAF標(biāo)簽,得到51 859個(gè)高一致性的群體SNP,在14個(gè)樣品中的完整率均超過(guò)91%??梢姂?yīng)用SLAF-seq技術(shù)開發(fā)分子標(biāo)記的效率比ISSR、RAPD、AFLP等常規(guī)技術(shù)更高。今后可利用該技術(shù)進(jìn)一步篩選火龍果品質(zhì)、抗逆性相關(guān)的基因,開拓火龍果種質(zhì)資源保護(hù)、新品種開發(fā)等相關(guān)研究領(lǐng)域。
從本研究所建立的系統(tǒng)發(fā)育樹來(lái)看,紅肉火龍果種質(zhì)遺傳多樣性較豐富,火龍果生物學(xué)特征中的主莖和枝條特征可以作為分類的主要標(biāo)準(zhǔn),包括主莖的棱數(shù)量、是否直立生長(zhǎng),以及枝條的數(shù)量和邊緣特征。根據(jù)文獻(xiàn)[27]和專家初步鑒定,同緣關(guān)系相近1、2、6、8、10可能為“地龍”品種,3、5、7、9可能為“柬埔寨紅肉”,4、14可能為“長(zhǎng)紅”,其果實(shí)刺座特征的差異可能由是不同產(chǎn)地造成遺傳突變;11-13分別可能為“云龍”、“云南紅肉”、“長(zhǎng)龍”,其遺傳距離與其它品種相對(duì)較遠(yuǎn)。本實(shí)驗(yàn)所取樣品數(shù)量有限,并未收集國(guó)內(nèi)所有火龍果品種,今后可逐步探討已審定火龍果正規(guī)品種間的遺傳關(guān)系,理清歸納不同品種間生物學(xué)特征,以保證火龍果產(chǎn)業(yè)快速、持續(xù)以及有效的發(fā)展。
參考文獻(xiàn)
[1] 黃鳳珠, 陸貴鋒, 黃黎芳, 等. 火龍果種質(zhì)資源收集保存與初步評(píng)價(jià)[J]. 西南農(nóng)業(yè)學(xué)報(bào), 2016, 29(4): 920-924.
[2] Fathordoobady F, Mirhosseini H, Selamat J, et al. Effect of solvent type and ratio on betacyanins and antioxidant activity of extracts from Hylocereus polyrhizus flesh and peel by supercritical fluid extraction and solvent extraction[J]. Food Chemistry, 2016, 202: 70-80.
[3] Ortiz T A, Takahashi L S. Physical and chemical characteristics of pitaya fruits at physiological maturity[J]. Genetic Molecular Research, 2015, 14(4): 22-39.
[4] Suh D H, Lee S, Heo do Y, et al. Metabolite profiling of red and white pitayas (Hylocereus polyrhizus and Hylocereus undatus) for comparing betalain biosynthesis and antioxidant activity[J]. Agriculture Food Chemistry, 2014, 62(34): 64-71.
[5] García-Cruz L, Valle-Guadarrama S, Salinas-Moreno Y, et al. Physical, chemical, and antioxidant activity characterization of pitaya (Stenocereus pruinosus) fruits[J]. Plant Foods for Human Nutrition, 2013, 68(4): 403-410.
[6] Kim H, Choi H K, Moon J Y, et al. Comparative antioxidant and antiproliferative activities of red and white pitayas and their correlation with flavonoid and polyphenol content[J]. Journal of Food Science, 2011, 76(1): C38-45.
[7] Tel-zur N, Abbo S, Bar-zvi D, et al. Clone identification and genetic relationship among vine cacti from the genera Hylocereus and Selenicereus based on RAPD analysis[J]. Scientia Horticulturae, 2004, 100(1): 279-289.
[8] Cisneros A, Tel-Zur N. Genomic analysis in three Hylocereus species and their progeny: Evidence for introgressive hybridization and gene flow[J]. Euphytica, 2013, 194(1): 109-124.
[9] Pagliaccia D, Vidalakis G, Douhan G W, et al. Genetic characterization of pitahaya accessions based on amplified fragment length polymorphism analysis[J]. HortScience, 2015, 50(3): 332-336.
[10] 李加強(qiáng). 火龍果實(shí)生群體主要性狀遺傳規(guī)律探討及肉色相關(guān)的RAPD分子標(biāo)記篩選[D]. 廣州: 華南農(nóng)業(yè)大學(xué), 2012.
[11] 張冰雪, 范付華, 喬 光, 等. 貴州地方火龍果芽變種質(zhì)DNA指紋圖譜及遺傳多樣性的ISSR分析[J]. 果樹學(xué)報(bào), 2013, 30(4): 573-577.
[12] Fan Q J, Zheng C, Yan F X, et al. An efficient regeneration of pitaya (Hylocereus undatus) and the genetic fidelity assessment of in vitro-derived plants using ISSR markers[J]. Journal of Horticultural Science & Biotechnology, 2013, 88(5): 631-637.
[13] 陳明賢. 福建省火龍果種質(zhì)資源ISSR分析及耐鹽性研究[D]. 福州: 福建農(nóng)林大學(xué), 2012.
[14] 陳桂信, 潘東明, 呂柳新, 等. DNA分子標(biāo)記技術(shù)及其在熱帶亞熱帶果樹上的應(yīng)用[J]. 江西農(nóng)業(yè)大學(xué)學(xué)報(bào), 2002, 24(2): 176-182.
[15] Ogura T, Busch W. From phenotypes to causal sequences: using genome wide association studies to dissect the sequence basis for variation of plant development[J]. Current Opinion in Plant Biology, 2015, 23: 98-108.
[16] Sun X W, Liu D Y, Zhang X F, et al. SLAF-seq: An efficient method of large-scale de novo snp discovery and genotyping using highthroughput sequencing[J]. Plos One, 2013, 8(3): e58700.
[17] 陳士強(qiáng), 秦樹文, 黃澤峰, 等. 基于SLAF-seq 技術(shù)開發(fā)長(zhǎng)穗偃麥草染色體特異分子標(biāo)記[J]. 作物學(xué)報(bào), 2013, 39(4): 727-734.
[18] Kozich J J, Westcott S L, Baxter N T, et al. Development of a dual-index sequencing strategy and curation pipeline for analyzing amplicon sequence data on the MiSeqIllumina sequencing platform[J]. Applied and environmental microbiology, 2013, 79(17): 5 112-5 120.
[19] Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform[J]. Bioinformatics, 2009, 25(14): 1 754-1 760.
[20] McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data[J]. Genome research, 2010, 20(9): 1 297-1 303.
[21] Li H, Handsaker B, Wysoker A, et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics, 2009, 25(16): 2 078-2 079.
[22] Koichiro T, Daniel P, Glen S, et al. Molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J]. Molecular Biology and Evolution, 2011, 28(10): 2 731-2 739.
[23] Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution, 1987, 4(4): 406-425.
[24] Geng X X, Jiang C H, Yang J, et al. Rapid identification of candidate genes for seed weight using the SLAF-Seq method in Brassica napus[J]. PLoS One. 2016; 11(1): 1-14.
[25] Xu X W, Lu L, Zhu B Y, et al. QTL mapping of cucumber fruit flesh thickness by SLAF-seq[J]. Scientific Reports. 2015(5): 15829.
[26] Zhao T T, Jiang J B, Liu G, et al. Mapping and candidate gene screening of tomato Cladosporium fulvum-resistant gene Cf-19, based on high-throughput sequencing technology[J]. BMC Plant Biology, 2016, 16: 51.
[27] 黎 舒. 火龍果不同品系品種植物學(xué)形態(tài)和生物學(xué)特性研究[D]. 南寧: 廣西大學(xué), 2014.