郭廣君, 孫 茜, 劉金兵, 潘寶貴, 刁衛(wèi)平, 戈 偉, 高長(zhǎng)洲, 王述彬
(江蘇省農(nóng)業(yè)科學(xué)院蔬菜研究所/江蘇省高效園藝作物遺傳改良重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014)
辣椒(Capsicum spp.)屬于茄科 (Solanaceae) 辣椒屬(Capsicum)作物,作為一種重要的蔬菜作物和調(diào)味品,廣泛栽培于南北美、亞洲、歐洲和大洋洲等世界各地。隨著消費(fèi)者需求的多樣性,利用傳統(tǒng)方法在辣椒的遺傳改良上取得了很大進(jìn)展,但是分子標(biāo)記[1]和第二代測(cè)序技術(shù)[2]的出現(xiàn)為辣椒的遺傳改良提供了更大的機(jī)遇[3]。目前辣椒分子標(biāo)記的開(kāi)發(fā)和應(yīng)用主要集中于利用公用數(shù)據(jù)或者基因組文庫(kù)開(kāi)發(fā)SSR標(biāo)記[4-8]。隨著高通量測(cè)序技術(shù)的發(fā)展和辣椒基因組數(shù)據(jù)的發(fā)布,使得辣椒分子標(biāo)記的開(kāi)發(fā)和應(yīng)用進(jìn)入了一個(gè)新的階段[9-10],第三代分子標(biāo)記SNP標(biāo)記和InDel標(biāo)記的開(kāi)發(fā)和應(yīng)用在辣椒中逐漸廣泛[11-14]。
插入/缺失多態(tài)性(Insertion/deletion,InDel)標(biāo)記是由于等位基因位點(diǎn)處的DNA序列在不同個(gè)體間發(fā)生了核苷酸片段的插入/缺失而產(chǎn)生的長(zhǎng)度多態(tài)性變異[15]。根據(jù)目標(biāo)位點(diǎn)兩側(cè)的序列設(shè)計(jì)特異引物進(jìn)行PCR擴(kuò)增,擴(kuò)增片段的長(zhǎng)度多態(tài)性即是InDel標(biāo)記。在整個(gè)基因組中,InDel標(biāo)記的多態(tài)性頻率僅次于SNP標(biāo)記,遠(yuǎn)高于SSR標(biāo)記。InDel標(biāo)記多態(tài)性可通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和瓊脂糖凝膠電泳或非變性聚丙烯酰胺凝膠電泳等簡(jiǎn)單的步驟達(dá)到基因分型的目的[16-17],相對(duì)于SNP標(biāo)記,其標(biāo)記的設(shè)計(jì)和檢測(cè)更為簡(jiǎn)易,應(yīng)用也更為方便[18]。此外,InDel標(biāo)記的另一優(yōu)點(diǎn)是不可能在同1個(gè)基因組位點(diǎn)上發(fā)生同樣長(zhǎng)度的2個(gè) InDel位點(diǎn)突變,所以具有共同InDel突變位點(diǎn)的2個(gè)物種間代表其具有血緣一致性(Identity-by-descent)[19]。綜上所述,In-Del標(biāo)記為共顯性標(biāo)記,具有較好的穩(wěn)定性和較為豐富的多態(tài)性,是高分辨率圖譜構(gòu)建,關(guān)聯(lián)分析和基因定位等方面最佳的候選標(biāo)記[20]。但是,辣椒中已開(kāi)發(fā)和應(yīng)用的InDel標(biāo)記數(shù)量非常少,本研究的目的在于基于辣椒基因組重測(cè)序數(shù)據(jù)開(kāi)發(fā)InDel標(biāo)記,利用不同遺傳背景的辣椒種質(zhì)對(duì)開(kāi)發(fā)出的InDel標(biāo)記進(jìn)行驗(yàn)證,篩選獲得有效的InDel標(biāo)記,進(jìn)一步探討InDel標(biāo)記在種質(zhì)鑒定中的應(yīng)用。
本研究利用重測(cè)序數(shù)據(jù)與參考基因組進(jìn)行比對(duì)查找InDel位點(diǎn)。參考基因組版本為pepper.V.1.55,下載網(wǎng)址:http://peppergenome.snu.ac.kr/ download.php。采用illumina HiSeqTM2500測(cè)序平臺(tái)對(duì)一年生辣椒(Capsicum annuum)“G29”和灌木狀辣椒(Capsicum.frutescents)“G108”進(jìn)行測(cè)序。將測(cè)序得到的原始Reads進(jìn)行質(zhì)量評(píng)估并過(guò)濾得到Clean Reads。利用bwa軟件比對(duì)定位Clean Reads在參考基因組上的位置。InDel的檢測(cè)主要使用GATK軟件工具包實(shí)現(xiàn)。根據(jù)Clean Reads在參考基因組的定位結(jié)果,使用 Samtools進(jìn)行去重復(fù)(Mark duplicates),使用GATK軟件進(jìn)行局部比對(duì)(Local realignment)和堿基質(zhì)量值校正(Base recalibration)等預(yù)處理,以保證檢測(cè)結(jié)果的準(zhǔn)確性,再使用GATK軟件進(jìn)行變異檢測(cè)和校準(zhǔn),選取可靠的In-Del位點(diǎn)[21-22]。利用SnpEff軟件根據(jù)InDel位點(diǎn)在參考基因組上的位置信息,對(duì)比參考基因組的基因、CDS位置等信息對(duì)其進(jìn)行注釋和預(yù)測(cè)其影響。
根據(jù)重測(cè)序數(shù)據(jù)中預(yù)測(cè)到InDel位點(diǎn),篩選出插入/缺失堿基數(shù)為5~10個(gè)堿基的位點(diǎn)?;诶苯坊蚪M序列,將篩選出的位點(diǎn)定位在基因組上,取InDel位點(diǎn)兩翼各200 bp堿基長(zhǎng)度,共401 bp長(zhǎng)度進(jìn)行引物設(shè)計(jì)。采用Primer 3.0進(jìn)行引物設(shè)計(jì),上游引物設(shè)計(jì)范圍在1~195 bp,下游引物設(shè)計(jì)范圍為205~401 bp,產(chǎn)物大小為150~250 bp,退火溫度為52~60℃。
優(yōu)化后的擴(kuò)增反應(yīng)采用10 μl反應(yīng)體系,包括20 ng模板DNA、5 μl 2×Mix混合液(含Mg2+的10×PCR buffer、2.5 mmol/L的 dNTPs、0.5 U Taq DNA聚合酶)、每個(gè)引物終濃度為0.2 μmol/L。反應(yīng)程序?yàn)?4℃預(yù)變性4 min;94℃變性30 s,55℃復(fù)性30 s,72℃延伸40 s,循環(huán)30次;72℃延伸7 min,置于4℃下保存。擴(kuò)增產(chǎn)物用10%非變性聚丙烯酰胺凝膠電泳,銀染顯色,統(tǒng)計(jì)分析條帶類(lèi)型。
用于檢測(cè)標(biāo)記有效性的辣椒材料來(lái)源于國(guó)外和國(guó)內(nèi)多個(gè)科研單位,其中包括一年生辣椒(Capsicum annuum)21份、灌木狀辣椒(Capsicum frutescents)2份,下垂辣椒(Capsicum baccatum)1份。除11份辣椒品種外,其余13份以G開(kāi)頭的材料為項(xiàng)目組引進(jìn)的國(guó)外種質(zhì)資源(表1)。采用改良CTAB法提取葉片的基因組DNA[23],經(jīng)瓊脂糖凝膠電泳和微量分光光度計(jì)檢測(cè),DNA濃度調(diào)至50 ng/μl備用。
通過(guò)與參考基因組序列比對(duì),一年生辣椒品種G29和灌木狀辣椒品種G108的全基因組范圍內(nèi)共檢測(cè)到的InDel數(shù)量分別為533 523個(gè)和1 664 770個(gè),其中編碼區(qū)的InDel數(shù)量分別為1 019個(gè)和2 515個(gè),具體結(jié)果見(jiàn)表2。通過(guò)進(jìn)一步比較分析,G29和G108之間的全基因組范圍內(nèi) InDel數(shù)量為1 586 427個(gè)。
表1 24份供試?yán)苯贩N質(zhì)基本信息Table 1 The information of 24 tested pepper ge rmplasm
表2 全基因組和編碼區(qū)InDel位點(diǎn)信息Table 2 The information of InDel loci within the whole genome and CDS
根據(jù)預(yù)測(cè)的InDel位點(diǎn),在2號(hào)染色體上隨機(jī)選擇了40個(gè)InDel位點(diǎn)設(shè)計(jì)引物,引物信息見(jiàn)表3。以24份不同來(lái)源的辣椒材料驗(yàn)證標(biāo)記的有效性。經(jīng)過(guò)PCR和產(chǎn)物檢測(cè)發(fā)現(xiàn),40對(duì)引物在24份辣椒材料中均能擴(kuò)增出條帶,擴(kuò)增條帶的大小與預(yù)測(cè)產(chǎn)物大小基本相同。如圖1為引物InDel-2-3對(duì)24份辣椒種質(zhì)PCR擴(kuò)增結(jié)果。經(jīng)統(tǒng)計(jì),在24份材料中共擴(kuò)增出70個(gè)清晰可辨的位點(diǎn),其中35個(gè)標(biāo)記表現(xiàn)出多態(tài)性,5個(gè)無(wú)多態(tài)性,多態(tài)率達(dá)到87.5%。
利用Popgene32軟件對(duì)40對(duì)引物在24份辣椒材料中的擴(kuò)增結(jié)果進(jìn)行分析發(fā)現(xiàn),每對(duì)引物反映的基因多樣性指數(shù)范圍為 0.08~0.50,其均值為0.20;Shannon′s多樣性信息指數(shù)分布在0.17至0.80之間,其均值為0.34(表3)。
利用NTSYSpc 2.10e中的UPGMA方法對(duì)24份材料進(jìn)行聚類(lèi)分析,由聚類(lèi)結(jié)果(圖2)可以看出,在遺傳相似系數(shù)0.42處,24份辣椒種質(zhì) 分為2個(gè)大類(lèi),一類(lèi)為21份一年生辣椒,另一大類(lèi)為2份灌木狀辣椒(C.frutescens)和1份下垂辣椒(C.baccatum)。21份一年生辣椒中可以聚類(lèi)為羊角形辣椒、牛角形(長(zhǎng)燈籠形)辣椒和甜椒三大類(lèi)別。同時(shí),聚類(lèi)結(jié)果顯示牛角形(長(zhǎng)燈籠形)辣椒和甜椒相似度更高,同一單位品種間相似度高于不同單位間相似度。
表3 本研究開(kāi)發(fā)的辣椒InDel標(biāo)記信息Table 3 The information of pepper InDel markers developed in the study
圖1 引物InDel-2-3對(duì)24份辣椒種質(zhì)的擴(kuò)增結(jié)果Fig.1 Amplification of 24 pepper germplasm DNA with marker InDel-2-3
圖2 基于Nei′s遺傳距離的24份辣椒種質(zhì)的UPMGA聚類(lèi)圖Fig.2 UPGMA dendrogram of 24 pepper germplasm based on the Nei′s genetic distance
InDel標(biāo)記為共顯性標(biāo)記,具有較好的穩(wěn)定性和較為豐富的多態(tài)性。雖然在整個(gè)基因組中,其多態(tài)性頻率次于SNP標(biāo)記[24],但是,相對(duì)于SNP標(biāo)記,InDel標(biāo)記在引物設(shè)計(jì)、多態(tài)性檢測(cè)等方面更為簡(jiǎn)易,應(yīng)用也更為方便[16-17,25]。但是,目前辣椒中In-Del標(biāo)記的開(kāi)發(fā)數(shù)量較少,應(yīng)用較為有限,這一現(xiàn)狀急待改善[11]。
本研究基于全基因組重測(cè)序數(shù)據(jù),通過(guò)與參考基因組序列比對(duì),在一年生辣椒品種G29和灌木狀辣椒品種G108的全基因組范圍內(nèi)檢測(cè)到的InDel數(shù)量分別為533 523個(gè)和1 664 770個(gè)。以上結(jié)果說(shuō)明利用全基因組重測(cè)序技術(shù)可以在辣椒中更好地挖掘InDel位點(diǎn),為全基因組范圍內(nèi)的InDel設(shè)計(jì)提供了更優(yōu)選擇。這一觀點(diǎn)已經(jīng)在包括辣椒在內(nèi)的多個(gè)物種中得以驗(yàn)證[12,26-27]。
利用24份辣椒材料對(duì)2號(hào)染色體上的40個(gè)標(biāo)記的有效性進(jìn)行驗(yàn)證,發(fā)現(xiàn)24份材料在40個(gè)標(biāo)記中共擴(kuò)增出70個(gè)清晰可辨的位點(diǎn),其中35個(gè)標(biāo)記表現(xiàn)出多態(tài)性,多態(tài)率達(dá)到87.5%。這一結(jié)果很好地驗(yàn)證了本研究開(kāi)發(fā)出的InDel標(biāo)記的有效性和較高的多態(tài)性。目前辣椒分子標(biāo)記的開(kāi)發(fā)和應(yīng)用主要集中于利用公用數(shù)據(jù)或者基因組文庫(kù)開(kāi)發(fā)SSR標(biāo)記,但是大部分研究結(jié)果表明SSR標(biāo)記的多態(tài)性及其應(yīng)用率遠(yuǎn)低于InDel標(biāo)記。如Huang等人基于數(shù)據(jù)庫(kù)中的辣椒序列開(kāi)發(fā)出12個(gè)SSR標(biāo)記,其中多態(tài)性標(biāo)記為5個(gè),多態(tài)率為41.7%[5];Lee等構(gòu)建辣椒分子遺傳連鎖圖譜時(shí)開(kāi)發(fā)出76個(gè)SSR標(biāo)記,其中具有多態(tài)性的標(biāo)記為46個(gè),多態(tài)率為60.5%[4];Yi等開(kāi)發(fā)出1 201個(gè)EST-SSR標(biāo)記,其多態(tài)性標(biāo)記只有150個(gè),多態(tài)率僅為29.2%[6];Huang等依據(jù)EST序列開(kāi)發(fā)出SSR標(biāo)記755個(gè),利用8份辣椒栽培種對(duì)其中的210個(gè)進(jìn)行驗(yàn)證,其多態(tài)性標(biāo)記為127個(gè),多態(tài)率為60.5%[8];Shirasawa等基于辣椒EST序列設(shè)計(jì)了5 751個(gè)SSR標(biāo)記,利用辣椒材料對(duì)其中77個(gè)進(jìn)行驗(yàn)證,其中60個(gè)表現(xiàn)出多態(tài)性,多態(tài)率為77.9%[7]。但是,也有少數(shù)研究結(jié)果顯示,InDel標(biāo)記與SSR標(biāo)記的多態(tài)率并無(wú)明顯差異。Li等利用InDel標(biāo)記構(gòu)建辣椒種內(nèi)遺傳圖譜時(shí)顯示,1 000個(gè)InDel標(biāo)記中251個(gè)標(biāo)記可以成功應(yīng)用于圖譜構(gòu)建,其多態(tài)率為25.1%[11]。隨后,該團(tuán)隊(duì)(2015年)基于SSR和InDel標(biāo)記構(gòu)建辣椒種間遺傳圖譜時(shí),分別篩選了1 038個(gè)InDel標(biāo)記和674個(gè)SSR標(biāo)記,其中多態(tài)性標(biāo)記分別為140個(gè)和102個(gè),多態(tài)率分別為13.5%和15.1%[12]。
利用NTSYSpc 2.10e中的UPGMA方法對(duì)24份材料進(jìn)行聚類(lèi)分析,結(jié)果表明35個(gè)InDel標(biāo)記不僅可以有效區(qū)分出21份一年生辣椒、2份灌木狀辣椒和1份下垂辣椒,而且21份材料中又可以聚類(lèi)為不同種類(lèi),其聚類(lèi)結(jié)果與表型特征非常吻合。這一結(jié)果表明InDel標(biāo)記在種質(zhì)資源的遺傳分析、品種鑒定和品種保護(hù)方面具有極大的應(yīng)用價(jià)值。但同一單位育成品種的相似度很高,說(shuō)明可利用的辣椒種質(zhì)的遺傳背景較窄,對(duì)于品種改良極為不利,需要開(kāi)發(fā)和應(yīng)用新的種質(zhì)進(jìn)行品種的選育和改良。
總的來(lái)說(shuō),基于全基因組重測(cè)序數(shù)據(jù)開(kāi)發(fā)InDel標(biāo)記可以有效地應(yīng)用于辣椒種質(zhì)鑒定,遺傳圖譜的構(gòu)建,關(guān)聯(lián)分析和基因定位等方面,是辣椒種質(zhì)資源開(kāi)發(fā)利用和分子標(biāo)記輔助育種的高效工具。
[1] 王述彬,刁衛(wèi)平,劉金兵,等.辣椒胞質(zhì)雄性不育相關(guān)基因的克隆及表達(dá)[J].江蘇農(nóng)業(yè)學(xué)報(bào),2014,30(4):833-838.
[2] 徐婉莉,裴徐梨,荊贊革,等.辣椒actin基因電子克隆與生物信息學(xué)分析[J].江蘇農(nóng)業(yè)科學(xué),2014,42(5):46-48.
[3] RAMCHIARY N,KEHIE M,BRAHMA V,et al.Application of genetics and genomics towards Capsicum translational research[J].Plant Biotechnology Reports,2014,8(2):101-123.
[4] LEE J M,NAHM S H,KIM Y M,et al.Characterization and molecular genetic mapping of microsatellite loci in pepper[J].Theoretical and Applied Genetics,2004,108(4):619-627.
[5] HUANG S W,ZHANG B X,MILBOURNE D,et al.Development of pepper SSR markers from sequence databases[J].Euphytica,117,2(2001):163-167.
[6] YI G,LEE J M,LEE S,et al.Exploitation of pepper EST-SSRs and an SSR-based linkage map[J].Theoretical and Applied Genetics,2006,114(1):113-130.
[7] SHIRASAWA K,ISHII K,KIM C,et al.Development of Capsicum EST-SSR markers for species identification and in silico mapping onto the tomato genome sequence[J].Molecular Breeding,2013,31(1):101-110.
[8] HUANG H H,ZHANG Z H,ZHANG Z H,et al.Analysis of SSRs information in Capsicum spp.from EST database[J].Agricultural Sciences in China,2011,10(10):1532-1536.
[9] QIN C,YU C,SHEN Y,et al.Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J].Proceedings of the National Academy of Sciences,2014,111(14):5135-5140.
[10]KIM S,PARK M,YEOM S I,et al.Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J].Nature Genetics,2014,46(3):270-278.
[11]LI W,CHENG J,WU Z,et al.An InDel-based linkage map of hot pepper(Capsicum annuum)[J].Molecular Breeding,2015,35(1):219-319.
[12]TAN S,CHENG J W,ZHANG L,et al.Construction of an interspecific genetic map based on InDel and SSR for mapping the QTLs affecting the initiation of flower primordia in pepper(Capsicum spp.)[J].Plos One,2015,10(3):1-15.
[13]LU F H,KWON S W,YOON M Y,et al.SNP marker integration and QTL analysis of 12 agronomic and morphological traits in F^sub 8^RILs of pepper(Capsicum annuum L.)[J].Molecules and Cells,2012,34(1):25-34.
[14]LIU W Y,KANG J H,JEONG H S,et al.Combined use of bulked segregant analysis and microarrays reveals SNP markers pinpointing a major QTL for resistance to Phytophthora capsici in pepper[J].Theoretical and Applied Genetics,2014,127(11): 2503-2513.
[15]JANDER G,NORRIS S R,ROUNSLEY S D,et al.Arabidopsis map-based cloning in the post-genome era[J].Plant Physiology,2002,129(2):440-450.
[16]V?LIü,BRANDSTR?M M,JOHANSSON M,et al.Insertion-deletion polymorphisms(indels)as genetic markers in natural populations[J].BMC Genet,2008,9(1):1-8.
[17]VARSHNEY R.Gene-based marker systems in plants:high throughput approaches for marker discovery and genotyping[M].New York:Springer Netherlands,2009.
[18]HAYDEN M J,TABONE T,MATHER D E.Development and assessment of simple PCR markers for SNP genotyping in barley[J].Theoretical and Applied Genetics,2009,119(5):939-951.
[19]SHEDLOCK A M,OKADA N.SINE insertions:powerful tools for molecular systematics,Bioessays[J].2000,22(2):148-160.
[20]MILLS E R,LUTTIG T C,LARKINS E C,et al.An initial map of insertion and deletion(INDEL)variation in the human genome[J].Gemome Research,2006,16:1182-1190.
[21]MCKENNA A,HANNA M,BANKS E,et al.The genome analysis toolkit:A map reduce framework for analyzing next-generation DNA sequencing data[J].Genome Research,2010,20(9): 1297-1303.
[22]LI H,HANDSAKER B,WYSOKER A,et al.The sequence alignment/map format and SAMtools[J].Bioinformatics,2009,25(16):2078-2079.
[23]ZHANG X,WANG L,SHOU L.Modified CTAB method for extracting genomic DNA from wheat leaf[J].Agricultural Science&Technology,2013,14(7):946-949.
[24]BROOKES A J.The essence of SNPs[J].Gene,1999,234 (2):177-186.
[25]CHUNG W H,ISHII H,NISHIMURA K,et al.Genetic analysis and PCR-based identification of major Fusarium species causing head blight on wheat in Japan[J].Journal of General Plant Pathology:JGPP,2008,74(5):364-374.
[26]PǎCURAR D I,PǎCURAR M L,STREET N,et al.A collection of INDEL markers for map-based cloning in seven Arabidopsis accessions[J].Journal of Experimental Botany,2012,63(7): 2491-2501.
[27]LIU B,WANG Y,ZHAI W,et al.Development of InDel markers for Brassica rapa based on whole-genome re-sequencing[J].Theoretical and Applied Genetics,2013,126(1):231-239.