李喜蓮,楊元杰,李 飛,顧志敏,郭建林,張宇飛,賈永義,黃鮮明(農(nóng)業(yè)部淡水漁業(yè)健康養(yǎng)殖重點實驗室,浙江省淡水水產(chǎn)遺傳育種重點實驗室,浙江省淡水水產(chǎn)研究所,浙江 湖州 313001)
?
日本沼蝦EST-SNP的篩選及多態(tài)性檢測
李喜蓮,楊元杰,李飛,顧志敏*,郭建林,張宇飛,賈永義,黃鮮明
(農(nóng)業(yè)部淡水漁業(yè)健康養(yǎng)殖重點實驗室,浙江省淡水水產(chǎn)遺傳育種重點實驗室,浙江省淡水水產(chǎn)研究所,浙江湖州313001)
摘要:利用EST數(shù)據(jù)庫開發(fā)SNP是篩選SNP標記的重要途徑。本研究利用日本沼蝦現(xiàn)有EST數(shù)據(jù)開發(fā)SNP標記—從NCBI獲得8 458條EST序列;Seqclean軟件去除序列中的載體、引物和接頭等污染序列,得到8 453條EST序列;利用Quality SNP軟件對預(yù)處理后序列中含有4條以上同源序列重疊群進行分析,在含有4條以上同源序列的1 055個重疊群中,篩選得到可靠SNP(Reliable SNPs)位點705個,較可信SNPs(High confidence SNPs)905個,潛在SNPs(Potential SNPs)1 144個。根據(jù)候選SNP位點設(shè)計28對引物,通過聚丙烯酰胺凝膠電泳分析,基因分型驗證44個太湖個體,13對引物具有二等位基因多態(tài)性,觀測雜合度和期望雜合度范圍分別為0.259~0.745和0.255~ 0.728。結(jié)果表明,EST數(shù)據(jù)庫中存在大量SNP位點,篩選的SNP標記可用于日本沼蝦遺傳學分析。
關(guān)鍵詞:日本沼蝦;單核苷酸多態(tài)性(SNP);表達序列標簽(EST)
李喜蓮,楊元杰,李飛,等.日本沼蝦EST-SNP的篩選及多態(tài)性檢測[J].東北農(nóng)業(yè)大學學報, 2016, 47(2): 67-73.
Li Xilian, Yang Yuanjie, Li Fei, et al. Development of single nucleotide polymorphism markers for Macrobrachium nipponensis using expressed sequence tags[J]. Journal of Northeast Agricultural University, 2016, 47(2): 67-73. (in Chinese with English abstract)
日本沼蝦(Macrobrachium nipponense),俗稱青蝦、河蝦,隸屬節(jié)肢動物門、甲殼綱、十足目、長臂蝦科、沼蝦屬。淡水蝦類分布于日本和中國,但日本沼蝦群體存在性早熟情況,當年繁殖蝦苗養(yǎng)殖1~2個月后便有個體抱卵繁殖,導(dǎo)致養(yǎng)殖池塘內(nèi)不同世代混雜,遺傳背景復(fù)雜,對日本沼蝦遺傳育種工作及蝦苗繁育造成影響,因此日本沼蝦發(fā)育的遺傳背景研究具有重要意義。
郭闖等利用ISSR標記技術(shù)分析長江和太湖兩地區(qū)日本沼蝦遺傳多樣性[1]。馮建彬等對日本沼蝦生長性狀相關(guān)的微衛(wèi)星標記進行篩選[2]。Ma等開發(fā)日本沼蝦的24個微衛(wèi)星引物[3],檢測60個洪澤湖個體。馮建彬等采用(CT)15、(CA)15兩種生物素標記及磁珠富集法構(gòu)建太湖日本沼蝦基因組微衛(wèi)星富集文庫[4]。趙燕等通過ISSR-PCR法篩選日本沼蝦的微衛(wèi)星標記[5],分離到27個多態(tài)性微衛(wèi)星位點。目前,已報道日本沼蝦中有95對微衛(wèi)星標記。但隨著日本沼蝦遺傳多樣性研究的深入,日本沼蝦分子標記日益受到關(guān)注。相比微衛(wèi)星,SNP標記具有穩(wěn)定性高和易于自動化分析等優(yōu)點。張洪偉采用產(chǎn)物直接測序法[6],分析日本沼蝦rDNA基因內(nèi)轉(zhuǎn)錄間隔區(qū)ITSI的DNA序列,通過序列比對,篩選青蝦SNP位點。
作為第三代的遺傳標記,單核苷酸多態(tài)性(SNP)具有數(shù)量多、密度大、分布廣、突變率低等特點[7],廣泛應(yīng)用于動植物遺傳多樣性分析、遺傳育種、遺傳連鎖圖譜構(gòu)建、基因與性狀關(guān)聯(lián)分析、分子輔助育種等方面[8-9]。表達序列標簽(EST)數(shù)據(jù)庫發(fā)掘是目前SNP篩選重要途徑[10]。EST-SNP用于數(shù)量性狀位點(QTL)研究可直接將目標性狀定位到相關(guān)基因,有利于性狀遺傳解析[11-12]。SNP分子標記已在魚[13-14]、蝦[15-16]、蟹[17]、貝[18-19]等水產(chǎn)動物中得到廣泛應(yīng)用,但有關(guān)日本沼蝦EST-SNP研究未見報道。
前人對日本沼蝦遺傳標記(如SSR)集中在自行開發(fā),對日本沼蝦SNP篩選則僅研究某一特定基因SNP。本試驗EST數(shù)據(jù)來源為NCBI數(shù)據(jù)庫中現(xiàn)有已公布的EST序列,通過生物信息學方法篩選SNP位點,挑選出部分SNP位點,設(shè)計引物并在太湖野生群體中驗證,估算其主要遺傳參數(shù)。為SNP在日本沼蝦遺傳學研究及遺傳育種中的應(yīng)用提供技術(shù)支持,也為日本沼蝦的遺傳圖譜構(gòu)建、基因與性狀的關(guān)聯(lián)分析、重要性狀QTL定位及分子輔助育種奠定基礎(chǔ)。
1.1序列下載與預(yù)處理
在NCBI的EST核酸數(shù)據(jù)庫(http://www.ncbi.nlm. nih.gov/projects/dbEST)下載8 458條日本沼蝦(Macrobrachium nipponensis)序列(截止到2014年12月1日)。下載NCBI univce數(shù)據(jù)庫(http://www.ncbi.nlm. nih.gov/tools/vecscr-een/univec/),Seqclean(https://sourc eforge.net/projects/seqclean/)軟件去除序列中的載體、引物和接頭等污染序列。
1.2 EST-SNP位點的查找和引物設(shè)計
采用軟件Cap 3[20]對預(yù)處理后日本沼蝦EST進行序列拼接,利用軟件Quality SNP[21]在含有4條以上EST拼接重疊群(contig)中搜尋SNP位點,取重疊區(qū)出現(xiàn)兩次以上的SNP作為候選位點設(shè)計引物。利用軟件Primer Premier 5.0(Premier Bio soft International,Palo Alto,CA)設(shè)計引物。引物序列見表1。
1.3 SNP驗證
SNP引物篩選用日本沼蝦樣本采自浙江省湖州市吳興區(qū)太湖水域。采用苯酚/氯仿法提取日本沼蝦尾部肌肉組織總基因組DNA,測定OD值,經(jīng)瓊脂糖凝膠電泳檢測后確定純度和濃度,-20℃保存?zhèn)溆谩?/p>
PCR反應(yīng)在Bio-Rad DNA Engine Dyad PCR儀上進行。反應(yīng)體系為:DNA模板10~40 ng,ddH2O 6.60 μL,10×Buffer 1.0 μL,Mg2 +(25 mmol·L-1)0.7 μL,dNTP(10 mmol·L-1)0.2 μL,primers(10 mmol·μL-1)各0.2 μL,Taq酶0.5 U。擴增程序為:94℃預(yù)變性3 min,94℃變性30 s,最適退火溫度下退火30 s,72℃延伸30 s,共30個循環(huán),最后72℃再延伸10 min,4℃保溫。PCR反應(yīng)產(chǎn)物用8%非變性聚丙烯酰胺凝膠電泳檢測。
表1引物序列及PCR反應(yīng)中退火溫度Table 1 Primers and annealing temperatures of PCR
利用軟件Popgene3.2進行群體遺傳分析,計算觀測雜合度(Observed heterozygosity,Ho)和期望雜合度(Expected heterozygosity,He)。
2.1 EST的拼接
預(yù)處理后日本沼蝦共有8 453條可用EST序列。Cap3拼接得到1 055條重疊群,4 406條單一序列;2~3條EST組成的重疊群800個;4~5條EST組成的重疊群129個;6~10條EST組成的重疊群84個;11~20條EST組成的重疊群28個;20條以上EST組成的重疊群14個。4條及4條以上EST組成的重疊群共255條,占總數(shù)24.17%,未參加拼接的EST序列占75.83%;這255個重疊群共包括114 124個堿基,從中篩選到SNP位點2 754個,SNP平均頻率為41.44 bp。
2.2日本沼蝦EST數(shù)據(jù)庫SNP數(shù)量和特征
分析獲得含有SNP的重疊群為114個,其中轉(zhuǎn)換424個(C/T之間的轉(zhuǎn)換207個,A/G之間的轉(zhuǎn)換217個),顛換481個(A/T之間的顛換177個,A/C之間的顛換127個,T/G之間的顛換116個,C/G之間的顛換61個),插入突變239個。
表2日本沼蝦EST數(shù)據(jù)庫中SNP數(shù)量和特征Table 2 Summary of EST-SNPs from Macrobrachium nipponense
2.3 EST拼接結(jié)果及SNP分布
Quality SNP軟件對SNP分類包括:可靠SNPs (Reliable SNPs)、較可信SNPs(High confidence SNPs)、潛在SNPs(Potential SNPs)[14]。Quality SNP
從Cap3的拼接結(jié)果中篩選SNP,含有SNP重疊群114;705個可靠SNPs,905個較可信SNPs,1 144個潛在SNPs。
8 453條日本沼蝦EST拼接結(jié)果及各重疊群包含的SNP數(shù)量見網(wǎng)址http://www.macrobrachiumnip ponensis.org/。
表3日本沼蝦EST-SNP的分布Table 3 Distribution of EST-SNPs from Macrobrachium nipponense
續(xù)表
2.4候選SNP位點基因分型及利用
Quality SNP在含有4條以上序列的重疊群中共發(fā)現(xiàn)可靠SNP位點705個,較可信SNPs 905個,潛在SNPs 1 144個。根據(jù)SNP位點分布頻率和側(cè)翼序列質(zhì)量,利用Primer Premier 5.0設(shè)計引物28組,通過聚丙烯酰胺凝膠電泳分析,在44個太湖個體中進行基因分型驗證,其中8組引物(29%)無擴增產(chǎn)物,7組引物(25%)無多態(tài)性,13組(46%)引物具有二等位基因多態(tài)性(見表4)。觀測雜合度和期望雜合度范圍分別為0.4966~0.7453和0.2547~0.5034。
表4日本沼蝦單核苷酸多態(tài)性標記Table 4 SNP markers for Macrobrachium nipponense
性早熟、規(guī)格變小、商品率降低、抗病能力下降等品種退化現(xiàn)象[22]嚴重影響日本沼蝦養(yǎng)殖效益。開發(fā)日本沼蝦的分子標記是資源保護和遺傳選育基礎(chǔ)。本研究利用日本沼蝦現(xiàn)有EST數(shù)據(jù)篩選出SNP標記大量的SNP位點,分析SNP位點的數(shù)量、特征分布以及基因分型,結(jié)果表明,篩選SNP標記可用于日本沼蝦遺傳學分析。
SNP是在一個物種的個體之間最為常見的信息豐富的遺傳改變。公共數(shù)據(jù)庫中,SNP數(shù)目已超過160萬[23]。在人類DNA 30億對堿基中,平均每300~ 1 000個堿基對就有1個SNP發(fā)生[24];玉米基因組中每104 bp中含有1個SNP[25]。在水產(chǎn)動物中,Wang等對鯰魚的EST重疊群研究發(fā)現(xiàn)每100 bp存在1個SNP[26],海灣扇貝EST重疊群研究發(fā)現(xiàn)每118.2 bp存在1個SNP[27],文蛤[28]則為每156 bp存在1個SNP,長牡蠣[29]基因組中約每40 bp存在1個SNP位點,叉尾鮰[30]每76.9個堿基對中存在1個SNP發(fā)生。目前對蝦類SNP研究相對較少,本研究中含有SNP的118個重疊群共包含119 653個堿基,包含1 144個潛在SNP位點,即每104個堿基對中含有一個SNP發(fā)生,說明SNP在日本沼蝦EST序列中的分布頻率較高,SNP分布頻率在不同物種間差異顯著。
點突變在DNA序列進化中有重要作用,任何堿基突變不論是插入、缺失還是位點上的突變均非隨機產(chǎn)生[31-32],Maier等研究表明基因組中CpG二核苷酸上的胞嘧啶(C)因可自發(fā)脫去氨基形成胸腺嘧啶(T)而成為基因中最易發(fā)生突變的位點[33],因此C/T堿基轉(zhuǎn)化較A/G轉(zhuǎn)換概率更高。本研究結(jié)果表明日本沼蝦堿基的轉(zhuǎn)換中以A/G(217)為主,而非C/T,與櫛孔扇貝[34]、長牡蠣[35]、紫貽貝[19]等結(jié)果存在差異性。在位點突變中,假設(shè)轉(zhuǎn)換和顛換的發(fā)生頻率相同,則轉(zhuǎn)換與顛換的比值(Ts/Tv)應(yīng)為0.5,但該比值往往高于0.5。本研究篩選SNP中,Ts/Tv為0.88,原因是受到多重替換和飽和效應(yīng)影響。
本研究對日本沼蝦現(xiàn)有EST數(shù)據(jù)進行SNP篩查和SNP驗證分型,開發(fā)13個EST-SNP標記。結(jié)果表明,基于EST數(shù)據(jù)庫開發(fā)SNP技術(shù),可有解決補蝦類生物因基因組學滯后影響SNP標記開發(fā)問題。日本沼蝦遺傳標記研究可考慮采用新一代測序技術(shù),測定不同性別或性腺發(fā)育狀態(tài)的轉(zhuǎn)錄組,整合已有數(shù)據(jù),通過生物信息學方法與試驗驗證結(jié)合,獲得與特定性狀相關(guān)的基因或遺傳標記,為研究日本沼蝦性早熟現(xiàn)象成因提供理論基礎(chǔ)。
[參考文獻]
[ 1 ]郭闖,韓曉磊,蓋建軍,等.江蘇省兩個日本沼蝦群體的遺傳多樣性ISSR分析[J].金陵科技學院學報, 2010(3): 85-89.
[ 2 ]馮建彬,馬克異,李家樂,等.日本沼蝦微衛(wèi)星引物篩選及群體遺傳多樣性分析[J].水產(chǎn)學報, 2010(5): 688-695.
[ 3 ] Ma K Y, Feng J B, Li J L, et al. Twenty-four novel polymorphic microsatellite markers from oriental river prawn (Macrobrachium nipponense)[J]. Conservation Genetics Resources, 2010, 2(1): 125-128.
[ 4 ]馮建彬,吳春林,丁懷宇,等.洪澤湖日本沼蝦9個野生群體遺傳多樣性微衛(wèi)星分析[J].中國水產(chǎn)科學, 2010(2): 218-227.
[ 5 ]趙燕.日本沼蝦微衛(wèi)星標記開發(fā)、遺傳結(jié)構(gòu)分析及性別相關(guān)遺傳標記篩選研究[D].泰安:山東農(nóng)業(yè)大學, 2014.
[ 6 ]張洪偉,傅洪拓,吳滟,等.日本沼蝦ITS1序列分析及SNPs位點的篩選[J].水生生物學報, 2010(1): 72-77.
[ 7 ] Vignal A, Milan D, Sancristobal M, et al. A review on SNP and other types of molecular markers and their use in animal genetics [J]. Genetics Selection Evolution, 2002, 34(3): 275-306.
[ 8 ] Nielsen R, Paul J S, Albrechtsen A, et al. Genotype and SNP calling from next-generation sequencing data[J]. Nature Reviews Genetics, 2011, 12(6): 443-451.
[ 9 ] Jombart T, Ahmed I. Adegenet 1.3-1: new tools for the analysis of genome-wide SNP data[J]. Bioinformatics, 2011, 27(21): 3070-3071.
[10]王紹宗,李莉,亓海剛,等.長牡蠣(Crassostrea gigas)17個EST-SNP標記的開發(fā)[J].海洋與湖沼, 2010(2): 274-281.
[11]劉列釗,李加納.利用甘藍型油菜高密度SNP遺傳圖譜定位油酸、亞麻酸及芥酸含量QTL位點[J].中國農(nóng)業(yè)科學, 2014(1): 24-32.
[12] Kifuji Y, Hanzawa H, Terasawa Y, et al. QTL analysis of black rot resistance in cabbage using newly developed EST-SNP markers [J]. Euphytica, 2013, 190(2): 289-295.
[13]鄒剛剛,陳永久,吳常文. SNP及其在魚類養(yǎng)殖中的應(yīng)用[J].浙江海洋學院學報:自然科學版, 2013, 31(5): 447-453.
[14]張曉峰,楊晶,孫效文.基于EST序列的鯉魚生長相關(guān)SNP發(fā)掘[J].水產(chǎn)學雜志, 2009, 22(4): 1-7.
[15] Glenn K L, Grapes L, Suwanasopee T, et al. SNP analysis of AMY2 and CTSL genes in Litopenaeus vannamei and Penaeus monodon shrimp[J]. Animal Genetics, 2005, 36(3): 235-236.
[16] Yu M, Cheng Y, Rothschild M F. SNP analysis of Molting related genes in Penaeus monodon and Litopenaeus vannamei shrimp (Brief report)[J]. Archiv Fur Tierzucht, 2006, 49(4): 411.
[17]馬群群.擬穴青蟹SNP和SSR標記開發(fā)及系譜認證技術(shù)的建立研究[D].上海:上海海洋大學, 2012.
[18]溫海洋.馬氏珠母貝SNP標記開發(fā)與其生長性狀的關(guān)聯(lián)分析[D].???海南大學, 2014.
[19]李宏俊,梁瑜,邢坤,等.紫貽貝EST-SNP的篩選及多態(tài)性檢測[J].水產(chǎn)學報, 2011(3): 348-355.
[20] Huang X, Madan A. CAP3: A DNA sequence assembly program [J]. Genome Research, 1999, 9(9): 868-877.
[21] Tang J, Vosman B, Voorrips R E, et al. QualitySNP: a pipeline for detecting single nucleotide polymorphisms and insertions/ deletions in EST data from diploid and polyploid species[J]. BMC Bioinformatics, 2006, 7(1): 438.
[22]傅洪拓,龔永生,吳滟,等.日本沼蝦與海南沼蝦的人工種間雜交及其同工酶分析[J].水生生物學報, 2004(3): 327-329.
[23] Lagarde A E. DNA Microarrays: A Molecular Cloning Manual.[J]. American Journal of Human Genetics, 2003, 73(1): 218-219.
[24] Brookes A J. The essence of SNPs[J]. Gene, 1999, 234(2): 177-186.
[25] Shi H, Maier S, Nimmrich I, et al. Oligonucleotide-based microarray for DNA methylation analysis: Principles and applications [J]. Journal of Cellular Biochemistry, 2003, 88(1): 138-143.
[26] Wang S, Sha Z, Sonstegard T S, et al. Quality assessment parameters for EST-derived SNPs from catfish[J]. BMC Genomics, 2008, 9(1): 450.
[27] Li R, Li Q, Kong L. Characterization of expressed sequence tag-derived single-nucleotide polymorphisms in the bay scallop Argopecten irradians irradians[J]. Fisheries Science, 2009, 75(6): 1389-1400.
[28] Li H, Zhu D, Gao X, et al. Mining single nucleotide polymorphisms from EST data of hard clam Meretrix meretrix[J]. Conservation Genetics Resources, 2010, 2(1): 69-72.
[29] Curole J P, Hedgecock D. Estimation of preferential pairing rates in second-generation autotetraploid pacific oysters (Crassostrea gigas)[J]. Genetics, 2005, 171(2): 855-859.
[30] He X, Zhang Y, Yu Z. In silico cloning, expression of Rieske-like apoprotein gene and protein subcellular localization in the Pacific oyster, Crassostrea gigas[J]. Molecular Biology Reports, 2010, 37 (7): 3259-3264.
[31] Yamane K, Yano K, Kawahara T. Pattern and rate of indel evolution inferred from whole chloroplast intergenic regions in sugarcane, maize and rice[J]. DNA Research, 2006, 13(5): 197-204.
[32] Morton B R. Neighboring base composition and transversion/ transition bias in a comparison of rice and maize chloroplast noncoding regions[J]. Proceedings of the National Academy of Sciences, 1995, 92(21): 9717-9721.
[33] Shi H, Maier S, Nimmrich I, et al. Oligonucleotide-based microarray for DNA methylation analysis: principles and applications [J]. J Cell Biochem, 2003, 88(1): 138-143.
[34]李紀勤,包振民,李玲,等.櫛孔扇貝EST-SNP標記開發(fā)及多態(tài)性分析[J].中國海洋大學學報:自然科學版, 2013(1): 56-63.
[35] Sauvage C, Bierne N, Lapegue S, et al. Single nucleotide polymorphisms and their relationship to codon usage bias in the Pacific oyster Crassostrea gigas[J]. Gene, 2007, 406(1): 13-22.
[36] Yang Z, Yoder A D. Estimation of the transition/transversion rate bias and species sampling[J]. Journal of Molecular Evolution, 1999, 48(3): 274-283.
[37]呂雪梅,王應(yīng)祥,張亞平.蜂猴線粒體細胞色素b基因變異特點及系統(tǒng)發(fā)育分析[J].動物學研究, 2001(2): 93-98.
Development of single nucleotide polymorphism markers for Macrobrachium nipponensis using expressed sequence tags
LI Xilian, YANG Yuanjie, LI Fei, GU Zhimin, GUO Jianlin, ZHANG Yufei, JIA Yongyi, HUANG Xianming(Agriculture Ministry Key Laboratory of Healthy Freshwater Aquaculture, Key Laboratory of Freshwater Aquatic Animal Genetic and Breeding of Zhejiang province, Zhejiang Institute of Freshwater Fisheries, Huzhou Zhejiang 313001, China)
Abstract:Using the EST database is an important approach to screen SNP markers. In present study, we obtained 8 453 EST sequences of Macrobrachium nipponensis from the GenBank after removed carriers, primers and vector sequences using Seqclean. The pre-treatment sequences contained four or more ESTs were analized by Quality SNP. Those EST sequences were clustered into contigs, of which 1 055 contained 4 or more ESTs. 705 Reliable SNPs,905 High confidence SNPs and 1 144 Potential SNPs were detected from 1 055 contigs.28 of the putative SNPs were chosen for validation by allele specific PCR with SDS-PAGE with 44 individuals from Tai Lake population, and 13 of them were polymorphic with the minor allele frequency. The observed heterozygosity and expectedbook=68,ebook=73heterozygosity were distributed from 0.259 to 0.745 and 0.255 to 0.728.The result showed that there were a large numbers of candidate SNPs from public EST data, and EST-SNPs could be development in an efficient way for molecular genetic analysis of Macrobrachiumnipponensis.
Key words:Macrobrachium nipponensis; single nucleotide polymorphism(SNP); expressed sequence tags(EST)
*通訊作者:顧志敏,研究員,研究方向為水產(chǎn)動物新品種選育。E-mail: guzhimin2006@163. com
作者簡介:李喜蓮(1981-),女,助理研究員,博士,研究方向為水生生物遺傳育種學和生物信息學。E-mail: lixilian@126. com
基金項目:浙江省重大科技專項重大農(nóng)業(yè)項目(2012C12907);浙江省公益技術(shù)研究農(nóng)業(yè)項目(2014C32066);浙江省省屬科研院所扶持專項計劃項目(2014F10037);浙江省條件建設(shè)項目(2013F10047);浙江省淡水水產(chǎn)研究所項目(ZJS2014-3)
收稿日期:2015-04-10
中圖分類號:S154.1;S567.5+1
文獻標志碼:A
文章編號:1005-9369(2016)02-0067-07