葛辰等
摘要:大鱗副泥鰍是鰍科重要經(jīng)濟魚類,通過Illumina HiSeq 2000測序平臺對2個大鱗副泥鰍樣本的轉(zhuǎn)錄本進行了高通量測序,其中AB2011M-1是群體中生長較快的10尾魚的混合轉(zhuǎn)錄本,AB2011M-2是生長較慢的10尾魚的混合轉(zhuǎn)錄本。通過對以上2個混合轉(zhuǎn)錄本的測序,分別獲得了65 536和80 786個單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)突變;對2個測序樣本進行表達差異的比較,獲得了39個表達差異基因。隨機選取120個位點設(shè)計引物,進行驗證分析,共獲得16個有效的多態(tài)性標記。
關(guān)鍵詞:大鱗副泥鰍;高通量測序;SNP;多態(tài)性標記;引物設(shè)計
中圖分類號: S917.4文獻標志碼: A文章編號:1002-1302(2014)10-0021-07
主要從事魚類遺傳育種與保護生物學(xué)研究。E-mail:lingqf@suda.edu.cn。大鱗副泥鰍(Paramisgurnus dabryanus)屬鯉形目鰍科花鰍亞科副泥鰍屬,別稱板鰍、黃板鰍,是一種底棲雜食性淡水魚類,主要分布于東亞地區(qū)。大鱗副泥鰍的肉質(zhì)鮮美、營養(yǎng)豐富[1],近幾年來,其市場需求量不斷增大,已成為我國重要的水產(chǎn)養(yǎng)殖物種[2]。
育種是應(yīng)用各種遺傳學(xué)方法,改造生物的遺傳結(jié)構(gòu),實現(xiàn)培育出高產(chǎn)優(yōu)質(zhì)品種的目標[3]。通過傳統(tǒng)育種方法獲得一個新品種需要經(jīng)過5代以上人工選擇[4],因此,利用傳統(tǒng)的育種方法獲得優(yōu)良品系需要投入大量的時間、人工和資源;且育種操作多憑經(jīng)驗來控制選擇手段,影響因素較多,不能快速滿足當前漁業(yè)發(fā)展對水產(chǎn)良種的需要。
隨著分子生物學(xué)的發(fā)展,分子標記輔助育種(molecular assisted selection,MAS)技術(shù)已日趨成熟。最早應(yīng)用于MAS育種的分子標記有限制性片段長度多態(tài)性(restriction fragment length polymorphism,RFLP)、隨機擴增多態(tài) DNA (random amplified polymorphic DNA,RAPD)[5]、擴增片段長度多態(tài)性(amplified fragment length polymorphism,AFLP)[6]等標記方法。近年來,簡單重復(fù)序列(Simple Sequence Repeat,SSR)和單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)也被應(yīng)用于MAS育種[6-7]。其中,SNP作為新興的分子標記,擁有數(shù)目多、分布廣、遺傳穩(wěn)定等優(yōu)點而廣泛受到關(guān)注。
篩選未知或已知SNP的方法有等位基因特異寡核苷酸片段分析(allele-specific oligonucleotide,ASO)[8]、基因芯片技術(shù)(gene chips)[9]、探針技術(shù)(TaqMan)[10]、AFLP[11]、變性梯度凝膠電泳(denatured gradient gel electrophoresis,DGGE)、單鏈構(gòu)想多態(tài)性(single strand conformation polymorphism,SSCP)[12]、直接測序等方法。這些方法各有所長,在不同的分析領(lǐng)域得到了廣泛的應(yīng)用。其中,最快捷、開發(fā)量最大的是高通量測序方法,該方法通過不同個體的同一DNA片段的直接測序以及序列比對,使SNP突變的檢出率可達100%,且可以直接得到突變堿基的類型及其準確位置等 SNPs 分型的參數(shù)[13-14]。
在水產(chǎn)動物中,鯉[15]、草魚[16]、大口黑鱸[17]、櫛孔扇貝[18]等均已有SNP的研究報道,但迄今為止,尚未見到通過高通量測序批量開發(fā)大鱗副泥鰍SNP的研究報道。本研究旨在開發(fā)與生長差異相關(guān)的多態(tài)性SNP標記,為大鱗副泥鰍的分子育種奠定理論基礎(chǔ)和實踐方法。
1材料與方法
1.1試驗材料
2011年,以400組洪澤湖野生大鱗副泥鰍為親本,進行人工繁殖,獲得1個混合選育群體。2012年10月,隨機采樣200尾子代,測量體寬、體長、全長、周長、體厚和體重等性狀指標,然后選取生長顯著快速的10尾魚[體質(zhì)量(11.02±103) g]和顯著緩慢的10尾魚[體質(zhì)量(2.25±0.36) g],分別標志為混合樣本AB2011M-1和AB2011M-2。分別提取以上2組試驗魚的肌肉組織,于RNA樣本保存液 (D311A,TaKaRa) 中4 ℃保存?zhèn)溆谩?/p>
1.2RNA的提取與轉(zhuǎn)錄組文庫構(gòu)建
用TRIzol 試劑對樣本肌肉組織提取總RNA,等量混合成快、慢2個轉(zhuǎn)錄組測序樣本。對cDNA庫進行片段長度的篩選,進行PCR擴增(使用Phusion DNA聚合酶,共15個循環(huán)),擴增產(chǎn)物由2%瓊脂糖電泳檢測,回收300~500 bp的cDNA片段。
1.3轉(zhuǎn)錄組測序與組裝
通過TBS-380微型熒光計的定量化測定,具有雙末端的cDNA片段在Illumina HiSeq 2000 (讀長長度為2×100 bp)平臺上進行測序。
使用SeqPre(https://github.com/jstjohn/SeqPrep) 和condetri_v2.0.pl (http://code.google.com/p/condetri/downloads/detail?name=condetri_v2.0.pl )軟件進行序列除雜。用Trinity軟件對去雜后片段進行序列組裝和拼接(http://trinityrnaseq.sourceforge.net/)。
1.4轉(zhuǎn)錄本基因注釋
使用蛋白質(zhì)非冗余數(shù)據(jù)庫(NR數(shù)據(jù)庫)中的的BlastX程序進行轉(zhuǎn)錄本的比對,E值的設(shè)定為小于1.0×10-5[19]。比對獲得的序列使用Blast 2 GO軟件進行GO(gene ontology)注釋[20],GO分類使用in-house perl scripts[21];然后使用軟件blastx/blastp 2.2.24+對序列進行KEGG(kyoto encyclopedia of genes and genomes)分析。
1.5SNP分析
將拼接好的序列作為對比模板,通過軟件Samtools (http://samtools.sourceforge.net/)和VarScan v.2.2.7(http://varscan.sourceforge.net/)將從AB2011M-1和AB2011M-2中獲得的序列信息分別與模板進行對比,得到候選SNP的信息。根據(jù)分析結(jié)果,選取差異基因所含的SNP,設(shè)計引物進行驗證。用Primer 5.0軟件設(shè)計引物,引物合成由生工生物工程(上海)股份有限公司完成。PCR擴增的反應(yīng)體系為 20 μL,包含1 μL DNA模板,10 μL 2× PCR Mix(CW2296,世紀康為),上下游引物各1 μL,7μL H2O。PCR反應(yīng)循環(huán)流程為:94 ℃預(yù)變性3 min;94 ℃變性30 s,55 ℃退火40 s,72 ℃延伸30 s,25個循環(huán);72 ℃延伸5 min。PCR產(chǎn)物首先通過2%瓊脂糖電泳進行初步篩選,具有清晰條帶的標記再通過6%聚丙烯凝膠電泳進行基因分型。在進行聚丙烯凝膠電泳前,用SSCP變性劑對產(chǎn)物進行95 ℃變性10 min,并立即冰浴處理。SSCP變性劑配方包括49 mL去離子甲酰胺、1 mL 0.5 mol/L EDTA(pH值8.0)、0.1 g溴酚藍、0.1 g二甲苯青FF。DNA分子質(zhì)量標記采用Takara公司的DL-1 000 DNA marker。
2結(jié)果與分析
2.1數(shù)據(jù)的篩選、拼接與注釋
3討論與結(jié)論
3.1測序結(jié)果注釋
在本研究中,58.56%的序列預(yù)測到ORFs,60.98%的序列在NR數(shù)據(jù)庫中得到注釋,注釋到的基因參與了大鱗副泥鰍的代謝和其他生物過程,沒有被注釋到的基因可能是此物種的特異基因,需要通過進一步的研究將這些特異基因擴充至各個數(shù)據(jù)庫中,以豐富數(shù)據(jù)庫的內(nèi)容。
3.2SNP的開發(fā)
本研究通過第二代測序技術(shù)在2個樣本中分別獲得 65 536 和80 786個SNP。由于是對轉(zhuǎn)錄本進行測序,因此,這些SNP又稱為cSNP。cSNP在轉(zhuǎn)錄區(qū)域形成的頻率遠低于非轉(zhuǎn)錄區(qū)[22],在生物進化中這是為了保護物種的穩(wěn)定性,轉(zhuǎn)錄區(qū)發(fā)生的非同義SNP突變可能會在進化過程中被淘汰,達到保護的目的[23]。cSNP與相關(guān)性狀有重要的聯(lián)系,因此,cSNP 往往具有重要的研究價值,可以為進一步的相關(guān)性狀關(guān)聯(lián)、代謝通路、遺傳作圖研究提供有效的工具,為分子育種奠定基礎(chǔ)。
SNP突變形式有轉(zhuǎn)換(C/T,G/A)和顛換(C/A,G/T,C/G,A/T),研究表明轉(zhuǎn)換出現(xiàn)的頻率約為顛換頻率的2倍[24]。本研究中,轉(zhuǎn)換/顛換為1.39,和Manuel等人對比目魚 EST-SNP 研究結(jié)果相近(1.408)[25],與鮭魚[26]、烏頰魚[27]和斑馬魚[28]的EST-SNP研究結(jié)果(1.885)有一定差距,表明了不同生物在進化過程中承受著不同的進化壓力[22]。
3.3SNP的驗證
SNP是單個堿基引起的突變,在檢測中可能會造成假陽性,影響試驗的準確性[25-26],因此,采取32個個體重復(fù)2次SSCP檢測,以消除假陽性干擾。本研究SNP驗證率(239%)較預(yù)期(50%)低,可能是由于使用的擴增模板是DNA,其中的內(nèi)含子會同時被擴增出來。內(nèi)含子也可能存在SNP的干擾,造成擴增片段長度過大、擴增條帶多而雜,降低了在聚丙烯凝膠電泳中的分辨率[29],由此造成某些具有多態(tài)的SNP無法被鑒定。
參考文獻:
[1]Cho Y S,Kim B S,Kim D S,et al. Modulation of warm-temperature-acclimation-associated 65-kDa protein genes (Wap65-1 and Wap65-2) in mud loach (Misgurnus mizolepis,Cypriniformes) liver in response to different stimulatory treatments[J]. Fish & Shellfish Immunology,2012,32(5):662-669.
[2]倪勇,伍漢霖. 江蘇魚類志[M]. 北京:中國農(nóng)業(yè)出版社,2006:391.
[3]樓允東. 魚類育種學(xué)[M]. 北京:中國農(nóng)業(yè)出版社,2001.
[4]孫效文. 魚類分子育種學(xué)[M]. 北京:海洋出版社,2010.
[5]Jackson T R,F(xiàn)erguson M M,Danzmann R G,et al.Identification of two QTL influencing upper temperature tolerance in three rainbowtrout (Oncorhynchus mykiss) half-sib familie[J]. Heredity,1998,80:143-151.
[6]Robison B D,Wheeler P A,Sundin K,et al. Composite interval mapping reveals a major locus influencing embryonic development rate in rainbow trout (Oncorhynchus mykiss)[J]. The Journal of Heredity,2001,92(1):16-22.
[7]Kocher T D,Lee W J,Sobolewska H,et al. A genetic linkage map of a cichlid fish,the tilapia(Oreochromis niloticus)[J]. Genetics,1998,148(3):1225-1232.