謝 楠,劉 凱,馮曉宇,姚桂桂,潘彬斌
(杭州市農(nóng)業(yè)科學(xué)研究院,杭州 310024)
?
烏鱧和斑鱧EST序列微衛(wèi)星信息分析
謝楠,劉凱,馮曉宇,姚桂桂,潘彬斌
(杭州市農(nóng)業(yè)科學(xué)研究院,杭州310024)
摘要:烏鱧(Channa argus,♂)、斑鱧(Channa maculatus,♀)是雜交鱧“杭鱧1號(hào)”的親本。利用高通量測(cè)序技術(shù)對(duì)烏鱧和斑鱧的肝臟進(jìn)行轉(zhuǎn)錄組測(cè)序獲得大量EST序列后,利用MISA軟件進(jìn)行微衛(wèi)星信息分析,結(jié)果表明,通過(guò)轉(zhuǎn)錄組測(cè)序獲得烏鱧EST序列59 959條,長(zhǎng)度45 mb,發(fā)現(xiàn)15 428個(gè)SSR,出現(xiàn)頻率為25.73%;獲得斑鱧EST序列44 337條,長(zhǎng)度27 mb,發(fā)現(xiàn)8 439個(gè)SSR,出現(xiàn)頻率為19.03%。在烏鱧和斑鱧EST-SSR中,重復(fù)單元以1~2堿基重復(fù)為最多,并以長(zhǎng)度小于16 bp的短重復(fù)序列為主,間隔SSR和復(fù)合SSR的EST序列RPKM均值要低于單純型SSR的EST序列RPKM均值,且在單純型SSR中SSR長(zhǎng)度越長(zhǎng),其RPKM均值則越低。
關(guān)鍵詞:烏鱧(Channa argus); 斑鱧(Channa maculatus);EST序列;微衛(wèi)星
烏鱧(Channaargus)和斑鱧(Channamaculatus)是雜交鱧“杭鱧1號(hào)”(以下簡(jiǎn)稱“雜交鱧”)的親本,同屬于鱸形目鱧科鱧屬。通過(guò)烏鱧(♂)、斑鱧(♀)雜交獲得的F1代新品種雜交鱧“杭鱧1號(hào)”可采用人工飼料投喂模式養(yǎng)殖,兼有生長(zhǎng)速度快、養(yǎng)殖周期短、產(chǎn)量高、病害少、效益高等優(yōu)點(diǎn),有效地解決了傳統(tǒng)烏鱧投喂冰鮮魚模式造成的面源污染及產(chǎn)品食用安全問(wèn)題[1],并成為浙江省養(yǎng)殖漁業(yè)主推品種之一,替代傳統(tǒng)烏鱧的比例不斷增加,成為杭州地區(qū)的黑魚養(yǎng)殖主導(dǎo)品種。
目前,針對(duì)雜交鱧的研究在養(yǎng)殖密度、營(yíng)養(yǎng)成分、染色體核型以及雜交子代與親本的遺傳標(biāo)記等方面已有相關(guān)報(bào)道[2-4],但相關(guān)分子標(biāo)記的開發(fā)量仍然較少,還不能完全滿足研究的需求。微衛(wèi)星( SSR) 作為第二代分子標(biāo)記,被越來(lái)越多地用于水生動(dòng)物群體遺傳學(xué)分析工作。本研究基于高通量測(cè)序技術(shù)對(duì)雜交鱧親本烏鱧和斑鱧進(jìn)行轉(zhuǎn)錄組測(cè)序,獲得相關(guān)EST序列并進(jìn)行SSR信息分析,以期能為雜交鱧的標(biāo)記開發(fā)、分子標(biāo)記輔助育種等方面提供基礎(chǔ)。
1材料與方法
1.1實(shí)驗(yàn)材料
實(shí)驗(yàn)用烏鱧為采自錢塘江群體的后代,經(jīng)篩選獲得的體質(zhì)健康的個(gè)體(體重1 000 g左右);實(shí)驗(yàn)用斑鱧為采自珠江流域的親本經(jīng)過(guò)人工繁殖培育的后代,經(jīng)篩選獲得的體質(zhì)健康的個(gè)體(體重750 g左右)。實(shí)驗(yàn)用樣品組織為肝臟,烏鱧和斑鱧各采集6尾,將采集到的6個(gè)肝臟組織混合后分別作為轉(zhuǎn)錄組建庫(kù)及測(cè)序樣本,先經(jīng)液氮瞬時(shí)冷凍,之后于-80 ℃低溫保存?zhèn)溆谩?/p>
1.2EST序列的獲得
從烏鱧和斑鱧的肝臟提取mRNA構(gòu)建cDNA文庫(kù),建好的文庫(kù)用Illumina Solexa進(jìn)行測(cè)序。烏鱧和斑鱧測(cè)序數(shù)據(jù)量分別達(dá)到8.4 G和5.7 G,Q30數(shù)據(jù)比率分別為88.13%和86.18%,Q20數(shù)據(jù)比率分別為94.55%和92.90%。經(jīng)過(guò)質(zhì)量處理后,烏鱧和斑鱧轉(zhuǎn)錄本留存率分別為97.89%和96.53%,可以滿足后續(xù)數(shù)據(jù)分析要求。序列拼接及去重復(fù)后,得到轉(zhuǎn)錄本。烏鱧和斑鱧樣本中分別得到85 802個(gè)和52 769個(gè)長(zhǎng)度大于200 bp的轉(zhuǎn)錄本,大小分別為113.75 mb和44.29 mb,截取每個(gè)基因座下最長(zhǎng)的轉(zhuǎn)錄本后分別得到59 959個(gè)和44 337個(gè)EST序列,大小分別為45 mb和27 mb,序列平均長(zhǎng)度為751.99 bp和608.88 bp。
1.3基因表達(dá)豐度
對(duì)拼接得到的轉(zhuǎn)錄本(≥200 bp)建庫(kù)后,使用軟件bwa(http://sourceforge.net/projects/bio-bwa)中single-end的mapping方法計(jì)算轉(zhuǎn)錄本在各樣本中的表達(dá)豐度,允許一個(gè)reads比對(duì)到多個(gè)轉(zhuǎn)錄本上,此時(shí)每個(gè)reads在每個(gè)轉(zhuǎn)錄本上計(jì)1/n,每個(gè)EST序列下面的所有轉(zhuǎn)錄本比對(duì)上的reads均計(jì)于該EST序列下。豐度值采用RPKM(Reads Per Kilobase of exon model per Million mapped reads)法計(jì)算。
1.4SSR分析
以Illumina Solexa測(cè)序獲得的EST序列作為參考序列,使用SSR篩選軟件MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)進(jìn)行 SSR篩選。篩選標(biāo)準(zhǔn)為1個(gè)堿基重復(fù)10次及10次以上,2個(gè)堿基重復(fù)6次及6 次以上,3~6個(gè)堿基重復(fù)5次及5次以上,兩個(gè)微衛(wèi)星之間的距離小于100 bp的時(shí)候,兩個(gè)微衛(wèi)星組成一個(gè)復(fù)合微衛(wèi)星。用SSR出現(xiàn)頻率和SSR平均分布距離來(lái)描述SSR,出現(xiàn)頻率前2位的重復(fù)單元定義為優(yōu)勢(shì)重復(fù)單元。計(jì)算公式分別為:SSR出現(xiàn)頻率=搜索到的SSR數(shù)量/EST序列數(shù)量;SSR平均分布頻率=EST序列總堿基數(shù)/搜索到的SSR數(shù)量。利用Primer3 interface modules ( http://pgrc.ipk-gatersleben.de/misa/primer3.html )對(duì)SSR篩選結(jié)果進(jìn)行預(yù)處理后,利用primer3 ( http://sourceforge.net/projects/primer3 )進(jìn)行SSR引物的批量設(shè)計(jì),引物設(shè)計(jì)的參數(shù)是Tm為60 ℃,引物長(zhǎng)度為20 bp。
2結(jié)果
2.1烏鱧和斑鱧EST序列中SSR重復(fù)單元分布
利用MISA軟件對(duì)烏鱧和斑鱧的EST序列進(jìn)行SSR特征分析,其中檢測(cè)的烏鱧EST序列共59959條,長(zhǎng)度為45 mb,共發(fā)現(xiàn)15 428個(gè)SSR,出現(xiàn)頻率為25.73%,平均每2.92 kb出現(xiàn)1個(gè)SSR;檢測(cè)的斑鱧EST序列共44 337條,長(zhǎng)度為27 mb,共發(fā)現(xiàn)8 439個(gè)SSR,出現(xiàn)頻率為19.03%,平均每3.20 kb出現(xiàn)1個(gè)SSR。檢出的SSR 包含了1、2、3,4和5堿基重復(fù)單元,不同重復(fù)單元出現(xiàn)頻率隨堿基數(shù)增加而明顯降低,其中最常見的是1堿基和2堿基重復(fù)單元,各重復(fù)單元SSR出現(xiàn)頻率及分布頻率信息見表1。
表1 EST序列中不同重復(fù)單元SSR分布情況
在搜索到的烏鱧EST序列的SSR 中,共觀察到45種不同的重復(fù)單元類型,其中1堿基重復(fù)2 種,2 堿基重復(fù)4種,3堿基重復(fù)10種,4堿基重復(fù)23種,5 堿基重復(fù)6種。1堿基重復(fù)中,A/T類型出現(xiàn)的頻率最高,占94.47%;2堿基重復(fù)中,AC/GT出現(xiàn)的頻率最高,占78.61%;3堿基重復(fù)中,AGC/CTG出現(xiàn)的頻率最高,占24.94%;4堿基重復(fù)中,AAAC/GTTT出現(xiàn)的頻率最高,占25.29%;5堿基重復(fù)中,AAAAT/ATTTT出現(xiàn)的頻率最高,占28.57%,結(jié)果見表2。
表2 烏鱧EST序列中不同重復(fù)單元SSR的出現(xiàn)頻率(考慮到堿基互補(bǔ)作用)
在搜索到的斑鱧EST序列SSR 中,共觀察到40種不同的重復(fù)單元類型,其中1堿基重復(fù)2 種,2 堿基重復(fù)4種,3堿基重復(fù)10種,4堿基重復(fù)17種,5 堿基重復(fù)7種。1堿基重復(fù)中,A/T類型出現(xiàn)的頻率最高,占95.14%;2堿基重復(fù)中,AC/GT出現(xiàn)的頻率最高,占75.56%;3堿基重復(fù)中,AGC/CTG出現(xiàn)的頻率最高,占27.45%;4堿基重復(fù)中,AAAC/GTTT出現(xiàn)的頻率最高,占33.71%,結(jié)果見表3。
表3 斑鱧EST序列中不同重復(fù)單元SSR的出現(xiàn)頻率(考慮到堿基互補(bǔ)作用)
2.2烏鱧和斑鱧EST序列中SSR的長(zhǎng)度分布
對(duì)烏鱧和斑鱧的EST序列中所發(fā)現(xiàn)的SSR長(zhǎng)度的變化進(jìn)行了分析,結(jié)果發(fā)現(xiàn)序列所含SSR在長(zhǎng)度上存在顯著變異,SSR長(zhǎng)度從10到237個(gè)堿基不等,烏鱧SSR的加權(quán)平均長(zhǎng)度為17.11 bp,斑鱧SSR的加權(quán)平均長(zhǎng)度為17.20 bp。烏鱧和斑鱧SSR以長(zhǎng)度小于16 bp的短重復(fù)序列最多,其次是長(zhǎng)度為16~25 bp的序列重復(fù),大于30 bp的較長(zhǎng)序列重復(fù)僅為4.0%左右,結(jié)果如圖1,利用SPSS進(jìn)行Pearson相關(guān)性分析表明,烏鱧和斑鱧微衛(wèi)星數(shù)量和長(zhǎng)度呈顯著負(fù)相關(guān)性,相關(guān)系數(shù)分別為-0.391和-0.447,P=0.000<0.01,具有顯著相關(guān)性。
以SSR數(shù)量對(duì)堿基重復(fù)數(shù)量作圖,結(jié)果如圖2,可見SSR數(shù)量隨著堿基重復(fù)次數(shù)增加呈明顯下降趨勢(shì),而且堿基重復(fù)次數(shù)越少,SSR數(shù)量下降的速率就越快。僅當(dāng)2堿基重復(fù)從8次增加到10次時(shí),烏鱧和斑鱧SSR數(shù)量出現(xiàn)了增加的情況。1堿基重復(fù)次數(shù)達(dá)到22次、2堿基重復(fù)次數(shù)達(dá)到12次、其他堿基重復(fù)次數(shù)達(dá)到8次的時(shí)候,SSR數(shù)量的下降速率降低,進(jìn)入平臺(tái)期。
圖2 EST序列中SSR數(shù)量隨重復(fù)次數(shù)變化曲線
烏鱧59 959條和斑鱧44 337條EST序列中,含SSR的EST序列分別占總數(shù)的19.02%和15.08%。將含SSR的EST序列與不含SSR的EST序列的RPKM均值比較,烏鱧中含SSR的EST序列的RPKM均值為16.85,是不含SSR的EST序列的RPKM均值5.89的2.86倍,斑鱧中含SSR的EST序列的RPKM均值為42.48,是不含SSR的EST序列的RPKM均值6.18的6.87倍。Weber[5]將微衛(wèi)星分為3類,即單純(pure) SSR、復(fù)合(compound) SSR和間隔(interrupted) SSR。本實(shí)驗(yàn)發(fā)現(xiàn),烏鱧中含有間隔SSR和復(fù)合SSR的EST序列的RPKM均值分別為6.53、3.44,低于僅含有單純型SSR的EST序列的RPKM均值17.43;斑鱧中含有間隔SSR和復(fù)合SSR的EST序列的RPKM均值分別為20.56、7.07,低于僅含有單純型SSR的EST序列的RPKM均值43.60,結(jié)果見表4。對(duì)SSR長(zhǎng)度與相關(guān)EST序列的RPKM值進(jìn)行相關(guān)性分析,SSR長(zhǎng)度與EST序列的RPKM值相關(guān)系數(shù)為-0.124,無(wú)顯著相關(guān)性。
表4 EST序列中SSR類型與長(zhǎng)度對(duì)RPKM值的影響
以烏鱧和斑鱧的EST序列為基礎(chǔ),利用primer3軟件進(jìn)行批量引物設(shè)計(jì)。烏鱧中14 561個(gè)含SSR序列,7 297條序列引物設(shè)計(jì)失敗,成功設(shè)計(jì)7 264對(duì)SSR引物,成功率為49.89%。斑鱧中8 017個(gè)含SSR序列,4 607條序列引物設(shè)計(jì)失敗,成功設(shè)計(jì)3 410對(duì)SSR引物,成功率為42.53%。
3討論
由重復(fù)單元的重復(fù)次數(shù)不同所造成的多態(tài)性常常表現(xiàn)為復(fù)等位性,在不同的基因型間存在廣泛的多態(tài)性。研究者認(rèn)為這種多態(tài)性起因于復(fù)制過(guò)程中的滑動(dòng)[16]。因此,SSR長(zhǎng)度的變化反映SSR位點(diǎn)獲得(或失去)重復(fù)單元的活躍程度。越來(lái)越多的研究表明,SSR參與基因的表達(dá)調(diào)控及基因重排、變異等活動(dòng)并與腫瘤發(fā)生及神經(jīng)系統(tǒng)疾病有關(guān)[17-20]。在羅非魚(Oreochromismossambicus)研究中發(fā)現(xiàn),SSR長(zhǎng)度與基因表達(dá)強(qiáng)度相關(guān),在無(wú)環(huán)境脅迫的條件下SSR長(zhǎng)度越長(zhǎng),基因表達(dá)水平越低,在有環(huán)境脅迫的條件下則反之[21]。本實(shí)驗(yàn)發(fā)現(xiàn),烏鱧和斑鱧測(cè)序所獲得的EST序列中,間隔SSR和復(fù)合SSR的EST序列的RPKM均值要低于單純型SSR的EST序列的RPKM均值,且在單純型SSR中SSR長(zhǎng)度越長(zhǎng),其RPKM均值則越低,這與羅非魚上的研究結(jié)論類似。而在楊樹和茶樹EST-SSR的研究中認(rèn)為,含有SSR的基因總體表達(dá)水平偏低,這樣有利于相應(yīng)基因在基因組中的保存,規(guī)避部分選擇壓力[22-23]。但本實(shí)驗(yàn)中發(fā)現(xiàn),不論烏鱧和斑鱧,含SSR的EST序列的RPKM均值要明顯高于不含SSR的EST序列的RPKM均值,與楊樹和茶樹的研究結(jié)果不同,這也許由于物種差異造成或?qū)嶒?yàn)方法上的差別造成,有待進(jìn)一步研究。此外,本實(shí)驗(yàn)中使用primer3對(duì)轉(zhuǎn)錄本進(jìn)行批量SSR引物設(shè)計(jì),大大提高了工作效率,為下一步工作的開展奠定了基礎(chǔ)。
參考文獻(xiàn):
[1]馮曉宇,王宇希,李行先,等.池塘養(yǎng)殖雜交鱧高效試驗(yàn)[J].科學(xué)養(yǎng)魚,2008,(3):31-32.
[2]劉新軼,王宇希,謝楠,等.雜交鱧及其親本肌肉營(yíng)養(yǎng)成分分析[J].齊魯漁業(yè),2010,27(5):24-26.
[3]謝楠,馮曉宇,劉新軼,等.4個(gè)雜交鱧繁殖性能、F1生長(zhǎng)和形態(tài)的比較[J].浙江農(nóng)業(yè)科學(xué),2013,(10):1366-1369.
[4]朱樹人,李忠全,馮曉宇,等.烏鱧和斑鱧微衛(wèi)星制備及其對(duì)自交與雜交F1代的初步鑒定[J].動(dòng)物學(xué)雜志,2011,46 (4):1-7.
[5]Weber J L Informativeness of human (dC-dA)n(dG-dT)npoly-morphisms[J] Genomics,1990,7(4):524-530
[6]Zhan A B,Bao Z M,Hu X L.Characterization of 95 novel microsatellite markers for Zhikong scallopChlamysfareriusing FIASCO colony hybridization and EST database mining[J].Fish Sci,2008,74(3):516-526.
[7]Wang H X,Li F H,Xiang J H.Polymorphic EST-SSR markers and their mode of inheritance inFenneropenaeuschinensis[J].Aquaculture,2005,249(s1-4):107-114.
[8]Wang D,Liao X L,Cheng L, et al.Development of novel EST-SSR markers in common carp by data mining from public EST sequences[J].Aquaculture,2007,271:558-574.
[9]許曉軍,張海琪,張超,等.中華鱉表達(dá)序列標(biāo)簽資源中的微衛(wèi)星信息分析[J].經(jīng)濟(jì)動(dòng)物學(xué)報(bào),2013,17(1):15-18.
[10]Serapion J,Kucuktas H,Feng J N,etal.Bioinformatic mining of type I microsatellites from expressed sequence tags of channel catfish(Ictaluruspunctatus)[J].Mar Biotechnol,2004,6(4):364-377.
[11]陳松波,龔麗,劉海金.牙鲆EST資源的SSR信息分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2010,41(10):82-86.
[12]王艷紅,胡超群,張呂平,等.凡納濱對(duì)蝦EST微衛(wèi)星標(biāo)記初步篩選[J].大連水產(chǎn)學(xué)院學(xué)報(bào),2008,23(4):304-308.
[13]劉博,邵艷卿,滕爽爽,等.縊蟶(Sinonovaculaconstricta)EST-SSR分布特征及引物開發(fā)利用[J].海洋與湖沼,2012,43(1):133-137.
[14]Zhang A,Wang Y,Brown B,et al.Isolation and characterization of novel microsatellite markers for yellow perch(Percaflavescens)[J].Int Mol Sci,2009,10(1):18-27.
[15]張琳琳,李莉,張國(guó)范.長(zhǎng)牡蠣(Crassostreagigas)EST串聯(lián)重復(fù)序列的組成和分布[J].海洋科學(xué),2011,35(4):9-14.
[16]Sharopova N.Plant simple sequence repeats:distribution,variation,and effects on gene expression[J] Genome,2008,51:79-90
[17]Thibodeau S N,Bren G,Schaid D.Microsatellite instability in cancer of the proximal colon[J].Science,1993,260(5109):816-819.
[18]Aaltonen L A,Lauri A,Leach F S,et al.Clues to the pathogenesis of familial colorctal cancer[J].Science,1993,260(5109):812-816.
[19]Ionov Y,Miguel A,Peinado,et al.Ubiquitous somatic mutations in simple repeated sequences reveal a new mechanism for colon carcinogenesis[J].Nature,1993,363:558-561.
[20]Toth G,Gaspari Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome Research,2000,10(7):967-981.
[21]Streelman J,Kocher T.Microsatellite variation associated with prolactin expression and growth of salt-challenged Tilapia[J].Physiol Genom,2002,9(1):1-4.
[22]劉菁菁,戴曉港,王潔,等.楊樹微衛(wèi)星序列對(duì)基因表達(dá)頻率的影響及表達(dá)序列中微衛(wèi)星特征的分析[J].南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,35(1):11-14.
[23]王麗鴛,韋康,張成才,等.茶樹花轉(zhuǎn)錄組微衛(wèi)星分布特征[J].作物學(xué)報(bào),2014,40(1):80-85.
(責(zé)任編輯:陳細(xì)華)
Analysis of simple sequence repeats information in expressed sequence tags of Channa argus and Channa maculatus
XIE Nan,LIU Kai,FENG Xiao-yu,YAO Gui-gui,PAN Bin-bin
(HangzhouAcademyofAgriculturalSciences,Hangzhou310024,China)
Abstract:In this experiment,a large number of Expressed Sequence Tags(EST) were obtained from transcriptome sequences of livers in Channa argus and Channa maculatus by high-throughput sequencing technology,and Simple Sequence Repeats(SSR) Information was analysed.The result showed that,59 959 EST with 45 mb length were obtained from Channa argus,and 15428 EST-SSR were mined out by MISA,with the frequency of 25.73%;while 44 337 EST with 27mb length were obtained from Channa maculatus,and 8 439 EST-SSR were mined out by MISA,with the frequency of 19.03%.In the EST-SSR of C.argus and C.maculatus,nucleotide and dinucleotide repeats were the main types,while the repeats less than 16bp in length were the main types.Mean values of reads per kilobase per million (RPKM) of EST in both interrupted and compound SSR were lower than mean values of RPKM of EST in pure SSR,and in the pure EST-SSR,the longer SSR in length,the lower mean values of RPKM.
Key words:Channa argus;Channa maculatus;expressed sequence tags;simple sequence repeats
收稿日期:2015-08-11;
修訂日期:2015-10-12
第一作者簡(jiǎn)介:謝楠(1981-),男,碩士,主要從事魚類遺傳育種研究工作。E-mail:n.xie@163.com通訊作者:馮曉宇。E-mail:fengxy1962@163.com
中圖分類號(hào):S917.4
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1000-6907-(2016)03-0016-07
資助項(xiàng)目:浙江省水產(chǎn)農(nóng)業(yè)新品種選育重大科技專項(xiàng)(2012C12907-7)