武政梅,高 朋,溫俊寶
(北京林業(yè)大學林木有害生物防治北京市重點實驗室,北京100083)
?
溝眶象轉錄組微衛(wèi)星特征分析
武政梅,高 朋,溫俊寶*
(北京林業(yè)大學林木有害生物防治北京市重點實驗室,北京100083)
本研究基于高通量測序獲得的溝眶象Eucryptorrhynchuschinensis(Olivier)轉錄組數(shù)據(jù),采用MISA(Micro Satellite)軟件對其簡單序列重復(simple sequence repeat, SSR)位點進行了高通量發(fā)掘。對篩選得到的1 kb以上的Unigene(17590條,占Unigene總數(shù)的26.98%)進行了SSR分析,結果發(fā)現(xiàn)含SSR的序列有1665條,共發(fā)現(xiàn)1823個SSR,平均32.52 kb出現(xiàn)一個SSR。溝眶象微衛(wèi)星主要以三堿基重復類型為主(637,34.94%),其次為單堿基重復(576,31.60%)。共發(fā)現(xiàn)104種堿基重復基元,所占比例最高的為(A/T)n(30.39%),其次為(AT/AT)n(6.91%)。溝眶象SSR的平均長度為15.74 bp,長度大于20 bp的SSR僅占總數(shù)的12.70%。研究還發(fā)現(xiàn)溝眶象微衛(wèi)星出現(xiàn)的頻率和其長度呈極顯著負相關(P<0.01),相關系數(shù)為-0.572。研究結果為開發(fā)高多態(tài)性微衛(wèi)星引物來進行溝眶象功能基因組學、種群遺傳結構、種群遺傳多樣性等研究奠定了基礎。
溝眶象;微衛(wèi)星;轉錄組;重復類型;重復基元
微衛(wèi)星(microsatellite)又稱簡單序列重復(simple sequence repeat, SSR),一般以1-6個堿基為核心序列,其長度通常較短(何平,1998)。由于這些序列廣泛存在于真核細胞的基因組(史潔等,2012),同時具有可重復性高、多態(tài)性強、數(shù)量豐富、共顯性、對基因組有很好覆蓋性等特點(Liuetal., 2013),因此微衛(wèi)星已經(jīng)成為不同物種遺傳研究中使用最廣泛的分子標記(王麗鴛等,2014),已被廣泛應用于種群遺傳多樣性分析、動植物分類和進化、遺傳圖譜的構建、基因定位和克隆、分子標記輔助育種、品種鑒定等領域(Lietal., 2002; Varshneyetal., 2005)。SSR按來源分為基因組SSR(Genomic SSR, gSSR)和表達序列標簽SSR(Expressed SSR,EST-SSR)(王東等,2014)。兩種SSR相比較,因EST-SSR源于基因的轉錄區(qū),其多態(tài)性與基因功能可能有直接關系(Eujayletal., 2002),因此通用性更高。新一代高通量測序技術的快速發(fā)展為利用轉錄組序列開發(fā)SSR標記帶來了福音,它不僅具有EST-SSR標記的優(yōu)點,而且能產生更為海量的轉錄組數(shù)據(jù),因此為SSR標記的開發(fā)提供了更全面的信息,從而提高了遺傳多樣性研究的準確性。目前,研究者們已經(jīng)對很多物種轉錄組中的微衛(wèi)星進行了研究分析,鞘翅目昆蟲中就有云南切梢小蠹Tomicusyunnanensis(袁遠等,2014)、綠豆象Callosobruchuschinensis(Duanetal., 2014)、黃粉蟲Tenebriomolitor(Zhuetal., 2013)等,結果顯示在不同物種中微衛(wèi)星的分布特征差異很大。
溝眶象EucryptorrhynchuschinensisOlivier 隸屬鞘翅目Coleptera象甲科Curculioniclae隱喙象亞科Cryptorrhynchinae溝眶象屬EucryptorrhynchusHdler,主要以幼蟲蛀食臭椿根部為害。由于近10多年來檢疫不嚴,溝眶象及其近緣種臭椿溝眶象Eucryptorrhynchusbrandti已傳播擴散至西北多個省區(qū)并成片嚴重發(fā)生,整個寧夏二代農田林網(wǎng)中臭椿受害株率達15%以上,致死率達7%,嚴重影響了臭椿的環(huán)境生態(tài)效益和觀賞經(jīng)濟價值(楊貴軍等,2008a)。目前有關溝眶象的報道,主要集中在生物學、生態(tài)學以及防治措施等領域,幾乎沒有有關其遺傳背景和分子生物學方面的研究。本文根據(jù)已構建的溝眶象轉錄組數(shù)據(jù)庫,對其微衛(wèi)星進行了高通量發(fā)掘,旨在為今后開發(fā)高多態(tài)性微衛(wèi)星引物,對溝眶象進行功能基因組學、種群遺傳結構、種群遺傳多樣性等研究打下基礎。
1.1 試蟲來源和轉錄組數(shù)據(jù)
溝眶象樣品采自寧夏回族自治區(qū)銀川市靈武市梧桐樹鄉(xiāng)一隊,經(jīng)液氮瞬時冷凍后放于-80℃的冰箱中保存?zhèn)溆谩峡粝罂俁NA樣品檢測合格后,利用Illumina HiSeq 2500測序平臺進行高通量深度測序,共獲得65186條Unigenes,轉錄組數(shù)據(jù)未發(fā)表。
1.2 微衛(wèi)星的篩選
利用MISA軟件(Micro Satellite identification tool)(http://www.pgrc.ipk-gatersleben.de/misa/)對溝眶象轉錄組中1 kb以上的Unigene進行SSR位點分析,篩選標準為:單堿基、二堿基、三堿基、四堿基、五堿基、六堿基的最少重復次數(shù)分別為12、6、5、5、5、5。復合SSR兩個位點間最大間隔堿基數(shù)為(Maximal number of bases interrupting 2 SSRs in a compound microsatellite):100。
2.1 溝眶象轉錄組序列中SSR重復的分布
本研究利用MISA軟件對篩選得到的1 kb以上的Unigene進行了SSR 分析,評估序列拼接總長度為59281851 bp,獲得SSR數(shù)目為1823個(完整型SSR 1709個),這些SSR分布于1665條序列中,平均相隔32.52 kb出現(xiàn)一個SSR序列,SSR的出現(xiàn)頻率為10.36%。本研究僅對溝眶象轉錄組中1-6堿基完整型SSR進行分析,部分SSR信息見表1。
2.2 溝眶象轉錄組重復基元的分布
在溝眶象所有堿基重復類型中,三堿基重復SSR含量最多,約占總數(shù)的37.27%,其次為單堿基重復SSR(33.70%)、二堿基重復SSR(26.04%),沒有發(fā)現(xiàn)六堿基重復SSR。研究還發(fā)現(xiàn)在溝眶象104種重復基元中,(A/T)n、(AT/AT)n、(TTA/TAA)n、(ATAA/TTAT)n、(AGGTT/AACCT)n和(AAGTA/TACTT)n分別在單、二、三、四、五堿基中出現(xiàn)頻率最多,它們在各自重復基元類型中的比例分別是96.18%、28.31%、14.76%、23.26%、50.00%(表2)。
在溝眶象的104種堿基重復基元中,單、二、三、四、五堿基重復基元分別有4、12、58、23、7種,出現(xiàn)頻率最高的是(A/T)n(30.39%),其次是(AT/AT)n(6.91%)、(TA/TA)n(6.80%)、(TTA/TAA)n(5.16%)、(AAT/ATT)n(4.44%)等。不同類型重復基元的SSR分布見圖1。
表1 溝眶象轉錄組中微衛(wèi)星數(shù)據(jù)庫的部分結果
表2 溝眶象轉錄組中不同微衛(wèi)星優(yōu)勢重復基元出現(xiàn)的頻率
圖1 基于重復基元類型的微衛(wèi)星分布(考慮到堿基互補)Fig.1 Microsatellites distribution on different repeat motifs (considering sequence complementary)注:Other motifs 表示頻率小于0.80%的重復基元類型。Note:Other motifs denote the repeat motifs with frequency below 0.80%.
2.3 溝眶象轉錄組序列中微衛(wèi)星的長度分布
溝眶象轉錄組中所發(fā)現(xiàn)的1709個完整型SSR中,微衛(wèi)星長度存在顯著變異,從12-48個堿基不等,平均長度為15.74個堿基。如圖2顯示,溝眶象微衛(wèi)星以重復長度小于20 bp的短重復序列最多,其中12-15 bp的數(shù)量最多(1098,64.25%),其次為16-20 bp(394,23.05%),長度大于20 bp的長序列重復僅占微衛(wèi)星總數(shù)的12.70%。本研究進一步利用SPSS軟件進行Person相關性分析,結果表明溝眶象微衛(wèi)星出現(xiàn)的頻率和其長度呈極顯著負相關(P<0.01),相關系數(shù)為-0.572。
圖2 溝眶象轉錄組中微衛(wèi)星的長度分布Fig. 2 Length distribution of microsatellites in Eucryptorrhynchus chinensis transcriptome
本研究從溝眶象轉錄組中發(fā)掘到1823個SSR位點,分布于1665條Unigene序列中。溝眶象SSR的出現(xiàn)頻率為10.36%,這與黑翅土白蟻Odontotermesformosaanus(9.98%)(Huangetal., 2012)中SSR的出現(xiàn)頻率差不多,高于煙粉虱Bemisiatabaci(5.07%)(Xieetal., 2012)、細梢小卷蛾Rhyacionialeptotubula(3.09%)(Zhuetal., 2013)、粘蟲Mythimnaseparate(1.93%)(胡艷華等,2015)中SSR的出現(xiàn)頻率。鞘翅目昆蟲中,云南切梢小蠹Tomicusyunnanensis(袁遠等,2014)和黃粉蟲Tenebriomolitor(Zhuetal., 2013)轉錄組中檢測出的SSR的出現(xiàn)頻率分別為1.29%、1.79%,明顯低于溝眶象轉錄組中SSR的出現(xiàn)頻率,這說明溝眶象轉錄組中SSR數(shù)量相對來說十分豐富。分析其中的原因,除了SSR位點的搜索方法或計算標準有差異外,最根本的原因可能是物種特異性(黃海燕等,2013)。
在鑒定得到的溝眶象轉錄組SSR中,三堿基重復類型的數(shù)量最高,約占總數(shù)的33.70%。這與綠豆象Callosobruchuschinensis(Duanetal., 2014)、二點委夜蛾Athetislepigone(Lietal., 2013)、白背飛虱Sogatellafurcifera(Xuetal., 2012)、云南切梢小蠹Tomicusyunnanensis(袁遠等,2014)等昆蟲的SSR以三堿基重復為主類似。大部分昆蟲中的微衛(wèi)星都是以三堿基重復為主導重復類型,這有可能是為了防止蛋白質編碼時發(fā)生移碼突變現(xiàn)象(Sunetal., 2011)。本研究中溝眶象微衛(wèi)星重復基元中所占比例最高的為(A/T)n,達到30.39%,這與黃粉蟲、云南切梢小蠹、扶桑綿粉蚧Phenacoccussolenopsis(羅梅等,2014)的轉錄組中SSR的分析結果一致。溝眶象三堿基重復中,TTA/TAA為優(yōu)勢重復基元,而鞘翅目昆蟲中的黃粉甲和云南切梢小蠹三堿基重復中都是以AAT/ATT為優(yōu)勢重復基元。這種差異可能與昆蟲自身SSR特點以及轉錄組數(shù)據(jù)來源等緊密相關。
SSR分子標記的多態(tài)性是判斷其可用性的重要依據(jù),而其長度又是影響其多態(tài)性高低的重要因素。Temnykh等(2001)的研究表明,當SSR長度≥20 bp時多態(tài)性較高,長度在12-20 bp時多態(tài)性中等,而長度在12 bp以下時SSR多態(tài)性極低。本研究在SSR篩選過程中已經(jīng)將長度在12 bp 以下的SSR過濾掉,最終發(fā)現(xiàn)溝眶象轉錄組中SSR長度在12-48個堿基不等,平均長度為15.74個堿基,具有高多態(tài)性的SSR所占比例僅為12.70%,這部分多態(tài)性潛能高的SSR在高效開發(fā)溝眶象微衛(wèi)星標記方面應該具有較高的利用價值(楊華等,2011)。本研究還發(fā)現(xiàn)溝眶象微衛(wèi)星出現(xiàn)的頻率和其長度呈極顯著負相關(P<0.01),相關系數(shù)為-0.572。根據(jù)Samadi等(1998)的研究可以得出,基因組中長度較短的SSR變異速率較快,而長度較長的SSR變異速率則較慢,相對來說較穩(wěn)定。雖然基因序列中的SSR增加了基因的不穩(wěn)定性,但正是這樣的不穩(wěn)定性為基因變異提供了動力。
本研究基于構建獲得的溝眶象轉錄組數(shù)據(jù)庫,對其SSR進行了高通量發(fā)掘,并對溝眶象SSR的特征進行了分析,表明利用轉錄組數(shù)據(jù)發(fā)掘SSR是高效可行的。研究結果為開發(fā)高多態(tài)性微衛(wèi)星引物來進行溝眶象功能基因組學、種群遺傳結構、種群遺傳多樣性等研究奠定了基礎,這對于從分子角度探究溝眶象的擴散機制及綜合防治等都具有非常重要的意義,同時為探索溝眶象和其近緣種臭椿溝眶象的起源進化關系打下基礎。
References)
Duan CX, Li DD, Sun SL,etal. Rapid development of microsatellite markers forCallosobruchuschinensisusing Illumina paired-end sequencing[J].PLoSONE, 2014,9(5): e95458.
Eujayl I, Sorrells M, Banm M,etal. Isolation of EST-derived microsatellite markers for genotyping the A and B genomes of wheat[J].TheoreticalandAppliedGenetics,2002,104(2): 399-407.
He P. Abundance, polymorphism and applications of microsatellite in eukaryote[J].Hereditas,1998,20(4):42-47.[何平.真核生物中的微衛(wèi)星及其應用[J].遺傳,1998, 20(4):42-47]
Huang HY, Du HY, Wuyun TN,etal.Development of SSR molecular markers based on transcriptome sequencing ofEucommiaulmoides[J].ScientiaSilvaeSinicae, 2013, 49(5): 176-181.[黃海燕,杜紅巖,烏云塔娜,等.基于杜仲轉錄組序列的SSR分子標記的開發(fā)[J]. 林業(yè)科學, 2013,49(5): 176-181]
Huang Q, Sun P, Zhou X,etal.Characterization of head transcriptome and analysis of gene expression involved in caste differentiation and aggression inOdontotermesformosanus(Shiraki)[J].PLoSONE,2012,7(11): e50383.
Hu YH, Li M, Zhang HF,etal. The information analysis of SSR loci in theMythimnaseparate(Walker) transcriptome[J].JournalofShanxiAgriculturalUniversity, 2015, 35(5): 484-489.[胡艷華,李敏,張虎芳,等.粘蟲轉錄組中SSR位點的信息分析[J].山西農業(yè)大學學報, 2015, 35(5): 484-489]
Li LT, Zhu YB,Ma JF,etal.An analysis of theAthetislepigonetranscriptome from four developmental stages[J].PLoSONE, 2013, 8(9): e73911.
Li YC, Korol AB, Fahima T,etal.Microsatellites: Genomic distribution, putative functions and mutational mechanisms: A review[J].MolecularEcology, 2002,11(12): 2453-2465.
Liu T, Zhu S, Fu L,etal. Development and characterization of 1827 expressed sequence tag-derived simple sequence repeat markers for ramie (BoehmerianiveaL. Gaud)[J].PLoSONE,2013,8(4): e60346.
Luo M, Zhang H, Bin SY,etal. High-throughput discovery of SSR genetic markers in the mealybug,Phenacoccussolenopsis(Hemiptera:Pseudococcidae), from its transcriptome database[J].ActaEntomologicaSinica,2014,57(4): 395-400. [羅梅,張鶴,賓淑英,等.基于轉錄組數(shù)據(jù)高通量發(fā)掘扶桑綿粉蚧微衛(wèi)星引物[J].昆蟲學報, 2014, 57(4): 395-400]
Samadi S, Artiguebielle E, Estoup A,etal. Density and variability of dinucleotide microsatellites in the parthenogenetic polyploid snailMelanoidestuberculata[J].MolecularEcology,1998,7(9):1233-1236.
Shi J,Yin TM,Guan HW,etal.Characteristic analysis of microsatellitesCamelliaspp.[J].JournalofNanjingForestryUniversity(Natural Sciences Edition),2012,36:47-52. [史潔,尹佟明,管宏偉,等.油茶基因組微衛(wèi)星特征分析[J].南京林業(yè)大學學報(自然科學版), 2012,36:47-52]
Temnykh S, DeClerck G, Lukashova A,eta1. Computational and experimental analysis of microsatellites in rice (OryzasativaL.)[J].GenomeResearch, 2001,11:1441-1452.
Varshney RK, Graner A, Sorrells ME. Genic microsatellite markers in plants:Features and applications [J].TrendsinBiotechnology, 2005, 23(1):48-55.
Wang D, Cao LY, Gao JP. Data mining of simple sequence repeats inCodonopsispilosulatranscriptome[J].ChineseTraditionalandHerbalDrugs, 2014, 46(8):2390-2394.[王東,曹玲亞,高建平.黨參轉錄組中SSR位點信息分析[J].中草藥,2014,46(8): 2390-2394]
Wang LY, Wei K, Zhang CC,etal.Characterization of micorsatellites in tea (Camelliasinensis) floral transcriptome[J].ActaAgronomicaSinica, 2014, 40(1): 80-85. [王麗鴛,韋康,張成才,等.茶樹花轉錄組微衛(wèi)星分布特征[J].作物學報, 2014, 40(1): 80-85]
Xie W, Meng QS, Wu QJ,etal. Pyrosequencing theBemisiatabacitranscriptome reveals a highly diverse bacterial community and a robust system for insecticide resistance[J].PLoSONE, 2012, 7(4): e35181.
Xu Y, Zhou W, Zhou Y,etal.Transcriptome and comparative gene expression analysis ofSogatellafurcifera(Horvath) in response to southern rice black-streaked dwarf virus[J].PLoSONE, 2012, 7(4): e36238.
Yang GJ, Yong HL, Wang XP.The biological characters and behavior ofEucryptorrhynchuschinensis[J].ChineseBulletinofEntomology, 2008, 45(1): 65-69.[楊貴軍,雍惠莉,王新譜.溝眶象的生物學特性及行為觀察[J].昆蟲知識, 2008, 45(1): 65-69]
Yang H, Chen Q, Wei ZL,etal.Analysis on SSR information inCamelliasinensistranscriptome[J].JournalofAnhuiAgriculturalUniversity,2011,38:882-886.[楊華,陳琪,韋朝領,等.茶樹轉錄組中SSR位點的信息分析[J].安徽農業(yè)大學學報,2011,38:882-886]
Yuan Y, Zhang LF, Wu GX,etal. High-throughput discovery microsatellites inTomicusyunnanenss(Coleoptera: Scolytonae)[J].JournalofEnvironmentalEntomology,2014,36(2):166-170.[袁遠,張麗芳,吳國星,等.云南切梢小蠹微衛(wèi)星的高通量發(fā)掘[J].環(huán)境昆蟲學報, 2014,36(2):166-170]
Zhu JY, Li YH, Yang S,etal.De novo assembly and characterization of the gobal transcriptome forRhyacionialeptotubulausing Illumina paired-end sequencing[J].PLoSONE, 2013, 8(11): e81096.
Zhu JY,Wu GX,Yang B.High-throughput discovery of SSR genetic markers in the yellow mealworm beetle,Tenebriomolitor(Coleoptera: Tenebrionidae), from its transcriptome database[J].ActaEntomologicaSinica,2013,56(7):724-728.
Characteristic analysis of microsatellite inEucryptorrhynchuschinensistranscriptome
WU Zheng-Mei, GAO Peng, WEN Jun-Bao*
(Beijing Key Laboratory for Forest Pest Control, Beijing Forestry University, Beijing 100083, China)
According to the constructed transcriptome database ofEucryptorrhynchuschinensis, the microsatellites have been explored at a high-throughput scale by using Micro Satellite identification tool. The microsatellites in the unigenes (the length ≥1 kb) (17590, 26.89%) were analyzed and a total of 1823 SSR were identified in 1665 unigenes, with one SSR per 32.52 kb. Tri-nucleotide repeats were the most abundant (637, 34.94%), followed by mono nucleotide repeats (576, 31.60%). Among all the 104 SSR motifs, (A/T) n was the most frequent repeat motif (30.39%), followed by (AT/AT) n (6.91%). The average length of microsatellites was 15.74 bp, the microsatellites over 20 bp were only 12.70%.There was significant negative correlation (P<0.01) between the frequency and the length of microsatellites ine.chinensistranscriptome and the correlation coefficient was -0.572. These results lay a foundation for developing high polymorphic microsatellites to research the functional genomics, population genetic structure and genetic diversity ofe.chinensis.
Eucryptorrhynchuschinensis; microsatellite; transcriptome; repeat type; repeat motif
林業(yè)公益性行業(yè)科研專項(201304412;201204501)
武政梅,女,1991年生,山東泰安人,碩士,研究方向為昆蟲分子生物學,E-mail: zhengmeibest@163.com
*通訊作者Author for correspondence, E-mail:wenjb@bjfu.edu.cn
Received:2015-10-29;接受日期Accepted:2015-12-29
Q965;S433.5
A
1674-0858(2016)05-0979-05