田尊哲 高慶波 陳世龍 張發(fā)起*
(1.中國科學院高原生物適應(yīng)與進化重點實驗室,中國科學院西北高原生物研究所,西寧 810001; 2.中國科學院大學,北京 100039)
基于高通量測序分析青藏高原特有植物藍玉簪龍膽(Gentianaveitchiorum)的SSR和SNP特征
田尊哲1,2高慶波1陳世龍1張發(fā)起1*
(1.中國科學院高原生物適應(yīng)與進化重點實驗室,中國科學院西北高原生物研究所,西寧 810001;2.中國科學院大學,北京 100039)
利用Illumina HiSeqTM2500平臺對青海省庫澤縣的藍玉簪龍膽(Gentianaveitchiorum)進行高通量測序,共得到SSR序列8 588條,對其SSR重復類型進行分析;三核苷酸重復類型所占的比例最大占54.7%(4696);其次是二核苷酸重復類型占41.3%(3543);四核苷酸重復類型,五核苷酸重復類型和六核苷酸重復類型所占的比例較少(共占4%)。在二核苷酸重復類型中AT/TA重復類型所占的比例最大分別為9.85%和9.5%。在微衛(wèi)星中重復單元的長度大小和重復次數(shù)成負相關(guān),并且微衛(wèi)星的總長度與重復單元的長度成正相關(guān)。在藍玉簪龍膽的花(GP-F)和葉(GP-L)中分別得到253 789和249 417個SNP位點,其中在非編碼區(qū)上的比例為51.29%和51.96%。分析發(fā)現(xiàn)藍玉簪龍膽SNP位點在編碼區(qū)中同義轉(zhuǎn)換所占的比例(48.63%和47.96%)要遠遠高于非同義轉(zhuǎn)換的比例(0.08%和0.08%),可能與功能基因序列相對穩(wěn)定有關(guān)。
藍玉簪龍膽;高通量測序;微衛(wèi)星;單核苷酸多態(tài)性;青藏高原
青藏高原(Qinghai-Tibetan Plateau)是世界上海拔最高的高原,平均海拔達到4 500 m,面積達到2.5×106km2,被譽為“世界屋脊”、“地球的第三極”[1]。藍玉簪龍膽(GentianaveitchiorumHemsl.)為龍膽科(Gentianaceae)龍膽屬(Gentiana)的多年生草本植物,在青藏高原地區(qū)廣泛分布,高5~10 cm,營養(yǎng)葉和繁殖葉異型。龍膽花主要含有裂環(huán)環(huán)烯醚類活性成分,如:落甘酸、獐芽菜苦苷、龍膽苦苷和獐牙菜苷等,其葉具有清濕熱、瀉肝膽濕火、鎮(zhèn)咳利喉健胃的功能,主治感冒發(fā)燒目赤咽痛肺熱咳嗽等[2]。對藍玉簪龍膽的研究主要集中在化學成分以及藥效等方面[3~5],而在分子遺傳等方面研究較少。青藏高原的溫度從1960年就開始升高,這比中國其他地方的地區(qū)都要早[7~8],并且在過去的50年中,青藏高原每十年溫度就要增高0.3℃,比中國其他地區(qū)的溫度都要上升的快[5]。青藏高原的環(huán)境變化對生物多樣性有了很大的影響,為了更加深入的挖掘藍玉簪龍膽資源和建立完善的種質(zhì)資源評估和保護系統(tǒng),因此很有必要開展藍玉簪龍膽的遺傳多樣性研究。
近年來,隨著分子技術(shù)的快速發(fā)展,尤其是第二代微衛(wèi)星標記和第三代單核苷酸標記在探究生物群體內(nèi)和群體間遺傳變異及種間關(guān)系和遺傳育種等研究中所凸顯的優(yōu)越性,使的其運用范圍越來越廣。微衛(wèi)星,又稱簡單重復序列標記(simple sequence repeats,SSRs),是一類由幾個核苷酸(2~6個)為重復單位組成的長達幾十個核苷酸的重復序列,長度較短,且廣泛分布于真核生物的基因組中,具有數(shù)量多,分布廣且均勻,高度多樣性,分析快速方便等優(yōu)點[9~12]。此外,微衛(wèi)星序列在群體中通常具有很高的多態(tài)性,而且一般為共顯性,這些特點使得微衛(wèi)星標記成為分子遺傳研究中使用最為廣泛的遺傳標記之一。
單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)是指一物種不同個體在基因組水平上有單個核苷酸變異引起的DNA序列多態(tài)性,通常被認為是變異在頻率大于1%時稱為SNP[13]。SNP一般只涉及到堿基的轉(zhuǎn)換(Transition)和顛換(Transversion),是許多真核生物中最豐富的遺傳變異方式,具有數(shù)量多,分布廣,突變率低,易實現(xiàn)自動化檢測等優(yōu)點[14]。
本研究以選取采集于青海澤庫藍玉簪龍膽的葉和花開展高通量測序,挖掘藍玉簪龍膽的SSR和SNP信息,并分析其在該物種的特征,為藍玉簪龍膽的遺傳多樣性以及群體遺傳學的研究奠定了分子基礎(chǔ)。
1.1 樣品的采集和高通量測序、拼接
藍玉簪龍膽(G.veitchiorumHemsl;Zhang 2014131)采集于青海省澤庫縣(35°4′N,101°30′E,3 681 m)。采取同一株上的葉片和花后放入液氮中保存,帶回實驗室于-80℃保存。憑證標本保存于中國科學院西北高原生物研究所青藏高原生物標本館(HNWP)。
從藍玉簪龍膽的葉(GP-L)和花(GP-F)中各提取100 μg總RNA;用Nanodrop檢測RNA的純度,用Qubit對RNA濃度進行精確定量,并用Agilent 2100精確檢測RNA的完整性;然后用Oligo(dT)的磁珠富集藍玉簪龍膽的mRNA;隨后加入fragmentation buffer將mRNA打斷成短片段,以mRNA為模板,用六堿基隨機引物(random hexamers)合成一鏈cDNA,然后加入緩沖液、dNTPs和DNA polymeraseⅠ和RNase H合成雙鏈cDNA,再用AMPure XP beads純化雙鏈cDNA。純化的雙鏈cDNA先進行末端修復,加A尾并連接測序接頭,再用AMPure XP beads進行片段大小選擇。最后進行PCR擴增,并用AMPure XP beads純化PCR產(chǎn)物,得到最終的文庫。文庫合格后,把不同文庫按照有效濃度及目標下機數(shù)據(jù)量的需求混池后在Illumina HiSeqTM2500平臺上測序。
對所得的數(shù)據(jù)進行質(zhì)量評估,包括:測序錯誤率分布檢查,A/T/G/C的含量分布檢查,其中對單個堿基位置的錯誤率控制在1%以下,然后對測得的原始測序序列(raw reads)進行過濾:去除帶接頭(adapter)的和N的比例大于10%的reads,并去除低質(zhì)量reads,得到干凈的讀序(clean reads)后,而后用Trinity[15]對得到的clean reads進行拼接以獲取后續(xù)分析的參考序列,并取每條基因中最長的轉(zhuǎn)錄本作為Unigene,以此進行后續(xù)分析。
1.2 SSR和SNP的檢測,篩選和統(tǒng)計分析
基于藍玉簪龍膽轉(zhuǎn)錄組的SSR檢測是以組裝出來的Unigene作為參考序列,采用MicroSatellite(MISA;http://pgra.ipk-gatersleben.de/misa/)對Unigene進行SSR檢測。SSR搜索標準有精確型(perfect)及復合型(compound)的SSR重復單元[16],各重復微衛(wèi)星類型重復次數(shù)設(shè)定為:兩堿基(dinnucleotide repeats,DNRs)至少重復6次,三堿基(trinucleotide repeats,TNRs)至少重復5次,四堿基(tetranucleotide repeats,TTNRs)至少重復5次,五堿基(pentanucleotide repeats,PTNRs)至少重復4次,六堿基(hexanucleotide repeats)至少重復4次。并對藍玉簪龍膽轉(zhuǎn)錄本的不同SSR類型以及SSR類型中密度進行統(tǒng)計分析。
通過samtools和piacard-tools等工具對比對結(jié)果進行染色體坐標排序,去掉重復的reads等處理,最后通過變異檢測軟件GATK2[17]以Unigene為參考序列對resds進行SNP Calling,并對原始結(jié)果進行過濾(過濾掉質(zhì)量值小于30,距離小于5的SNP)。并對得到的SNP位點位于編碼區(qū)或者非編碼區(qū),以及在編碼區(qū)中的同義轉(zhuǎn)換或者非同義轉(zhuǎn)換的SNP數(shù)量進行統(tǒng)計。
2.1 測序產(chǎn)量,質(zhì)控和組裝結(jié)果
隨著高通量測序技術(shù)的發(fā)展及成本的降低,通過高通量測序可以得到海量的序列,但是在RNA-seq技術(shù)中,測序錯誤率會隨著測序序列長度的增加而升高[18~19],在單個堿基位置的測序錯誤率控制在1%以下,在GP-F和GP-L的單堿基錯誤率都為0.03%;在由于測序得到的reads并不都是有效的,里面含有帶接頭的,重復的和測序質(zhì)量低的reads,它們對組裝及后續(xù)分析都會產(chǎn)生影響。在對GP-F和GP-L的轉(zhuǎn)錄本測得的raw reads去除含接頭的、N的比例大于10%的以及低質(zhì)量的reads后。分別得到22 936 570條和22 355 444條clean reads,分別占Raw reads的92.80%和92.59%,在兩個GP-F和GP-L中質(zhì)量值≧20%的堿基數(shù)占總堿基數(shù)的比例分別為95.72%和95.96%,質(zhì)量值≧30%的堿基數(shù)占總堿基數(shù)的比例分別為91.81%和92.14%,堿基G和C含量總和分別為43.23%和42.79%以上。
在對GP-F和GP-L的raw reads進行處理后,我們用組裝軟件Trinity對所得的clean reads進行組裝,對轉(zhuǎn)錄本和Unigene的長度進行統(tǒng)計(圖1),其中在拼接得到的Transcripts中N50為1 424,而N90為314;在拼接得到的Unigene中N50為910,而N90為256。其中拼接的Transcripts和Unigene總的核苷酸數(shù)分別為177 300 983個和85 642 977個。
圖1 拼接后的Unigene與Transcript長度分布圖Fig.1 The length distribution of Unigene and Transcript after assembled
2.2SSR的測序結(jié)果,測序產(chǎn)量、質(zhì)量及組裝結(jié)果分析
在Illumina HiSeqTM2500測序平臺對藍玉簪龍膽測序后,去除Raw reads中含有接頭的,N含量比大于10%的和低質(zhì)量的reads后,用Trinity對clean reads進行拼接。在對Trinity拼接得到的轉(zhuǎn)錄序列為參考序列,取每條基因中最長的轉(zhuǎn)錄本作為Unigene。通過對Unigene進行SSR檢測,共檢測的序列共140 225條,總長度達到85 642 977 bp,共檢測到8 588條SSR序。
通過對SSR類型進行分析發(fā)現(xiàn):雙核苷酸重復類型SSR占41.3%(3 543個),長度以12~24 bp為主;三核苷酸重復類型SSR占54.7%(4 696個),長度以15~24 bp為主;四核苷酸重復類型SSR占3.4%(296個),長度以20~24 bp為主;五核苷酸重復類型和六核苷酸重復類型SSR較少(圖2)。對其進一步統(tǒng)計分析得到二核苷酸重復類型有12種,三核苷酸重復類型有60種,四核苷酸重復類型有92種,五核苷酸重復類型21種,六核苷酸重復類型有32種(圖3)。
圖2 藍玉簪龍膽不同核苷酸重復類型的SSR數(shù)量Fig.2 Number diversification of SSR in nucleotide repeat sequence of G.veitchiorum
圖3 藍玉簪龍膽序列不同長度重復類型微衛(wèi)星長度分布及其變異 每一扇形區(qū)對應(yīng)不同長度微衛(wèi)星所占百分比,上面的值為對應(yīng)的微衛(wèi)星片段長度。Fig.3 Diversification of the microsatellites in G.veitchiorum sequence of nucleotide repeat Each sector represents the percent of ditterent SSR,the number is the lengh of the SSR.
通過對主要的核苷酸重復類型的比較分析發(fā)現(xiàn),在二核苷酸重復類型中,AT/TA重復類型所占比例較高,AC/TG次之;在三核苷酸重復類型中GAA重復類型所占比例較高,AGA/TCT重復類型所占比例次之;四核苷酸重復類型、五核苷酸重復類型、六核苷酸重復類型的數(shù)量相對較少(表1)。
2.3 藍玉簪龍膽的SNP位點特征分析
通過samtools和picard-tools等工具比對GP-F和GP-L結(jié)果進行染色體坐標排序,去掉重復的reads等處理后,以Unigene序列為參考序列,通過變異檢測軟件GATK2進行SNP Calling,并對原始結(jié)果進行過濾,在GP-F和GP-L中分別得到253 789和249 417個SNP位點,其中非編碼區(qū)的SNP位點分別為130 175個和129 593個,編碼區(qū)的SNP位點分別為123 614個和119 824個。其中在CP-F中編碼SNP中,同義轉(zhuǎn)換占48.63%(123 431個)非同義轉(zhuǎn)換占0.08%(201個);在GP-L中的編碼區(qū)的SNP中,同義轉(zhuǎn)換占47.96%(119 620),非同義轉(zhuǎn)換占0.08%(201個;表2)。對其進一步分析,GP-F和GP-L的每個SNP的平均跨度分別為699和711 bp。在GP-F和GP-L中的SNP的位點個數(shù)和跨度出現(xiàn)此差別表明在藍玉簪龍膽在適應(yīng)環(huán)境變化過程中,花的變異量強于葉的變異量,或者可能是由于花所受環(huán)境變化的影響更大。
對藍玉簪龍膽SNP類型分析發(fā)現(xiàn),在GP-F中轉(zhuǎn)換類型占58%(147 198個),顛換類型占42%(110 180個);在GP-L中轉(zhuǎn)換類型占61%(52 144個),顛換類型占39%(97 272個,表3)。其中在GP-F和GP-L中的轉(zhuǎn)換類型明顯高于顛換類型,在GP-F和GP-L中的轉(zhuǎn)換類型中,C<->T發(fā)生頻率較高,這可能與SNPs在CG序列上出現(xiàn)的最為頻繁,而C(胞嘧啶)常以甲基化形式存在,在脫氨后即成為T(胸腺嘧啶)有關(guān)[20],在藍玉簪龍膽的花和葉中的SNPs類型及其發(fā)生頻率趨勢基本一致。
表1主要核苷酸重復序列類型在藍玉簪龍膽序列的百分比
Table1RelativepercentageofSSRsinG.veitchiorumsequences
主要的重復單元Nucleotiderepeatcomposition重復堿基類型NucleotiderepeattypeSSR數(shù)No.ofSSR占總SSR的百分比PercentoftotalSSRs(%)二核苷酸重復DinnucleotiderepeatsAC3203.73AG2472.88AT8469.85CA2032.36CT1511.76GA1872.18GT2412.81TA8159.50TC2002.33TG3273.81三核苷酸重復TrinucleotiderepeatsAAC1011.18AAG1611.87AAT1181.37AGA1541.79ATC1031.20CAA1001.16CCA1091.27GGA1071.25GGT1411.64TCA1211.41TCT1531.78TGA1081.26TGG1221.42TTC1611.87TTG1291.50
表2高通量測序鑒定的藍玉簪龍膽的SNPs類型分類
Table2IdentifiedtheSNPstypeofG.veitchiorumbyhigh-throughputsequencing
樣品Sample總的SNP位點數(shù)Totalno.ofSNP非編碼區(qū)SNPNo?codingSNP編碼區(qū)SNPCodingSNP同義轉(zhuǎn)換Synonymoustransition非同義轉(zhuǎn)換NonsynonymoustransitionGP?F253789(100%)130175(51.29%)123614(48.71%)123413(48.63%)201(0.08%)GP?L249417(100%)129593(51.96%)119824(48.04%)119620(47.96%)201(0.08%)
表3高通量測序鑒定的藍玉簪龍膽SNPs類型分析
Table3AnalysistheSNPstypeofG.veitchiorumbyhigh-throughputsequencing
樣品SampleSNP類型SNPtype數(shù)量NumberSNP類型SNPtype數(shù)量NumberGP?F轉(zhuǎn)換transition顛換transversionA<->G73590A<->T37596C<->T73608G<->T21064——C<->G14974——A<->C36546合計147198(58%)合計110180(42%)GP?LA<->G77319A<->T34918C<->T74825G<->T22448——C<->G16960——A<->C22946合計152144(61%)合計97272(39%)
通過Illumina HiSeqTM2500測序平臺對藍玉簪龍膽轉(zhuǎn)錄組測序共得到8 588條SSR序列,平均跨度為9 973 bp,在藍玉簪龍膽基因組中的SSR類型中,三核苷酸重復類型所占的比例最大(54.7%),其次是二核苷酸重復類型(41.3%),而在同屬于龍膽亞族的川西獐牙菜(Swertiamussotii)的SSR的平均跨度為12.6 kB,在SSR重復類型中三堿基重復所占的比例為45.99%,二堿基重復類型所占的比例為41.62%[21]。其中三堿基重復類型的比例相差比較大,此結(jié)果說明即使在同一亞族中不同屬之間的SSR類型分布比例也有很大的區(qū)別。
在二、三堿基重復類型中占比例最高的堿基重復類型分別是AT/TA和AAG/TTC,在川西獐牙菜中二、三堿基重復類型中比例最高的堿基重復類型分別為AT/TA和AAT/TTA[21],但是在唐古特紅景天(Rhodiolaalgida)中的二堿基重復類型中比例較高的堿基重復類型為AG/GA和TC/CT,三堿基重復類型中各個重復類型所占的比例較均勻[22]。藍玉簪龍膽中二、三堿基重復類型比例較高的重復類型與紅景天的差別比較大,而與川西獐牙菜的差別沒那么大,這可能與不同植物之間的親緣關(guān)系有關(guān)。對藍玉簪龍膽的微衛(wèi)星長度進行分析可以得出,在微衛(wèi)星中重復單元的長度大小和重復次數(shù)成負相關(guān),并且微衛(wèi)星的總長度與重復單元的長度成正相關(guān)。
通過對藍玉簪龍膽的SNP的分析發(fā)現(xiàn),GP-F含有253 789個SNPs位點,平均跨度699 bp,GP-L含有SNPs 249 417個,平均跨度711 bp,這比青楊(Populuscathayana,1/29 332 bp)的分布密度要高,這可能與物種、測序數(shù)量、SNP分布的不均一性有關(guān)[23]。藍玉簪龍膽的SNP位點在非編碼區(qū)所占的比例要比在編碼區(qū)的比例高一些,和以往的研究結(jié)果一致[24~25],可能是由于進化的原因和自然選擇所致。藍玉簪龍膽的SNP位點在編碼區(qū)中同義變換所占的比例(48.63%和47.96%)要遠遠大于非同義變換的比例(0.08%和0.08%),可能是由于功能基因序列相對穩(wěn)定所造成的。
綜上所述,我們在高通量轉(zhuǎn)錄組測序的基礎(chǔ)下,充分挖掘了藍玉簪龍膽SSR、SNP信息,為構(gòu)建藍玉簪龍膽遺傳學圖譜以及譜系地理學研究提供了多方面的分子基礎(chǔ);該研究所獲得SSR以及SNP分子標記,還為以后龍膽屬植物的生物多樣性研究以及保護生物學的研究提供了基礎(chǔ)。
1.Zheng D.The system of physico-geographical regions of the Qinghai-Xizang(Tibet) Plateau[J].Science in China(Series D),1996,39(4):410-417.
2.楊紅澎,確生,吳錫冬,等.藍玉簪龍膽中苷類成分的研究[J].中國中藥雜志,2008,33(21):2505-2507.
Yang H P,Que S,Wu X D,et al.Studies on glycosides fromGentianaveitchiorum[J].China Journal of Chinese Materia Medica,2008,33(21):2505-2507.
3.Faver A,Yuan Y M,Küpfer P,et al.Phylogeny of subtribeGentianinae(Gentianaceae):biogeographic inferences despite limitations in temporal calibration points[J].Taxon,2010,59(6):1701-1711.
4.Zhang Z F,Yuan L,Lu L Y,et al.Hepatoprotective activity ofGentianaveitchiorumHemsl.against carbon tetrachloride-induced hepatotoxicity in mice[J].Chinese Journal of Natural Medicines,2014,12(7):488-494.
5.Mishiba K I,Yamane K,Nakatsuka T,et al.Genetic relationships in the genusGentianabased on chloroplast DNA sequence data and nuclear DNA content[J].Breeding Science,2009,59(2):119-127.
6.Feng S,Tang M C,Wang D M.New evidence for the Qinghai-Xizang(Tibet) Plateau as a pilot region of climatic fluctuation in China[J].Chinese Science Bulletin,1998,43(20):1745-1749.
7.蔡英,李棟梁,湯懋蒼,等.青藏高原近50年來氣溫的年代際變化[J].高原氣象,2003,22(5):464-470.
Cai Y,Li D L,Tang M C,et al.Decadal temperature changes over Qinghai-Xizang Plateau in recent 50 years[J].Plateau Meteorology,2003,22(5):464-470.
8.Piao S L,Ciais P,Huang Y,et al.The impacts of climate change on water resources and agriculture in China[J].Nature,2010,467(7311):43-51.
9.Ellegren H.Microsatellites:simple sequences with complex evolution[J].Nature Reviews Genetics,2004,5(6):435-445.
10.Goldstein D B,Schlotterer C.Microsatellites:evolution and applications[M].Oxford,Enland:Oxford University Press,1999.
11.Wright J M,Bentzen P.Microsatellites:genetic markers for the future[M].Carvalho G R,Pitcher T J.Molecular genetics in fisheries.Netherlands:Springer,1995:117-121.
12.Zane L,Bargelloni L,Patarnello T.Strategies for microsatellite isolation:a review[J].Molecular Ecology,2002,11(1):1-16.
13.Vignal A,Milan D,Sancristobal M,et al.A review on SNP and other types of molecular markers and their use in animal genetics[J].Genetics Selection Evolution,2002,34(3):275-305.
14.Morin P A,Luikart G,Wayne R K,et al.SNPs in ecology,evolution and conservation[J].Trends in Ecology & Evolution,2004,19(4):208-216.
15.Grabherr M G,Haas B J,Yassour M,et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology,2011,29(7):644-652.
16.Li S X,Yin T M.Map and analysis of microsatellites in the genome ofPopulus:the first sequenced perennial plant[J].Science in China Series C:Life Sciences,2007,50(5):690-699.
17.Mckenna A,Hanna M,Banks E,et al.The genome analysis toolkit:a Map Reduce framework for analyzing next-generation DNA sequencing data[J].Genome Research,2010,20(9):1297-1303.
18.Erlich Y,Mitra P P,Delabastide M,et al.Alta-Cyclic:a self-optimizing base caller for next-generation sequencing[J].Nature Methods,2008,5(8):679-682.
19.Jiang L H,Schlesinger F,Davis C A,et al.Synthetic spike-in standards for RNA-seq experiments[J].Genome Research,2011,21(9):1543-1551.
20.Brookes A J.The essence of SNPs[J].Gene,1999,234(2):177-186.
21.劉越,岳春江,王翊,等.藏茵陳川西獐牙菜轉(zhuǎn)錄組SSR信息分析[J].中國中藥雜志,2015,40(11):2068-2076.
Liu Y,Yue C J,Wang Y,et al.Data mining of simple sequence repeats in transcriptome sequences of Tibetan medicinal plant ZangyinchenSwertiamussotii[J].China Journal of Chinese Materia Medica,2015,40(11):2068-2076.
22.雷淑蕓,高慶波,付鵬程,等.基于Solexa高通量測序的唐古特紅景天(Rhodiolaalgida)微衛(wèi)星信息分析[J].植物研究,2014,34(6):829-834.
Lei S Y,Gao Q B,Fu P C,et al.Analysis on Microsatellites inRhodiolaalgidaBased on Solexa Sequencing[J].Bulletin of Botanical Research,2014,34(6):829-834.
23.雷淑云,張發(fā)起,Gulzar K,等.利用高通量測序分析青藏高原地區(qū)青楊的SSR和SNP特征[J].林業(yè)科學研究,2015,28(1):37-43.
Lei S Y,Zhang F Q,Khan G,et al.Characteristic analysis of SSR and SNP inPopuluscathayanaon Qinghai-Tibetan Plateau by High-Throughput Sequencing[J].Forest Research,2015,28(1):37-43.
24.Lijavetzky D,Cabezas J,Ibáez A,et al.High throughput SNP discovery and genotyping in grapevine(VitisviniferaL.) by combining a re-sequencing approach and SNPlex technology[J].BMC Genomics,2007,8(1):424-435.
25.An C F,Saha S,Jenkins J N,et al.Cotton(Gossypiumspp.) R2R3-MYB transcription factors SNP identification,phylogenomic characterization,chromosome localization,and linkage mapping[J].Theoretical and Applied Genetics,2008,116(7):1015-1026.
National Natural Science Foundation of China(31400322);International S&T cooperation projects of Qinghai Province(2014-HZ-812)
introduction:TIAN Zun-Zhe(1989—),male,master degree,mainly engaged in the research of plant genetic diversity.
date:2016-03-31
CharacteristicsofSSRandSNPinGentianaveitchioruminQinghai-TibetanPlateau,byHigh-throughputSequencing
TIAN Zun-Zhe1,2GAO Qing-Bo1CHEN Shi-Long1ZHANG Fa-Qi1*
(1.Key laboratory of Adaption and Evolution of Plateau Biota,Northwest Institute of Plateau Biology,Chinese Academy of Sciences,Xining 810001;2.University of Chinese Academy of Sciences,Beijing 100039)
We used the next generation sequencing(NGS) to capture the SSR and SNP marker inGentianaveitchiorum, sampled in Zeku, Qinghai Province. A total of 8588 simple sequence repeats were generated through lumina HiSeqTM2500. The dinucletide repeats were the highest(54.7%), followed by the trinucleotide repeats(41.3%). A proportion of tetranucletide, pentanucleotide and hexanucleotide repeats was less, which is 4% in total. In dinucleotide repeats, AT/TA repeats were the dominated ones, 9.85% and 9.5%, respectively. The length of nucleotide repeat and number of repeat were negative correlation, while there was a positive correlation between the total length of SSR sequences and the length of nucleotide repeat. A total of 253 789 and 249 417 SNPs were indenfied in GP-F and GP-L ofG.veitchiorum. The proportion of the SNPs located in the noncoding region were 51.29% and 51.96%, respectively. The proportion of synonymous transition(48.63% and 47.96%) in coding region was significantly higher than that of nonsynonymous transition(0.08% and 0.08%), which might be caused by relatively conservative domains of functional genes.
Gentianaveitchiorum;next generation sequencing;SSR;SNP;Qinghai-Tibetan Plateau
國家自然科學基金(31400322);青海省國際科技合作項目(2014-HZ-812)
田尊哲(1989—),男,碩士研究生,主要從事植物遺傳多樣性學研究。
* 通信作者:E-mail:fqzhang@nwipb.cas.cn
2016-03-31
* Corresponding author:E-mail:fqzhang@nwipb.cas.cn
Q949.776.4
A
10.7525/j.issn.1673-5102.2016.05.016