方治偉,李論
(江漢大學(xué),湖北武漢430056)
SSR(Simple Sequence Repeats)又稱作微衛(wèi)星序列、簡單重復(fù)序列,是一類廣泛存在于真核及原核生物體內(nèi)的一種具有高多態(tài)性的DNA片段,一般包含一個長度為1~6bp不等的重復(fù)單元,重復(fù)次數(shù)不等。由于SSR的等位基因型眾多,且在基因組上廣泛分布,并且具有分散度高、多態(tài)性良好的特點[1-3],因此被大量用于遺傳圖譜構(gòu)建、基因定位、指紋圖分析以及多樣性評價等研究中[4-7]。SSR兩側(cè)區(qū)域相對較為保守,因此可以在側(cè)翼區(qū)域設(shè)計特異性擴增引物,并通過常規(guī)的PCR擴增對其進行檢測,并基于擴增產(chǎn)物對其進行分型。本文總結(jié)了目前的常見分型方法以及分型難點,并對最新的分型技術(shù)進行解析。
SSR高度多態(tài)性是DNA復(fù)制過程中DNA聚合酶的滑脫造成的,這種滑脫會造成重復(fù)次數(shù)的增加或減少,從而產(chǎn)生與模板不同長度的擴增子序列[8-9]。SSR長度、重復(fù)次數(shù)以及重復(fù)單元的堿基組成均可影響滑脫的形成,且三堿基重復(fù)單元和四堿基重復(fù)單元的滑脫率低于二堿基重復(fù)單元的滑脫率[10],這種滑脫現(xiàn)象在體外PCR過程中同樣存在。由于目前所有的SSR分型技術(shù)都是在提取基因組總DNA后采用特異的引物擴增目標SSR位點,然后基于擴增產(chǎn)物做SSR分型,因而DNA聚合酶滑脫的影響無處不在[11-13]。PCR-free文庫可以大幅度減少滑脫的影響。在一次PCR反應(yīng)中,DNA聚合酶即可以滑脫一個重復(fù)單元,也可以滑脫多個重復(fù)單元。因此PCR擴增造成的虛假SSR基因型與模板真實基因型一起形成具有連續(xù)長度差異的PCR產(chǎn)物。若PCR滑脫率過高,則會使真實的基因型僅占PCR總產(chǎn)物的一小部分,從而無法準確鑒定目標SSR的真實基因型。目前已有的研究認為,SSR重復(fù)單元的長度、堿基組成、DNA聚合酶的保真性以及PCR反應(yīng)體系中的離子濃度均可影響滑脫的嚴重程度[14]。
早期的SSR分型技術(shù)多是基于凝膠電泳開展,包括瓊脂糖電泳[15]、聚丙烯酰胺凝膠電泳以及毛細管電泳[16],這些方法通過檢測PCR產(chǎn)物的大小來確定目標SSR位點的長度信息。這些方法的優(yōu)點是操作簡單、便捷,對實驗儀器和實驗操作的要求低。理論上,聚丙烯酰胺凝膠電泳、毛細管電泳可以給出相對具體的SSR位點的長度信息,且誤差較小,分型的準確性相對很高,因而是目前廣泛采用的分型方法,如小麥、玉米、大豆等基因組上SSR標記位點的開發(fā)等[17-19]?;陔娪镜姆椒ǚ中蜁r有兩個問題無法避免:(1)凝膠電泳的方法無法獲得絕對的長度信息;(2)由于凝膠電泳的分辨率較低,因而當同一個SSR位點在兩個樣品間的差異較小時(如僅差一個2堿基重復(fù)單元),則電泳方法可能無法準確鑒定出該差異。由于無法排除DNA聚合酶滑脫的影響,因此也不能用于雜合位點的SSR分型。
作為經(jīng)典的第一代測序方法,Sanger測序是目前所有測序技術(shù)中準確性最高的一種方法,常常被用于高通量測序發(fā)現(xiàn)的變異位點的驗證,被稱作測序的金標準[20]。Sanger法采用邊合成邊測序的方法,通過熒光信號測定DNA上的每個堿基,由于反應(yīng)體系中的每個堿基都是被3’端修飾的,因而在PCR反應(yīng)中一次只能引入一個堿基,因而低復(fù)雜序列的測序準確性依然很高,因而也非常適用于SSR的測序[21]。該方法雖然準確性很高,但通量低、成本高,需要先挑選出單克隆的菌落,且難以進行大規(guī)模的SSR分型。且當滑脫率較高時,測得序列有可能是DNA聚合酶滑脫造成的虛假類型。
目前二代測序通過對同一個位點的多次覆蓋來保證測序的準確性,目前已知的測序錯誤率僅為1%[22]。隨著測序技術(shù)的不斷發(fā)展,測序成本不斷下降,測序通量大幅度提高,測序周期大幅度縮短,因而其應(yīng)用范圍不斷拓寬,并被用于基因組水平的SSR鑒定和開發(fā)中。目前,已有多個物種的SSR標記位點被開發(fā)出來,包括大麥、橡膠樹等[23-24]。隨著海量基因組測序數(shù)據(jù)不斷被公布,新的SSR鑒定和分型方法也被開發(fā)出來[10]。Carlson等報道了一種在全基因組水平上鑒定SSR的方法,且可鑒定出復(fù)合SSR位點。Gymrek等開發(fā)了一種基于短reads測序鑒定SSR的方法,該方法還可用于雜合位點的判斷[25]。目前,全基因組測序的方法更多的是用于SSR標記的開發(fā),以及全基因組水平SNP等變異的分析中,在基于SSR位點開展的樣品間差異分析中報道較少。
多重PCR技術(shù)的發(fā)展使得一次擴增多個靶位點成為可能。而擴增子測序技術(shù)的發(fā)展使得大規(guī)模高通量的SSR分型成為可能。目前,擴增子測序技術(shù)被大量用于遺傳病篩查、基因診斷等研究中[26-27]。最近,李論等采用多重PCR技術(shù)和擴增子測序技術(shù)相結(jié)合的方法,實現(xiàn)了對8個水稻品種中3000個SSR位點快速準確分型,并開發(fā)出了一套名為AMP-SSR的軟件用于高通量SSR分型的研究[28]。該方法首先在全基因組水平篩選候選的SSR分子標記位點,然后提交到網(wǎng)站做多重PCR引物的設(shè)計和合成。提取基因組總DNA后進行多重PCR的擴增并構(gòu)建測序文庫。采用S5等高通量測序儀完成DNA測序后,結(jié)合生物學(xué)信息分析技術(shù)對每個擴增位點做SSR分型。這一研究大大突破了傳統(tǒng)分型方法的局限,并在單堿基水平上實現(xiàn)了對SSR的大規(guī)模分型,且具有快速,準確,低成本的優(yōu)勢,有望在遺傳多樣性研究,高精準的基因定位以及新品種的分子輔助選育方面廣泛應(yīng)用;同時,在水稻新品種審定、種子執(zhí)法等需要對大量樣品做快速準確篩查的場合中將更具優(yōu)勢。同時該研究還比較了Illumina的MiSeq測序平臺和ptoton的S5測序平臺分型的準確性,證明其有很好的平臺間的擴展性。
SSR分型技術(shù)的發(fā)展經(jīng)歷了最初的凝膠電泳、毛細管電泳、一代測序、二代測序以及高通量擴增子測序階段,雖然基于電泳的分型方法依然是SSR分型領(lǐng)域的主流,但新技術(shù)的不斷涌現(xiàn)將大大提高SSR分型的準確性和速度,擴增子測序技術(shù)以其高通量、高準確性、方便快捷的特點必將成為SSR分型的主流方法,這也將大大促進SSR的理論和應(yīng)用研究。
[1]劉秀云,李慧,劉志國,等.基于SSR標記的255個棗品種親緣關(guān)系和群體遺傳結(jié)構(gòu)分析[J].中國農(nóng)業(yè)科學(xué),2016,49(14):2772-2791.
[2]王東東,李良秋,馬連營.大型真菌中SSR分子標記的開發(fā)與應(yīng)用[J].微生物學(xué)通報,2013,40(4):646-654.
[3]鄭永勝,張晗,王東建,等.基于熒光檢測技術(shù)的小麥品種SSR鑒定體系的建立[J].中國農(nóng)業(yè)科學(xué),2014,47(19):3725-3735.
[4]Kaur S,Panesar PS,Bera MB,et al.Simple Sequence Repeat Markers in Genetic Divergence and Marker-Assisted Selection of Rice Cultivars: AReview[J].Critical Reviews in Food Science and Nutrition,2015,55(1):41-49.
[5]Jarne P,Lagoda PJ.Microsatellites,from Molecules to Populations and Back[J].Trends in ecology & evolution,1996,11(10):424-429.
[6]Kim KS,Sappington TW.Microsatellite Data Analysis for PopulationGenetics[J].Methods in Molecular Biology,2013,1006:271-295.
[7]Chambers GK,Curtis C,Millar CD,et al.DNA Fingerprinting in Zoology: Past,Present,Future[J].Investigative genetics,2014,5(1):3.
[8]Ellegren H.Microsatellites: Simple Sequences with Complex Evolution[J].Nat Rev Genet,2004,5(6):435-445.
[9]Wang DY,Chang CW,Lagacé RE,et al.Development and Validation of the AmpFSTR Identifiler Direct PCR Amplification Kit: a Multiplex Assay for the Direct Amplification of Single Source Samples[J].Journal of Forensic Sciences,2011,56(4):835-845.
[10]Fungtammasan A,Ananda G,Hile SE,et al.Accurate Typing of Short Tandem Repeats from Genome-wide Sequencing Data and its Applications[J].Genome Res,2015,25(5):736-749.
[11]Hosseinzadeh-Colagar A,Haghighatnia MJ,Amiri Z,et al.Microsatellite (SSR) Amplification by PCR Usually Led to Polymorphic Bands: Evidence which Shows Replication Slippage Occurs in Extend or Nascent DNA Strands[J].Molecular Biology Research Communicatio ns,2016,5(3):167-174.
[12]Castillo-Lizardo M,Henneke G,Viguera E.Replication Slippage of the thermophilic DNA polymerases B and D from the Euryarchaeota Pyrococcus abyssi[J].Front Microbiol,2014,5(403):403.
[13]Ananda G,Walsh E,Jacob KD,et al.Distinct Mutational Behaviors Differentiate Short Tandem Repeats from Microsatellites in the Human Genome[J].Genome Biol Evol,2013,5(3):606-620.
[14]Carlson KD,Sudmant PH,Press MO,et al.MIPSTR: a Method for Multiplex Genotyping of Germline and SomaticSTRVariation across many Individuals[J].Genome Res,2015,25(5):750.
[15]付濤,胡仲義,何月秋,等.鐵皮石斛EST-SSR分子標記的開發(fā)[J].核農(nóng)學(xué)報,2017,31(4):663-670.
[16]張俊,潘兆娥,張亞楠,等.棉花SSR-PCR過程中聚丙烯酰胺凝膠電泳操作常見問題的解決與優(yōu)化[J].中國棉花,2016(2):10-13.
[17]李勇,牛永春.基于瓊脂糖凝膠電泳的小麥SSR擴增體系優(yōu)化[J].華北農(nóng)學(xué)報,2009,24(6):174-177.
[18]胡德分,胡曉莉,楊紹林,等.云南84個玉米雜交種的SSR遺傳多樣性分析[J].西南農(nóng)業(yè)學(xué)報,2017,30(7):1488-1494.
[19]于妍,劉芳,劉艷,等.大豆遺傳多樣性SSR分析[J].江西農(nóng)業(yè),2017(21):118.
[20]付春鵬.DNA測序技術(shù)概述[J].生物學(xué)教學(xué),2017,42(11):3-5.
[21]張小珍,尤崇革.下一代基因測序技術(shù)新進展[J].蘭州大學(xué)學(xué)報(醫(yī)學(xué)版),2016,42(3):73-80.
[22]張丁予,章婷曦,王國祥.第二代測序技術(shù)的發(fā)展及應(yīng)用[J].環(huán)境科學(xué)與技術(shù),2016,39(9):96-102.
[23]Jo W S,Kim H Y,Kim K M.Development and Characterization of Polymorphic EST based SSR Markers in Barley (Hordeum vulgare)[J].Biotech,2017,7(4):265.
[24]Hou B,Feng S,Wu Y.Systemic Identification of Hevea Brasiliensis EST-SSR Markers and Primer Screening[J].Journal of Nucleic Acids,2017(4):1-9.
[25]Gymrek M,Golan D,Rosset S,et al.lobSTR: A Short TandemRepeatProfiler for Personal Genomes[J].Genome Res,2012,22(6):1154-1162.
[26]Liu D,Hu X,Jiang X,et al.Characterization of a Novel SplicingMutation in UNC13D Gene through Amplicon Sequencing: a Case Report on HLH[J].BMC Mmedical Ggenetics,2017,18(1):135.
[27]Lindsey RL,Garcia-Toledo L,Fasulo D,et al.Multiplex polymerase chain reaction for identification of Escherichia coli,Escherichia albertii and Escherichia fergusonii[J].Journal of Microbiological Methods,2017,140:1-4.
[28]Li L,Fang ZW,Zhou JF,et al.An Accurate and Efficient Method for large-scale SSR Genotyping and Applications[J].Nucleic Acids Research,2017,45(10):e88.