郭萌萌 周延清 段紅英 楊珂 邵露營
(河南師范大學生命科學學院,新鄉(xiāng) 453007)
地黃是我國常用中藥材之一,它是玄參科地黃屬多年生草本植物,地黃根作為藥材,具有顯著的藥用效果,是多種中成藥的成分之一,具有很高的經濟價值[1]。但是,市場上流通的地黃來源雜亂,品質不一,且不同品種間藥用成分差異較大[2]。所以,應采取有效的方法鑒定優(yōu)良種質的地黃品種。
DNA分子標記技術是基因定位克隆,遺傳圖譜構建等研究工作的重要工具,目前已廣泛應用于作物分子輔助育種及種質資源多樣性分析等領域[3-4],特別是單核苷酸多態(tài)性研究備受關注。單核苷酸SNP是單個核苷酸變異而產生的DNA水平上的多態(tài)性。SNP是大多數基因組中最豐富和穩(wěn)定的遺傳變異形式,多態(tài)性高,數量多,已成為植物分子輔助育種的主要分子標記之一[5]。
基于轉錄組測序能夠大規(guī)模的挖掘SNP位點。在植物中的應用也十分廣泛,候莉娟等[6]在實驗室已有轉錄組數據的基礎上,挖掘了大量羊草的SNP對羊草種質進行分型;周軍永等[7]以李府貢棗不同處理棗果實的轉錄組序列為基礎,分析了轉錄組數據中SNP位點的分布,為棗的遺傳結構和遺傳分化奠定了基礎。Wu等[8]基于銀杏轉錄組測序收集并驗證SNP位點,并分析群體遺傳多樣性,為銀杏的遺傳和基因組研究提供了有用資源。
目前,利用SNP分子標記技術探討地黃種屬親緣關系及品種鑒定的研究很少,本研究利用RNA-seq 技術,對85-5地黃新鮮塊根進行轉錄組測序,根據測序數據與NCBI中SRA數據庫中的3個地黃數據比對,利用Samtools(http://samtools.sourceforge.net/) 和 VarScan v.2.2.7(http://varscan.sourceforge.net/)軟件尋找候選SNP。針對候選SNP位點設計引物,選擇能夠擴增出單一目的條帶的引物,對地黃28個品種間擴增,旨為地黃遺傳多樣性分析和品種鑒定奠定基礎。
實驗用地黃種質收集于河南 4 個市縣、山東 2 個區(qū)縣和上海華東師范大學,包括裂葉地黃(Rehmannia piasezkii)和地黃(Rehmannia glutinosa)這2個種,共 28 份種質。均經過ITS測序與NCBI比對,確定為裂葉地黃或地黃種質[9](表1)。
實驗用 Taq Master Mix 由北京康為世紀生物科技有限公司合成,具有穩(wěn)定性好、靈敏度高、快速簡便、特異性強等優(yōu)點。
SNP引物Primer軟件設計后于英濰捷基(上海)貿易有限公司合成。
表1 地黃樣本信息
1.2.1 挖掘SNP位點 根據實驗室前期得到的地黃轉錄組數據,將其與在NCBI數據庫上下載的3個轉錄組數據庫,下載的轉錄組數據測序數據分別是由河南農業(yè)大學上傳的SRR444423.sra 數據量為485 M;河南農業(yè)大學上傳SRR832972.sra 數據量2.1 G;藥用植物研究所上傳的SRR832973.sra數據量2.1 G。然后通過格式轉換之后,以這3個組裝好的轉錄本為模板序列,將原始序列與其進行比對,利 用 Samtools(http://samtools.sourceforge.net/) 和VarScan v.2.2.7(http://varscan.sourceforge.net/) 軟件尋找候選SNP。
1.2.2 設計SNP引物 根據挖掘到的候選SNP位點,利用Primer軟件設計引物。在SNP位點的上下游分別設計正向引物和反向引物,理想引物的長度為18-24 bp,Tm值為50-60℃,能保證上下游引物的Tm值一般不超過2℃;引物序列的GC 含量一般為40%-60%,過高或過低都不利于引發(fā)反應,上下游引物的GC含量不能相差太大。
1.2.3 篩選SNP引物 通過PCR來驗證SNP引物。設計的SNP引物,需要確保能擴增出單一、明亮的條帶。PCR擴增反應體系為20 μL,包含6 μL的dd H2O,1 μL 的模板 DNA,1 μL 上游引物,1 μL 下游引物,10 μL Mix。擴增程序:94℃預變性3 min;94℃變性30s,適宜退火溫度退火30s,72℃延伸30s,34個循環(huán);72℃延伸5 min;4℃保存。采用1%瓊脂糖凝膠電泳檢測PCR擴增產物,膠回收后測序。
1.2.4 SNP位點用于28種地黃分型 分別以28種地黃基因組DNA為模板,選用初篩的引物來對其進行PCR擴增,回收目的片段,Sanger法正反向測序目的序列,檢測SNP位點多態(tài)性。根據SNP位點繪制指紋圖譜。
在地黃轉錄組中共有 102075條 Unigene中,檢測到 35339 個 SNP 位點,在轉錄組數據中的發(fā)生頻率為0.51/kb。檢測出的SNP位點中發(fā)生轉換共22718個(64.28%),顛換共12621個(35.72%),這6種單核苷酸變異里C/T和A/G的頻率最高,分別達到31.95%和32.33%,其他4種單核苷酸變異中A/T、A/C、T/G、C/G的頻率分別為9.22%、9.36%、8.80%和8.34%。本次研究極大豐富了地黃的SNP位點信息(表2)。
根據SNP挖掘結果,用Primer 5設計了39對引物,包含了54個候選SNP位點。對設計的39對SNP引物,以地黃85-5基因組為模板進行PCR擴增,經瓊脂糖凝膠電泳檢測,從中挑選出了28對符合預期產物長度、擴增效果清晰單一的SNP引物對(圖1),用以進行后續(xù)分型實驗。
表2 地黃轉錄組SNP位點統(tǒng)計結果表
圖1 引物特異性篩選部分結果
為開發(fā)多態(tài)性地黃SNP引物,我們用2.2實驗篩選出的28對特異性引物對28種地黃種質進行分型實驗(圖2)。經過PCR擴增目的片段,切膠純化回收后用Sanger法直接測序。在28對引物擴增的PCR產物中,能夠直接測序成功并且SNP位點在不同地黃種質間不同的僅有7對(表3)。經過DNAMAN序列比對軟件比對后,可以直觀的看出不同地黃種質間的SNP位點變化,位點SNP1的比對圖如圖2所示。經測序后統(tǒng)計7對引物所包含的8個SNP位點在28種地黃種質間的檢測結果,如表4所示。
通過對28份地黃的8個SNP位點的分析,發(fā)現(xiàn)可以將地黃17個種質區(qū)分開。利用這8個SNP位點繪制17份地黃種質的指紋圖譜,如圖3所示,不同引物對的分型結果用不同的顏色區(qū)分;同一引物對的分型結果用數據條長短區(qū)分,數據條長度相同的種質,基因型一致,數據條長度不同的種質,表明在基因分型時被分到不同的組。如DH2和DH3兩份地黃種質僅在SNP3位點存在差異,其余的SNP位點均無差異,這表明兩份種質的差異較?。欢鳧H6和DH17則是除了在SNP7變異位點處相同,其余的6個SNP位點均存在差異,表明它們差異較大。
圖2 引物S10在28份地黃材料中擴增電泳圖
表37對多態(tài)性SNP引物
目前,應用于地黃的分子標記主要有RAPD、ISSR[10]、ITS[9]、SSR[11-12]和 SCoT[1]等。但這些分子標記各有不足[13],如技術難度高,實驗重復性差,對PCR體系要求高等,限制了這些技術的發(fā)展與應用。SNP分子標記是一種特異性強的遺傳標記,隨著高通量測序技術的廣泛應用,以及SNP標記的檢測成本的逐漸下降,基于轉錄組測序來挖掘SNP位點,會使得SNP分子標記技術越來越高效。對于多倍體或沒有參考基因組的物種來說,利用新一代高通量轉錄組測序技術可大量鑒定SNP[6]。近年也被成功地應用于植物的基因分型、品種鑒定、新品種選育等研究中,Jiang[14]利用開發(fā)的14個SNP標記對30個柑橘品種進行基因分型,區(qū)分了品種間的親緣關系;李志遠等[15]在甘藍中篩選出50個核心SNP標記用于構建59個甘藍品種的指紋圖譜,能有效鑒定品種的特異性和真實性;Distefano 等[16]開發(fā)出了21個柑橘SNP標記,并對18個柑橘品種進行遺傳多樣性分析;吳澎等[17]在小麥中可利用SNP標記技術和基因工程技術相結合,將多個優(yōu)質感官性狀基因聚合到一個小麥新品種上;Ferguson等[18]利用53個木薯品種對候選SNP位點的驗證,篩選出1190個穩(wěn)定且具有多態(tài)性的SNP標記,用于對木薯的多樣性評估和地理起源分析。
目前,常用于SNP分析的有等位基因特異性PCR法[19]、高分辨率溶解曲線分析[20]、DNA芯片法[21]和直接測序分型法等。由于AS-PCR法對PCR體系要求嚴格,HRMA法需要使用專門的設備,DNA芯片法需要大量合成特異性探針,都不是最優(yōu)的SNP分型法?;赟anger測序法的SNP分型,它的測序準確度高,不僅能夠發(fā)現(xiàn)和檢測不同個體間存在的所有堿基變異,同時還可以明確各個的位置及變異類型,是實驗室常用的SNP分型方法。
表428份地黃材料在8個SNP位點的堿基信息
但是,到目前為止,還未見使用SNP分子標記對地黃種質進行研究。SNP分子標記因其在基因組中數量最多、分布最廣及具有雙等位基因等特性,正好可以打破地黃品種的遺傳基礎狹窄,品種間遺傳分化不明顯[22]這種局限性,SNP標記將在新品種的特異性、真實性鑒定方面有更多應用。為此,本研究利用首次使用SNP分子標記分析28種地黃的遺傳多樣性,豐富地黃分子標記技術,為區(qū)分地黃種質提供有力的分子標記技術。
本研究通過轉錄組挖掘SNP位點,豐富了地黃基因組SNP變異信息,在Unihene中共發(fā)現(xiàn)3339個SNP位點,其中轉換類型發(fā)生頻率顯著高于顛換類型,轉換發(fā)生頻率約為顛換的兩倍,這與其他植物轉錄組SNP變異類型的比例相似[23-24]。轉換類型中A/G(32.33%)和C/T(31.95%)的發(fā)生頻率最高,顛換類型中A/T最高為9.22%。地黃轉錄組中SNP位點非常豐富,可為地黃遺傳多樣性分析、親緣關系鑒定與品種區(qū)分等方面提供豐富的基礎數據信息。根據SNP候選位點設計的39對引物中,以地黃85-5基因組為模板進行PCR擴增,篩選出28對擴增條帶單一、產物長度符合預期的引物,引物特異性篩選率為72%,成功率較高。但是篩選出的候選SNP位點驗證成功率并不是很高,僅有7對引物所包含的8個SNP位點在28種地黃種質中有差異。這可能是由于在轉錄組挖掘SNP位點時,對原始測序數據分析時造成的SNP位點的假陽性的原因[25-26]。使用28對引物在28種地黃中進行分型實驗,結果僅有7對引物所包含的8個SNP位點表現(xiàn)出多態(tài)性,根據8個SNP位點構建紋圖譜,可以直觀的區(qū)分17種地黃種質。根據指紋圖譜可以看出8個SNP位點可以將裂葉地黃從其余27種地黃種質中區(qū)分出來,表明篩選出SNP位點可以用于地黃的種間區(qū)分。其余的鑒別出來的16種地黃種質都屬于地黃種,表明8個SNP位點也可用于地黃的種間區(qū)分。
在地黃其他分子標記的研究中,張進忠等[27]篩選出的17條RAPD引物在10個地黃品種都可以擴增出各自的多態(tài)性條帶,檢測10個地黃品種的種質遺傳多樣性;周延清[10]篩選出17條RAPD引物和10條ISSR引物用于對10個地黃品種的種質遺傳多樣性分析,并且篩選出能夠鑒別10個地黃樣品的RAPD引物兩個與ISSR引物一個;郭冠瑛[2]利用地黃轉錄組信息,設計了 320 對 EST-SSR引物,213對引物在地黃85-5的基因組擴增出了產物,只有 80對引物在 36 份地黃種質中具有多態(tài)性。楊珂等[1]利用5個SCoT引物構建30份地黃種質的指紋圖譜,結果能區(qū)分開7個地黃常見栽培品種。我們基于8個SNP位點繪制指紋圖譜,可以將28個地黃種質區(qū)分出17種,區(qū)分力度稍弱,這有待于繼續(xù)大量開發(fā)SNP位點,為地黃品種鑒定提供更有效的技術。
本研究以鑒定地黃品種,豐富地黃分子標記為目的,采用PCR產物直接測序的方法進行地黃的SNP分型,結果表明有7對引物,包含8個SNP位點能在17份地黃材料中表現(xiàn)出多態(tài)性,并根據8個SNP位點的差異構建了指紋圖譜,對地黃品種的遺傳多樣性做了補充,為鑒定地黃品種開發(fā)了有效的分子標記,為大量開發(fā)地黃SNP標記來全面評估地黃遺傳多樣性奠定基礎,使用SNP分子標記技術來準確鑒定地黃品種對種質管理和育種也有重要意義。
圖3 利用8個SNP位點對地黃17個種質繪制的指紋圖譜
通過地黃轉錄組挖掘SNP位點,在28份地黃種質中篩序多態(tài)性SNP位點,利用8的SNP位點能夠鑒定17種不同的地黃種質。