陳 罡,于世河,姜義仁,卜鵬圖,鄭 穎,馮 健
(1遼寧省林業(yè)科學(xué)研究院,沈陽 110032;2沈陽農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,沈陽 110866)
蒙古櫟(Quercus mongolica)為殼斗科櫟屬植物,主要分布于中國(guó)的華北、東北,朝鮮半島,俄羅斯遠(yuǎn)東和蒙古等地。蒙古櫟是國(guó)內(nèi)東北和華北地區(qū)針闊葉混交林的主要建群種,在維持地域生態(tài)平衡和生態(tài)系統(tǒng)恢復(fù)重建中有重要的作用,因此具有重要的生態(tài)價(jià)值和經(jīng)濟(jì)價(jià)值[1]。有關(guān)蒙古櫟種內(nèi)遺傳變異的研究相對(duì)較少[2],為育種、造林和基因資源保存,有必要對(duì)現(xiàn)有的蒙古櫟天然林、天然次生林進(jìn)行分子水平的遺傳多樣性研究[3]。
SSR標(biāo)記是一種比較理想的共顯性分子標(biāo)記,具有基因組中廣泛存在、特異性強(qiáng)、多態(tài)性高、實(shí)驗(yàn)重復(fù)性好、結(jié)果穩(wěn)定可靠等優(yōu)點(diǎn),被廣泛應(yīng)用于林木遺傳改良、遺傳圖譜構(gòu)建、分子標(biāo)記輔助育種、遺傳多樣性研究、親緣關(guān)系分析、種質(zhì)資源保存、QTL作圖等許多應(yīng)用研究領(lǐng)域[4]。目前,對(duì)部分地區(qū)的蒙古櫟群體遺傳多樣性研究大都利用RAPD標(biāo)記、等位酶技術(shù)、AFLP技術(shù)及ISSR標(biāo)記等顯性分子標(biāo)記技術(shù)[5-8],可供利用的專門針對(duì)蒙古櫟開發(fā)的SSR標(biāo)記較少[9-11],因此需要更多的SSR標(biāo)記的開發(fā)進(jìn)行補(bǔ)充,以增加位點(diǎn)數(shù)[12]。目前尚未見到利用二代基因組測(cè)序技術(shù)開發(fā)蒙古櫟SSR位點(diǎn)的報(bào)道。本研究基于中國(guó)分布蒙古櫟基因組de novo拼接的二代測(cè)序數(shù)據(jù),旨在發(fā)掘一批擴(kuò)增效率高、多態(tài)性好的引物,為進(jìn)一步開展蒙古櫟遺傳資源評(píng)價(jià)、種質(zhì)資源多樣性分析提供參考。
2018年6月下旬采集遼寧8個(gè)不同地區(qū)的蒙古櫟葉片,硅膠干燥保存?zhèn)溆?。用于二代測(cè)序建庫(kù)的樣本群體為DA(采自撫順大孤家),用于引物驗(yàn)證的8個(gè)樣本信息見表1。
表1 樣本采樣信息
采用CTAB法提取基因組DNA[13],用1%瓊脂糖凝膠電泳檢測(cè)DNA大小和完整性。利用NanoDrop ND-2000分光光度計(jì)(Thermo Fish Scientific公司)分析DNA純度和濃度,隨后用1×TE緩沖液稀釋基因組DNA至終濃度為20 ng/μL,-20℃保存?zhèn)溆谩?/p>
DNA打斷,末端補(bǔ)平,3'端加A,連接測(cè)序接頭,文庫(kù)構(gòu)建并質(zhì)檢,構(gòu)建合格的文庫(kù)利用Illumina HiSeq2500平臺(tái)進(jìn)行雙末端測(cè)序。實(shí)驗(yàn)由北京閱微基因技術(shù)有限公司完成。
原始數(shù)據(jù)以FASTQ格式進(jìn)行保存,用Trimmomatic軟件[14]進(jìn)行數(shù)據(jù)過濾,去除reads中包含的測(cè)序接頭序列、低質(zhì)量序列、重復(fù)reads、含N(N表示無法確定堿基信息)的序列,最后得到干凈序列(clean reads)。用Flash軟件進(jìn)行無參考基因組的de novo拼接[15],默認(rèn)參數(shù)設(shè)置。
利用MISA軟件[16]對(duì)拼接好的序列片段進(jìn)行SSR位點(diǎn)搜索和鑒定,MISA軟件能識(shí)別出序列中的單核苷酸SSR和復(fù)合SSR及所在的位點(diǎn),查找參數(shù)設(shè)為二、三、四、五核苷酸最小重復(fù)次數(shù)為6、5、5、5次。用Primer3對(duì)含有SSR位點(diǎn)且側(cè)翼適合設(shè)計(jì)引物的序列進(jìn)行引物設(shè)計(jì)。將設(shè)計(jì)的引物與前人已開發(fā)的SSR引物進(jìn)行比對(duì),去除重復(fù)位點(diǎn)。
PCR 反應(yīng)體系為 10 μL:10×Buffer I 1.0 μL,2.5 mmol/L dNTP 0.8 μL,帶有M13序列的熒光引物TP-M13(5 μmol/L)0.5 μL(HEX 或 FAM 熒光),特異SSR 引 物 (5 μmol/L)0.6 μL,Takara HS Taq( 大 連TaKaRa生物)0.1 μL,DNA模板1.2 μL,ddH2O 5.8 μL。
按以下程序在GeneAmp 9700上(Applied Biosystems公司)完成PCR擴(kuò)增。95℃在PCR儀上進(jìn)行預(yù)熱5 min;然后94℃模板變性30 s,60℃退火30 s,72℃延伸30 s,程序重復(fù)30次循環(huán);隨后94℃變性30 s,53℃退火30 s,72℃延伸擴(kuò)增30 s,重復(fù)10個(gè)循環(huán);最后60℃持續(xù)30 min。向96孔板中每孔加入分子量?jī)?nèi)標(biāo)GS500 LIZ(Applied Biosystems公司)和甲酰胺混合液(0.5:8.5)9 μL,PCR產(chǎn)物1.0 μL,95℃變性3 min。帶有不同熒光PCR擴(kuò)增產(chǎn)物上ABI 3730XL測(cè)序儀進(jìn)行檢測(cè)。將檢測(cè)得到的原始數(shù)據(jù)“.fsa”文件導(dǎo)入到分析軟件GeneMapper 3.2(Applied Biosystems公司)中進(jìn)行自動(dòng)分析,手工校正。多色熒光引物合成和檢測(cè)均由北京閱微基因技術(shù)有限公司完成。用Popgene32軟件計(jì)算遺傳距離(Nei)[17]。
共測(cè)得2.6 G的數(shù)據(jù)量,獲得原始reads 8956795對(duì),用Flash軟件拼接后獲得4876401條序列。MISA軟件對(duì)拼接后的序列進(jìn)行掃描,搜索鑒定SSR位點(diǎn),共在282605條序列鑒定出SSR基元,占拼接序列總數(shù)的5.8%。選擇含有SSR位點(diǎn)的序列,利用Primer3批量設(shè)計(jì)引物,設(shè)計(jì)引物參數(shù)為GC含量40%~60%,退火溫度Tm為50~60℃,引物長(zhǎng)度18~25 bp,目的片段預(yù)期100 bp以上,符合引物設(shè)計(jì)條件的序列148479條,占含SSR重復(fù)基元序列數(shù)的52.5%。這些序列構(gòu)成了后續(xù)進(jìn)行大規(guī)模SSR引物開發(fā)的序列基礎(chǔ)。
作為初步研究,隨機(jī)挑選合成40對(duì)引物進(jìn)行篩選和驗(yàn)證,最終篩選出10對(duì)重復(fù)性好的SSR引物(表2),其中7個(gè)位點(diǎn)的重復(fù)基元為3核苷酸重復(fù),4核苷酸重復(fù)位點(diǎn)有3個(gè)。從重復(fù)基元的類型看,位點(diǎn)N1014482和N4544558重復(fù)核苷酸類型是一樣的(AAT),位點(diǎn)N1010265和N1110207是CAA重復(fù),位點(diǎn)N1105306和N4529840的重復(fù)類型是相同的(TTC),其余4個(gè)位點(diǎn)的重復(fù)基元序列均不同。
為驗(yàn)證這些引物是否在群體中具有多態(tài)性,利用采自遼寧不同地區(qū)的8個(gè)蒙古櫟樣本進(jìn)行擴(kuò)增驗(yàn)證。圖1所示為引物對(duì)N1010265的熒光擴(kuò)增產(chǎn)物在自動(dòng)測(cè)序儀上的條帶大小,模板分別來自采集的8個(gè)地區(qū)樣本,橫坐標(biāo)為擴(kuò)增的片段大小,縱坐標(biāo)為擴(kuò)增產(chǎn)物的熒光強(qiáng)度。從圖中可以看出,總體信號(hào)清晰,8個(gè)DNA樣品的電泳峰型各異,呈現(xiàn)出較好的多態(tài)性。統(tǒng)計(jì)結(jié)果表明,這10個(gè)SSR位點(diǎn)均為多態(tài)性位點(diǎn)(表2),等位基因數(shù)最高的是N1457047位點(diǎn),達(dá)到6個(gè)??傮w上,片段大小范圍為135~215 bp,片段最長(zhǎng)的位點(diǎn)是N4529840,為200~215 bp;片段最短的是N1345390和N12361位點(diǎn),擴(kuò)增長(zhǎng)度分別為135~153、139~152 bp。
圖1 利用引物N1010265對(duì)8個(gè)樣品擴(kuò)增的峰值圖
表2 蒙古櫟10對(duì)SSR引物信息
為進(jìn)一步驗(yàn)證新開發(fā)SSR引物的有效性,選用10對(duì)引物對(duì)采集自撫順大孤家地區(qū)的15個(gè)蒙古櫟材料進(jìn)行擴(kuò)增,結(jié)果表明,15個(gè)材料的遺傳距離在0.689~0.919之間(表3),說明在同一地區(qū)群體內(nèi)存在一定的遺傳變異,通過計(jì)算得出該群體平均等位基因數(shù)為4.2個(gè),有效等位基因數(shù)為2.7個(gè),Shannon多樣性指數(shù)為1.104,從結(jié)果可見蒙古櫟群體遺傳多樣性處于較高水平。
表3 15個(gè)蒙古櫟材料遺傳距離
SSR標(biāo)記的開發(fā)需要預(yù)先知道側(cè)翼序列信息以設(shè)計(jì)引物進(jìn)行PCR擴(kuò)增,這些序列通常利用一代測(cè)序方法獲得,檢測(cè)方法也是低通量的聚丙烯酰胺凝膠電泳。因此,傳統(tǒng)的SSR標(biāo)記開發(fā)引物通常都涉及一系列繁復(fù)的基因組建庫(kù)、重復(fù)片段富集、雜交、多個(gè)克隆篩選和桑格測(cè)序等操作步驟[18],效率較低成本較高,使得SSR標(biāo)記僅在模式植物或者是經(jīng)濟(jì)價(jià)值較高的植物上得到開發(fā)和應(yīng)用[19]。隨著新一代測(cè)序技術(shù)帶來的高通量?jī)?yōu)勢(shì),測(cè)序效率大大提高,對(duì)物種的基因組和轉(zhuǎn)錄組進(jìn)行大規(guī)模測(cè)序和細(xì)致分析成為簡(jiǎn)單易行的方法,給SSR標(biāo)記的開發(fā)也帶來了很大便利[20-21];另一方面,隨著多色熒光標(biāo)記檢測(cè)技術(shù)的廣泛應(yīng)用,SSR片段的記錄和分析可以實(shí)現(xiàn)自動(dòng)化,檢測(cè)效率、準(zhǔn)確率和重復(fù)性得到明顯改進(jìn)[22]。本研究利用高通量測(cè)序技術(shù),在較短時(shí)間內(nèi)開發(fā)了10對(duì)蒙古櫟專屬SSR引物,對(duì)SSR新位點(diǎn)多態(tài)性驗(yàn)證表明,每個(gè)位點(diǎn)的等位基因數(shù)為4~6,平均為4.5個(gè),且均具有較好多態(tài)性,這將為下一步分析遼寧地區(qū)分布的蒙古櫟群體遺傳多樣性和遺傳改良提供技術(shù)基礎(chǔ)。
鑒于SSR標(biāo)記的優(yōu)點(diǎn),研究人員十分關(guān)注SSR標(biāo)記引物的開發(fā)。就SSR引物的來源看,一種是來源于近緣物種間的通用性引物,這種方法雖然方便、快捷、經(jīng)濟(jì),但是存在很大的物種局限性,原物種的SSR基因位點(diǎn)在其他物種間轉(zhuǎn)移擴(kuò)增時(shí),存在未知性和同源性問題,盲目性較大。另一種則是基于各種方法開發(fā)物種特有SSR位點(diǎn)。開發(fā)特有SSR標(biāo)記的方法各具優(yōu)勢(shì),常用方法如基于ISSR-PCR開發(fā)SSR標(biāo)記、基于EST序列開發(fā)SSR標(biāo)記等,本研究是基于基因組de novo拼接序列數(shù)據(jù)開發(fā)SSR標(biāo)記,鑒定的10個(gè)SSR位點(diǎn)中,三基元的占了70%,其中CAA基元和TTC基元相對(duì)占比較高,與前人開發(fā)的櫟屬SSR標(biāo)記特征有所不同[23-25],這可能與此次統(tǒng)計(jì)的SSR位點(diǎn)相對(duì)較少,且在引物設(shè)計(jì)時(shí)剔除了復(fù)合型和非完全型的SSR位點(diǎn)有關(guān),將在今后蒙古櫟SSR標(biāo)記開發(fā)中做進(jìn)一步研究。