姚俊修,李善文,任 飛,李慶華,劉學(xué)良,吳德軍,燕麗萍
(1.山東省林業(yè)科學(xué)研究院,山東 濟(jì)南 250014;2.山東省林木遺傳改良重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250014;3.山東農(nóng)業(yè)大學(xué),山東 泰安 271018)
簡單序列重復(fù)(Simple sequence repeat,SSR)是一類由1~6 個(gè)堿基組成的簡單串聯(lián)重復(fù)序列,在真核、原核生物基因組中分布廣泛[1-2]。根據(jù)SSR 來源可分為EST-SSR 和基因組SSR[3],傳統(tǒng)的利用基因組數(shù)據(jù)開發(fā)SSR 標(biāo)記具有成本高、試驗(yàn)步驟繁瑣、位點(diǎn)較少等缺點(diǎn)[4],近年來,隨著測序成本降低,轉(zhuǎn)錄組測序已經(jīng)成為研究分子生物學(xué)相關(guān)內(nèi)容的短平快思路之一,不同植物的轉(zhuǎn)錄組數(shù)據(jù)相繼被開發(fā)利用,基于轉(zhuǎn)錄組測序開發(fā)不同植物SSR 標(biāo)記的研究也越來越多[5-7]。
接骨木屬SambucusLinn系忍冬科Caprifoliaceae 植物,為落葉喬木或灌木,本屬約20 種,遍布于溫帶和亞熱帶地區(qū)[8-9]。我國約6 種,南北均產(chǎn)。接骨木是珍貴的藥用植物,不少種類果實(shí)含油量高(35%~44%)[10],是農(nóng)業(yè)部公布的木本油料植物之一。我國接骨木資源十分豐富,其具有很強(qiáng)的適應(yīng)性,抗寒、抗旱、抗病能力強(qiáng)[11],而對接骨木屬樹種的開發(fā)利用,我國仍處于起步階段,大多處于自然狀態(tài)且人為破壞嚴(yán)重,僅在藥用及種質(zhì)資源概述較多,其它高值化利用等研究較少[12-13],也未見基于轉(zhuǎn)錄組測序的標(biāo)記開發(fā)及分子標(biāo)記輔助育種等相關(guān)報(bào)道,本研究基于前期對西洋接骨木果實(shí)轉(zhuǎn)錄組進(jìn)行測序獲得的數(shù)據(jù),開發(fā)大量微衛(wèi)星標(biāo)記,為利用SSR 標(biāo)記進(jìn)行接骨木種質(zhì)資源遺傳多樣性、連鎖圖譜構(gòu)建及功能基因挖掘奠定基礎(chǔ)[14-16]。
轉(zhuǎn)錄組數(shù)據(jù)來源于本課題組2016年對一株成年西洋接骨木(1987年由美國引進(jìn),樹齡31 a,現(xiàn)定植于山東省濟(jì)南泉城公園)果實(shí)進(jìn)行Illumina HiSeq 2000 高通量測序的結(jié)果。測序時(shí)采取3 個(gè)發(fā)育時(shí)期(青果、中熟、晚熟)的果實(shí),每階段取樣3 次重復(fù),分別提取RNA 后委托北京諾禾致源基因公司進(jìn)行RNA-Seq 轉(zhuǎn)錄組測序,并通過De Novo 方法組裝獲得[17],組裝結(jié)果作為原始數(shù)據(jù)后續(xù)使用。
西洋接骨木轉(zhuǎn)錄組數(shù)據(jù)采用Trinity 軟件進(jìn)行拼接,拼接得到的轉(zhuǎn)錄本序列信息以FASTA 格式儲(chǔ)存,拼接主要參數(shù)為SS_lib_type,min_kmer_cov,min_glue。通過拼接得到Unigenes 庫,并對混合的Unigenes 庫利用MISA 程序進(jìn)行SSR 位點(diǎn)搜索[18],搜索標(biāo)準(zhǔn)為:二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重復(fù)次數(shù)分別為6、5、5、5 和5 次。
采用Primer 3.0 引物設(shè)計(jì)程序(2.3.5 版,默認(rèn)參數(shù))對含有SSR 位點(diǎn)的序列進(jìn)行引物設(shè)計(jì),且SSR 位點(diǎn)側(cè)翼序列長度≥50 bp。引物設(shè)計(jì)的主要參數(shù):1)退火溫度(Tm)在55~75 ℃之間,上、下游引物的Tm 值相差5 ℃;2)PCR 擴(kuò)增產(chǎn)物大小在100~300 bp 之間,引物長度在15~30 bp之間;3)GC 含量在40%~60%之間,且上、下游引物之間無引物二聚體和二級結(jié)構(gòu)的出現(xiàn)。對設(shè)計(jì)的SSR 引物在Unigenes 庫中進(jìn)行SSR 引物的blast 驗(yàn)證[18-19]。
選取8 株接骨木的成熟葉片(加拿大接骨木Sambucus canadensis3 株,金葉接骨木Sambucus canadensis‘Aurea' 1 株,花葉接骨木Sambucus nigra‘Variegata' 1 株,金羽接骨木Sambucus racemosa‘Plumosa Aurea' 1 株, 接骨木Sambucus williamsii2 株),DNA 采用英芮誠生化科技(上海)有限公司植物組織基因組DNA 提取試劑盒提?。ù胖榉ǎ20],-70 ℃保存?zhèn)溆谩?/p>
以上述8 個(gè)接骨木成熟葉片進(jìn)行引物篩選。熒光引物PCR 擴(kuò)增體系采取半巢式PCR,經(jīng)降低退火溫度及進(jìn)行梯度PCR 擴(kuò)增等優(yōu)化過程獲得最佳熒光PCR 擴(kuò)增體系及程序。
擴(kuò)增產(chǎn)物利用毛細(xì)管電泳檢測:取PCR 產(chǎn)物0.3 μL、分子量內(nèi)標(biāo)0.5 μL 和去離子甲酰胺9.5 μL混合加入PCR 板,95 ℃變性5 min,4 ℃冷卻后離心,1×Buffer 緩沖液上機(jī)檢測[21]。
100 對熒光引物來源于Primer 3.0 軟件設(shè)計(jì)所得,由北京市睿博興科生物技術(shù)有限公司合成,純化方式PAGE。引物篩選原則為Tm 值范圍:55~62 ℃;引物重復(fù)堿基的個(gè)數(shù):2 bp,如(AG),(AT)等;重復(fù)堿基的次數(shù):8~11 次;PCR 擴(kuò)增體系及程序選自實(shí)驗(yàn)所得的最優(yōu)方案。
通過對西洋接骨木轉(zhuǎn)錄組的257 975 條Unigene序列進(jìn)行搜索(序列總長254 175 kb),發(fā)現(xiàn)其中51 336 條Unigene 序列中含有64 148 個(gè)SSR 位點(diǎn),SSR 位點(diǎn)出現(xiàn)頻率為24.87%(SSR 位點(diǎn)數(shù)與總的Unigene 數(shù)的比值),平均每3.96 kb 出現(xiàn)1 個(gè)SSR,SSR 的類型豐富,其中,單核苷酸重復(fù)是主要類型,占總SSR 的51.13%。其次是二、三核苷酸重復(fù),分別占總SSR 的38.63%和9.11%。A/T和AG/CT 是單核酸和二核苷酸的優(yōu)勢重復(fù)基元。四核苷酸、五核苷酸和六核苷酸重復(fù)類型數(shù)量較少,分別占總數(shù)的0.86%、0.1%和0.17%(表1,圖1)。
表1 西洋接骨木轉(zhuǎn)錄組不同SSR 重復(fù)單元類型分布Table1 Distribution of different SSR repeat types of transcriptome in Sambucus nigra
圖1 SSR 位點(diǎn)分布Fig.1 SSR locus distribution
以西洋接骨木葉片DNA 為模板,根據(jù)SSRPCR 的基本條件和擴(kuò)增程序優(yōu)化PCR 體系[18,22-23]。
熒光引物PCR 擴(kuò)增體系及程序如下:
加M13接頭PCR 擴(kuò)增體系:20 μL PCR 體系中含DNA 原液1 μL,2×Mix 10 μL,10 μM 的M13接頭及上下游引物各0.2、0.1、0.3 μL,H2O 8.4 μL;
熒光引物PCR 擴(kuò)增程序:95 ℃預(yù)變性5 min;然后進(jìn)行35 個(gè)循環(huán),每個(gè)循環(huán)包括95 ℃變性30 s,57 ℃退火30 s(退火溫度因不同引物而異),72 ℃延伸30 s;最后72 ℃延伸10 min。
以上述擴(kuò)增體系及程序?yàn)榛A(chǔ)條件,經(jīng)降低退火溫度及進(jìn)行梯度PCR 擴(kuò)增等優(yōu)化過程獲得最佳熒光PCR 擴(kuò)增體系及程序如下:
兩步熒光引物PCR 擴(kuò)增法:
1)加M13接頭PCR 擴(kuò)增體系:10 μL PCR 體系中含DNA 原液1 μL,2×Mix 5 μL,10 μM 引物各0.1 μL,H2O 3.8 μL;PCR 擴(kuò)增程序見表2。
表2 PCR 擴(kuò)增程序Table2 Procedure of PCR amplification
由于第一步與熒光接頭引物結(jié)合擴(kuò)增結(jié)果較差,而兩步法可提高與熒光引物結(jié)合度,可大大提高引物的擴(kuò)增效率。
2)第二步熒光引物PCR 擴(kuò)增體系:20 μL PCR 體系中含第一步擴(kuò)增產(chǎn)物DNA 原液2 μL,2×Mix 10 μL,10 μM M13 接頭(加熒光標(biāo)記)及反向引物各0.15 μL,H2O 7.7 μL;熒光引物PCR擴(kuò)增程序見表3。
表3 熒光引物PCR 擴(kuò)增程序Table3 Procedure of fluorescent PCR amplification
對含SSR 位點(diǎn)的51 336 條Unigene 序列進(jìn)行引物設(shè)計(jì),共設(shè)計(jì)了64 148 對SSR 引物。為了驗(yàn)證其有效性,挑選合成了以二核苷酸重復(fù)基元為主的100 對熒光SSR 引物,利用已合成的100 對引物對8份不同種接骨木個(gè)體進(jìn)行熒光SSR擴(kuò)增,結(jié)果表明,80 對引物擴(kuò)增有條帶,即擴(kuò)增效率為80%。在擴(kuò)增成功的80 對引物中有25 對引物多態(tài)性較好,即引物多態(tài)性效率為31.25%。圖2為5號引物在8 份不同種接骨木個(gè)體中的擴(kuò)增情況。
從25 對擴(kuò)增有多態(tài)性的引物中選取14 對多態(tài)性較好的引物(表4)對不同種接骨木進(jìn)行遺傳多樣性分析并對熒光標(biāo)記多態(tài)性進(jìn)行評價(jià)。14對多態(tài)性引物共檢測出67 個(gè)等位基因(Na),每位點(diǎn)3~7 個(gè),平均等位基因4.786 個(gè);每位點(diǎn)有效等位基因數(shù)(Ne)1.684~6.095 個(gè),平均有效等位基因數(shù)3.413 個(gè),觀測雜合度(Ho)及期望雜合度(He)分別在0~0.875 和0.406~0.836之間,平均值分別為0.313、0.664;Shannon 多樣性指數(shù)(I)在0.736~1.862 之間,平均1.310 (表5),說明不同種接骨木具有較高的遺傳多樣性。
隨著高通量測序技術(shù)的快速發(fā)展及成本優(yōu)勢,轉(zhuǎn)錄組測序所得數(shù)據(jù)可包含某物種特定時(shí)期某一組織或器官的轉(zhuǎn)錄本[24-25],對于缺乏基因組信息的物種,其轉(zhuǎn)錄組測序?qū)τ谠撐锓N分子標(biāo)記開發(fā)及標(biāo)記輔助育種是一個(gè)的短平快的方法。
本研究中,對一株成熟西洋接骨木果實(shí)進(jìn)行轉(zhuǎn)錄組測序所得cDNA 文庫中的257 975 條Unigene進(jìn)行SSR 搜索,得到了64 148 個(gè)SSR 位點(diǎn),出現(xiàn)頻率為 24.87%,此頻率高于蘿卜的23.79%[26]、皂莢的20.7%[27]、刺梨的20.37%[19]、南方紅豆杉的2.24%[18]、但低于芙蓉李的54.51%[28],厚樸的52.75%[29],出現(xiàn)這種差異可能是由轉(zhuǎn)錄組測序方法,不同物種間SSR 位點(diǎn)信息差異、SSR 位點(diǎn)查找軟件、不同數(shù)據(jù)庫中數(shù)據(jù)量大小等原因造成的[18,30]。隨著不同數(shù)據(jù)庫的不斷補(bǔ)充和完善,SSR 出現(xiàn)頻率在各數(shù)據(jù)庫中將有統(tǒng)一標(biāo)準(zhǔn)[19]。在大多數(shù)物種中二核苷酸和三核苷酸是最常見的SSR 重復(fù)類型[31],而從西洋接骨木SSR 位點(diǎn)結(jié)構(gòu)來看,單核苷酸(51.13%)出現(xiàn)頻率最高,明顯高于二核苷酸(38.63%)和三核苷酸(9.11%),這與鄢秀芹等對刺梨的SSR 重復(fù)類型研究并不一致:三核苷酸出現(xiàn)頻率最高,高于四核苷酸及二核苷酸[19];西洋接骨木轉(zhuǎn)錄組中二核苷酸優(yōu)勢重復(fù)基元是 AG/CT,這與青稞[32]、刺梨[19]、藍(lán)靛果[33]、芝麻[34]中有一致的研究結(jié)論。
圖2 8 個(gè)樣本在5 號位點(diǎn)的基因型 Fig.2 Genotypes of 8 samples at No.5 SSR locus
根據(jù)257 975 條Unigene 序列進(jìn)行引物設(shè)計(jì),共設(shè)計(jì)了64 148 對SSR 特異引物。通過試驗(yàn)優(yōu)化方案得到了西洋接骨木熒光SSR-PCR 最優(yōu)體系,在合成的100 對SSR 熒光標(biāo)記中,80 對標(biāo)記擴(kuò)增有特異條帶出現(xiàn),20 對未擴(kuò)增出條帶,部分標(biāo)記擴(kuò)增失敗可能與引物及模板質(zhì)量有關(guān)[35-36]。80 對有擴(kuò)增條帶的引物中25 對引物具有較好多態(tài)性,多態(tài)性比率為31.25%,明顯低于鐵皮石斛的86%[37]、柿樹的45.2%[38]、低于紅豆杉的38.71%[18],但高于芝麻的10%[39],而對于西洋接骨木近緣種分子標(biāo)記相關(guān)內(nèi)容未見研究報(bào)道。綜上,不同物種間引物的多態(tài)性比率并不一致,這可能與標(biāo)記類型、參試實(shí)驗(yàn)材料及數(shù)量有關(guān)。從SSR 位點(diǎn)多態(tài)性潛能考慮[40],本研究從25 對有擴(kuò)增產(chǎn)物的SSR 標(biāo)記中篩選出的14 對引物具有較高的多態(tài)性,用于接骨木遺傳變異研究是可行的,本研究結(jié)果也表明利用西洋接骨木轉(zhuǎn)錄組數(shù)據(jù)開發(fā)的SSR 標(biāo)記為接骨木種質(zhì)資源遺傳多樣性分析、分子標(biāo)記輔助育種、遺傳圖譜構(gòu)建和功能基因的挖掘等奠定了基礎(chǔ)[14-16]。本研究用14 對標(biāo)記評價(jià)8 個(gè)不同種接骨木遺傳多樣性具有一定局限性,下一步工作將擴(kuò)大引物篩選范圍,增加檢測群體的數(shù)量,以期獲得更多多態(tài)性較高的標(biāo)記來驗(yàn)證本研究結(jié)論。轉(zhuǎn)錄組測序獲得的大量SSR 引物將會(huì)為接骨木和其它忍冬科植物的資源分類、基因定位及比較基因組學(xué)等研究提供更多、更有效的分子標(biāo)記。
表4 14 對SSR 引物與最佳退火溫度Table4 14 pairs of SSR primers and optimal annealing temperature
表5 不同種接骨木遺傳多樣性分析Table5 Analysis of genetic diversity of Sambucus williamsil in different populations
本研究利用高通量測序?qū)ξ餮蠼庸悄具M(jìn)行轉(zhuǎn)錄組測序,對數(shù)據(jù)中SSR 位點(diǎn)分布、核苷酸重復(fù)類型進(jìn)行概括總結(jié);通過試驗(yàn)優(yōu)化獲得最優(yōu)的兩步熒光引物PCR 擴(kuò)增體系;根據(jù)引物設(shè)計(jì)原則在轉(zhuǎn)錄組數(shù)據(jù)中合成100 對熒光SSR 標(biāo)記,利用8個(gè)不同種接骨木個(gè)體對100 對熒光標(biāo)記進(jìn)行引物篩選,80 對可擴(kuò)增出條帶,25 對可成功擴(kuò)增出多態(tài)性,選擇14 對多態(tài)性較好的引物對不同種接骨木進(jìn)行遺傳多樣性預(yù)測。西洋接骨木熒光SSR 標(biāo)記的開發(fā)為接骨木屬分子標(biāo)記輔助育種、雜種優(yōu)勢預(yù)測等提供理論基礎(chǔ)。