教忠意,田雪瑤,,鄭紀偉,王保松,何開躍,何旭東*
(1.江蘇省林業(yè)科學研究院,江蘇省農(nóng)業(yè)種質(zhì)資源保護與利用平臺柳樹資源圃,江蘇 南京 211153; 2. 南京林業(yè)大學生物與環(huán)境學院,江蘇 南京 210037)
柳樹屬楊柳科(Salicaceae),是柳屬(Salix)和鉆天柳屬(Chosenia)樹種的統(tǒng)稱。全世界有柳樹500余種,主要分布于北半球寒帶和溫帶地區(qū)。中國有柳樹257種122個變種33個變型,其中約2/3為灌木柳類型[1]。灌木柳由于其形態(tài)各異,皮色和花芽變異豐富,常用于景觀綠植與切花;其枝條通直、韌性好、青條產(chǎn)出率高,還被用于柳編出口海外[2];灌木柳生長速度快、適應(yīng)性強、更新和萌蘗容易、光能利用率高,且對環(huán)境有很強的修復(fù)與凈化作用,在歐洲和北美被廣泛用于短周期生物能源林建設(shè)中[3-4]。此外,與楊樹及其他喬木柳類型相比,灌木柳基因組大小適中、無性繁殖容易、世代周期短,1年即可開花,在林木遺傳學和基因組學研究中極有潛力并成為新的模式樹種[5]。
傳統(tǒng)的常規(guī)育種是利用現(xiàn)有的自然變異或雜交手段創(chuàng)造變異,通過對目標性狀進行表型選擇達到遺傳改良的目的。對于林木而言,此過程周期漫長、準確率較低且受環(huán)境影響較大。而標記輔助選擇(marker-assisted selection, MAS)是通過檢測與目的基因緊密連鎖的分子標記達到選擇目標性狀的目的,極大地縮短了育種年限、提高了育種效率、加快了育種進程[6]。國內(nèi)柳樹分子生物學研究起步較晚,國外柳樹QTL定位的研究主要集中于生長與生物量[7-9]、物候[10-11]、非生物脅迫[12-13]以及抗葉銹病[9,14-15]等性狀,而與目標基因緊密連鎖的功能標記開發(fā)研究僅見生長與物候相關(guān)基因[16]、平茬響應(yīng)基因[17]以及性別決定基因[18-20]等報道。這些功能標記的開發(fā)主要通過連鎖圖譜或關(guān)聯(lián)分析,通常需要大量的群體材料。近年來,混合群體分離法(bulked segregant analysis, BSA)作為一種簡單、快速、有效的分子標記與目標性狀緊密連鎖的鑒定方法,已經(jīng)在作物上得到大量的應(yīng)用[21]。該方法主要選擇雙親群體分離后代中具有極端表型的個體進行混樣,通過比較不同極端混樣池之間的多態(tài)性并結(jié)合表型進行目標基因定位。
隨著高通量測序平臺的不斷更新,基于全基因組限制性酶切位點的簡化基因組測序技術(shù),如限制性酶切位點相關(guān)DNA測序(restriction site-associated DNA sequencing,RAD-Seq)、基因分型測序(genotyping-by-sequencing,GBS)、特定位點個段擴增測序(specific-locus amplified fragment sequencing,SLAF-Seq)等可為分子生物學的研究提供大量的多態(tài)性分子標記,再結(jié)合BSA(如SLAF-BSA)分析能夠顯著提升候選基因鑒定的效率,并廣泛應(yīng)用于各種作物[22-27]和林木[28-29]的研究中。但在柳樹研究中,鮮見應(yīng)用此種方法的報道。鑒于此,本研究基于SLAF-BSA技術(shù),利用耐鹽和敏鹽2個灌木柳親本及其雜交子代構(gòu)建極端性狀混池,通過關(guān)聯(lián)分析鑒定與耐鹽性狀緊密連鎖的SLAF標簽,同時對標簽序列進行功能注釋,開發(fā)特異分子標記并進行驗證,旨在為柳樹功能基因的定位與克隆,以及分子標記輔助育種工作提供理論依據(jù)和技術(shù)支持。
利用前期篩選的1種敏鹽灌木柳歐洲紅皮柳(Salixpurpurea)作母本,1個耐鹽灌木柳蘇柳品種‘2345’(S.×jiangsuensis‘J2345’)作父本進行雜交,共獲得雜交子代3 000株。待子代小苗株高至30 cm左右時,將其從穴盤內(nèi)移栽至大田進行定植。
從雜交群體中選取生長旺盛、株高相近、地徑較粗(1 cm以上)的單株1 505株并進行編號,采集每單株葉片放入自封袋中,置于冰箱冷藏保存。將莖干截成長度12 cm的插穗放入32孔穴盤中,每孔放同一單株的3根插穗,共設(shè)置3次重復(fù)。將穴盤置于塑料周轉(zhuǎn)箱中,加入1/2 Hoagland營養(yǎng)液進行水培,每3天更換1次營養(yǎng)液,培養(yǎng)20 d 至根毛及葉片大量萌發(fā)。花房室溫保持20~25 ℃,濕度保持70%~75%。分別加入質(zhì)量分數(shù)0.1%、0.3%、0.5%和0.7%的NaCl溶液進行鹽脅迫處理,以葉片顏色變化(由淡黃至枯黃)及脫落程度(從不脫落至完全脫落)為標準,篩選出極端耐鹽單株50株、極端敏鹽單株50株。挑選出對應(yīng)編號單株的葉片,利用改良CTAB法提取DNA[30]。分別將50株耐鹽單株和50株敏鹽單株DNA等量混合,構(gòu)建耐鹽混池和敏鹽混池。同時提取兩個親本DNA,利用Nanodrop將親本和兩個混池DNA質(zhì)量濃度統(tǒng)一調(diào)整至100 ng/L,-20 ℃保存?zhèn)溆谩?/p>
以毛果楊(Populustrichocarpa)(http://www.ncbi.nlm.nih.gov/assembly/GCF_000002775.3)基因組序列為參考基因組進行酶切預(yù)測,最終確定限制性內(nèi)切酶組合為Hae Ⅲ + Hpy166 Ⅱ。分別對兩個親本和兩個混池DNA進行酶切,在酶切片段3′端加A并連接Dual-index測序接頭,經(jīng)PCR擴增、純化、混樣后挑選長度在314~364 bp的片段作為SLAF標簽進行高通量測序。測序平臺為Illumina HiSeqTM2500,選用水稻‘日本晴’(Oryzasativa‘Japonica’)基因組為對照進行質(zhì)控。
利用軟件Bwa[31]將親本與子代混池測序產(chǎn)生的閱讀子(reads)與參考基因組進行比對,篩選親本中具有多態(tài)性的SLAF標簽和有reads覆蓋區(qū)域的SNP。SNP標記的開發(fā)利用GATK[32]軟件。采用SNP-index法[33]通過計算混池間顯著差異基因型頻率的Δ(SNP-index)指數(shù)進行標記與目標性狀的關(guān)聯(lián)分析,計算方法如下:
ISNP-index(aa)=Maa/(Paa+Maa);
ISNP-index(ab)=Mab/(Pab+Mab);
Δ(SNP-index)=ISNP-index(aa)-ISNP-index(ab)。
式中:Maa表示aa群體來源于母本的深度;Paa表示aa群體來源于父本的深度;Mab表示ab群體來源于母本的深度;Pab表示ab群體來源于父本的深度。將各個標記的Δ(SNP-index)從大到小排列,取99百分位數(shù)作為閾值,大于該閾值的標記則為與性狀顯著關(guān)聯(lián)的標記。
將關(guān)聯(lián)分析篩選出的候選SLAF標簽序列與NCBI中的非冗余核酸序列(Nt)、蛋白直系同源簇(clusters of orthologous groups,COG)、直系同源蛋白分組(non-supervised orthologous,NOG)、經(jīng)注釋的蛋白質(zhì)序列(Swiss-Prot)和KEGG(Kyoto encyclopedia of genes and genomes)等數(shù)據(jù)庫進行比對,注釋其功能。利用軟件Primer 3[34]對SNP位點進行引物設(shè)計并交北京百萬克生物科技公司合成。隨機選取12個子代(6個耐鹽個體,6個敏鹽個體),連同2個親本DNA為模板用于PCR反應(yīng),并進行重測序驗證。PCR為25 μL反應(yīng)體系,包含DNA模板1 μL,前后項引物各0.6 μL,2 ×TaqPCR Master Mix 12.5 μL,ddH2O 10.3 μL。PCR反應(yīng)程序為:94 ℃預(yù)變性5 min;94 ℃變性30 s,60 ℃退火30 s,72 ℃延伸1 min,30個循環(huán);72 ℃延伸10 min。PCR產(chǎn)物交北京百萬克生物科技公司進行Sanger測序,利用DNAMAN 5.2.2 (Lynnon Biosoft, Quebec, Canada)進行測序序列對比。
1)SLAF標簽統(tǒng)計。對母本個體、父本個體、耐鹽混池以及敏鹽混池共4個樣本進行SLAF高通量測序,統(tǒng)計結(jié)果如表1所示。
表1 4個樣本SLAF標簽統(tǒng)計
測序得到的reads數(shù)變化范圍為6 961 957~15 854 156個,最高為敏鹽混池樣本,最低為父本個體樣本,平均為11 076 280個。4個樣本堿基質(zhì)量Q30值變化范圍為93.47%~94.96%,平均為94.36%,表明測序質(zhì)量較好。GC含量最高為父本個體(39.82%),最低為母本個體(38.82%),平均為39.39%。酶切共開發(fā)175 468個SLAF標簽,其中敏鹽混池SLAF標簽數(shù)最多,為159 448個,母本個體SLAF標簽數(shù)最少,為98 595個。每個樣本的測序深度從35.61×至57.93×不等,平均為48.57×。
2)標簽多態(tài)性分析。對4個樣本中開發(fā)得到的175 468個SLAF標簽根據(jù)等位基因數(shù)和基因序列之間的差異進行多態(tài)性分析,共得到3種類型的標簽:多態(tài)性SLAF標簽、非多態(tài)性SLAF標簽以及位于重復(fù)序列區(qū)的SLAF標簽。各類型SLAF標簽結(jié)果表明多態(tài)性標簽數(shù)量為25 675個,占標簽總數(shù)量的14.63%;非多態(tài)性標簽為147 339個,占標簽總數(shù)量的83.97%;剩余的2 454個標簽位于重復(fù)序列區(qū),占1.4%。
3)關(guān)聯(lián)分析。對多態(tài)性的25 675個SLAF標簽依據(jù)親本基因型進行篩選,去除兩個親本測序深度低于5×的標記,同時對每個標記等位基因的親本來源依據(jù)測序信息進行確定,最終得到1 774個來源于父母本基因型的多態(tài)性SLAF標簽用于后續(xù)關(guān)聯(lián)分析。利用SNP-index法計算混池間顯著差異基因型頻率的Δ(SNP-index)指數(shù),以99百分位為閾值,篩選出與耐鹽性狀顯著關(guān)聯(lián)的SLAF標記18個(表2)。18個標簽序列共包含25個SNP位點,其中marker 116156和marker 88668包含3個SNP位點,marker 118929、marker 108616和marker 68843分別包含2個SNP位點,其余序列包含1個位點。
表2 耐鹽相關(guān)SLAF標簽統(tǒng)計
對18個SLAF標簽序列進行多個數(shù)據(jù)庫的功能注釋,其中6個標簽序列產(chǎn)生比對結(jié)果。如表3所示,6個標簽序列在Nt數(shù)據(jù)庫中均有注釋,且功能均與毛果楊或胡楊相關(guān);4個標簽序列marker 84146、marker 105052、marker 103495和marker 56370在NOG數(shù)據(jù)庫中有注釋,功能分別與翻譯后修飾、轉(zhuǎn)錄、脂質(zhì)運輸和新陳代謝以及信號轉(zhuǎn)導(dǎo)機制相關(guān),3個標簽序列marker 105052、marker 103495和marker 56370在KEGG數(shù)據(jù)庫中有注釋。所有的候選標記中,僅有marker 103495標記在Swiss-Prot數(shù)據(jù)庫中有注釋,功能與線粒體?;d體蛋白相關(guān)。在COG數(shù)據(jù)庫中沒有產(chǎn)生比對結(jié)果。
表3 SLAF標簽基因注釋
利用18個SLAF標記序列針對25個候選SNP位點進行引物設(shè)計,共設(shè)計出10對引物(表4)。部分序列由于SNP位點過于靠近兩端,或者沒有合適的結(jié)合位點,無法進行引物設(shè)計。隨機挑選6個耐鹽子代和6個敏鹽子代,連同父母本一并進行PCR擴增。利用瓊脂糖凝膠電泳檢驗PCR產(chǎn)物并進行Sanger重測序,將測序結(jié)果進行多重序列比對。結(jié)果表明10對引物均獲得PCR產(chǎn)物,且SNP位點的重測序結(jié)果均與原SLAF測序結(jié)果一致。標記marker 74618重測序序列比對結(jié)果見圖1。如圖1所示,在父本、耐鹽子代個體1114、1205、194、690、44和622中,SNP位點為堿基G;在母本、敏鹽子代1130、42、1884、311、2和1784中,SNP位點為堿基A。該位點在耐鹽個體和敏鹽個體間發(fā)生了堿基A/G的替換,與SLAF測序結(jié)果相符(表2)。由此可見,這10個標記中的SNP位點與耐鹽性狀緊密連鎖,可以為灌木柳耐鹽性的快速鑒定提供一定的參考。
圖1 Marker 74618重測序序列比對結(jié)果Fig. 1 Analysis of re-sequencing sequences alignment for marker 74618
表4 SNP引物信息
本研究利用SLAF-BSA技術(shù)通過關(guān)聯(lián)分析快速鑒定了與耐鹽性狀緊密連鎖的18個SLAF標簽,并開發(fā)了10對SNP標記引物,相比傳統(tǒng)依賴于連鎖圖譜的QTL定位研究方法,大大降低了成本、節(jié)約了時間、提升了效率。盡管混合群體分離法在遺傳學和基因組學中得到了大量的應(yīng)用,具有明顯的優(yōu)勢,但也存在一定的局限性。有研究表明BSA分析不適合用于數(shù)量性狀的鑒定,如株高、產(chǎn)量、抗病蟲害等[29]。但隨著研究的進一步深入,BSA越來越多的應(yīng)用于一些由主效基因控制的簡單數(shù)量性狀的鑒別[23]。對于不同效應(yīng)基因控制的數(shù)量性狀,也可以通過精確的表型鑒定和環(huán)境控制試驗來提升BSA分析的效率[35]。而對于由多個微效基因控制或受環(huán)境影響較大的復(fù)雜性狀的鑒定,BSA分析很難實現(xiàn)[36]。由此可見,表型的準確鑒定是BSA分析的前提。對于容易受環(huán)境影響的表型,應(yīng)通過嚴格的試驗方法進行控制,將一些非遺傳性因素如氣候、土壤、區(qū)位、生物或非生物脅迫等的影響降到最低[35]。
此外,BSA分析的有效性很大程度上還與取樣策略相關(guān),包括群體的大小和混池的大小。對于質(zhì)量性狀或者由主效基因控制的數(shù)量性狀,群體和混池的大小取決于群體類型、標記間的距離、目標區(qū)域的重組率以及目標性狀的遺傳結(jié)構(gòu)等[37];對于微效多基因控制的復(fù)雜性狀,還應(yīng)考慮到基因的數(shù)量、基因的效應(yīng)、基因間互作以及基因間相對位置等[38]。通常認為:對于較大效應(yīng)的QTL,群體大小可控制在200~500個體,每個混池理想的個體數(shù)應(yīng)占群體總數(shù)的20%~30%,至少保持在20個以上;對于中等效應(yīng)的QTL,群體大小可控制在500~1 000個體,每個混池個體數(shù)保持在50個以上;對于微效QTL,群體大小可控制在3 000~5 000個體,每個混池個體數(shù)至少在100個以上[21]。本研究中,經(jīng)過初步篩選,得到了包含1 505個體的群體,并分別構(gòu)建了包含50個體的極端混池,基本可以滿足檢測到中等效應(yīng)QTL位點的需要。
本研究利用18條耐鹽相關(guān)的SLAF標簽序列進行功能注釋,其中6條序列產(chǎn)生比對結(jié)果。其中,marker 16156與毛果楊己糖激酶家族蛋白功能相關(guān),marker 74618與胡楊酰基轉(zhuǎn)移酶樣蛋白功能相關(guān)。己糖激酶在大多數(shù)植物中均存在,是葡萄糖分解過程中的第一個關(guān)鍵酶,在果糖磷酸化和葡萄糖信號轉(zhuǎn)導(dǎo)中起重要作用。有研究表明,己糖激酶基因具有防御功能,在受到高鹽、低溫等脅迫時,表達量顯著上調(diào)[39-40]。?;D(zhuǎn)移酶基因主要在植物種子中調(diào)節(jié)油脂的合成。在擬南芥(Arabidopsisthaliana)中,過表達的磷脂二酰甘油酰基轉(zhuǎn)移酶基因可以誘導(dǎo)三?;视偷姆e累,從而在一定程度上緩解逆境脅迫對細胞的傷害[41]。在紫蘇(Perillafratescens)中,在高鹽、低溫和干旱脅迫下,磷脂二酰甘油?;D(zhuǎn)移酶基因表達量顯著上調(diào)[42]。此外,植物中甘油-3-磷酸酰基轉(zhuǎn)移酶通過調(diào)節(jié)軟木脂合成,以維持種皮和根表皮的正常結(jié)構(gòu),進而提高植物的耐鹽性[43]。由此可見,己糖激酶和?;D(zhuǎn)移酶基因均與脅迫應(yīng)答相關(guān),并通過一定的表達機制來抵御逆境的傷害。