梁小玉, 季 楊, 胡遠彬, 易 軍, 白史且, 張 靚, 張新全
(1.四川省畜牧科學研究院, 四川 成都 610066; 2. 四川農業(yè)大學動物科技學院, 四川 成都 611130;3. 四川省林業(yè)和草原局, 四川 成都 610082)
菊苣(Cichoriumintybus)為菊科多年生宿根草本植物,在畜牧業(yè)、食品業(yè)、醫(yī)藥業(yè)以及工業(yè)上廣泛應用,是當今世界上極具潛力的經(jīng)濟作物之一。目前,國內外對菊苣的研究熱點集中在繁育、品種培育、食品營養(yǎng)、化學成分、藥理以及牧草等方面[1],種質資源評價與新品種選育對開發(fā)利用菊苣資源越來越重要。但是,缺乏相關菊苣基因組信息,使我們對其遺傳信息了解較少,目前所使用的相關序列擴增多態(tài)性(Sequence related amplified polymorphism,SRAP),隨機擴增多態(tài)性DNA(Random amplified polymorphic DNA,RAPD),擴增片段長度多態(tài)性(Amplified fragment length polymorphism,AFLP)等分子標記也難以滿足種質資源評價、后代精準鑒定輔助育種等工作的需要,在一定程度上限制了菊苣種質資源的開發(fā)利用。因此,大量開發(fā)新的分子標記對于菊苣種質資源輔助育種具有重要的意義。
SSR標記具有共顯性遺傳、多態(tài)性高、易檢測、特異性好、通用性高及重復性好等優(yōu)點,是目前動、植物遺傳育種中應用最多的一種分子標記[2-5],SSR按來源可分為基因組SSR和表達序列標簽SSR (EST-SSR)。EST-SSR具有基因組SSR的特征,能夠直接獲得基因表達的信息,為功能基因提供“絕對”的標記,其多態(tài)性可能與基因功能直接相關[6-9],在近緣物種甚至遠緣物種間通用性更好,且開發(fā)成本較低[10-13]。本研究基于美國國家生物技術信息中心(National center for biotechnology information,NCBI)數(shù)據(jù)庫公布的菊苣EST序列分析其所含微衛(wèi)星重復序列的組成和特征,開發(fā)菊苣EST-SSR引物,并驗證菊苣EST-SSR引物有效性及其在萵苣屬(LactucaL.)和苦荬菜屬(IxerisCass.)中的通用性,以期為菊苣及其近緣屬種的親緣關系鑒定、系統(tǒng)進化、遺傳變異、遺傳圖譜構建和功能基因鑒定與克隆等研究提供重要的工具和有價值的信息。
引物有效性驗證采用的是來源于美國國家基因庫的5份菊苣材料,來源及形態(tài)差異均較大,通用性評價采用的是31 份萵苣亞族(LactucinaeLess.)材料,其中,7份苦荬菜屬和1份萵苣屬材料(序號20)來源于中國國家牧草種質基因庫,其余23份萵苣屬材料來源于四川農業(yè)大學草學系(見表1)。5~6葉期時,每份種質選擇表型一致的20 個單株的幼嫩葉片等量混合成100 mg,采用新型植物基因組DNA提取試劑盒(天根,北京)提取DNA(每份材料3個重復)。利用0.8%瓊脂糖凝膠電泳和紫外分光光度計檢測DNA濃度和純度,合格的DNA稀釋成10 ng·μL-1置于-20 ℃冰箱內保存?zhèn)溆谩?/p>
表1 供試材料來源
1.2.1菊苣EST-SSR序列下載與SSR位點搜索 利用DNAstar軟件對來源于NCBI數(shù)據(jù)庫的53 975條菊苣EST序列(截止2020年12月)進行拼接和聚類。應用簡單序列重復識別工具(Simple sequence repeat identification tool,SSRIT)在線查找菊苣無冗余EST序列中的SSR位點。搜索標準為SSR長度≥18 bp,二、三、四、五、六核苷酸的序列數(shù)目分別至少重復9,6,5,4,4次。
1.2.2SSR引物設計 根據(jù)SSR側翼的保守區(qū)域,應用Primer premier 5.0 軟件設計引物。引物設計參數(shù)為:熔解溫度 50℃~60℃,最適復性溫度55℃,上下游引物間溫度差異≤3℃;預期擴增產(chǎn)物大小90~500 bp;引物長度18~22 bp,預期擴增率≥80%;引物GC含量40%~60%,最適GC含量50%,上下游引物間GC含量差異≤5%;盡量避免錯配、發(fā)卡結構、引物二聚體出現(xiàn)。引物由北京六合華大基因科技股份有限公司合成。
聚合酶鏈反應(Polymerase chain reaction,PCR) 擴增體系為15 μL,包括1 μL DNA,0.3 μL酶,引物各1 μL,混合液7.5 μL,水4.2 μL。反應程序:94℃5 min;94℃30 s,熔解溫度40 s(每循環(huán)降低1℃),72℃1 min,5個循環(huán);94℃30 s,Tm -5℃30 s,72℃1 min,35 個循環(huán);72℃延伸10 min后4℃保存。PCR擴增產(chǎn)物經(jīng)6.0%變性聚丙烯酰胺凝膠電泳(電泳緩沖液1×TBE,電壓200 V,時間4 h)。電泳完成后銀染,最后用數(shù)碼相機拍照保存。
SSR發(fā)生頻率為含SSR的Uni-EST數(shù)量與無冗余總EST數(shù)量之比,SSR出現(xiàn)頻率為SSR數(shù)量與無冗余總EST數(shù)量的比值,SSR平均分布距離為無冗余EST數(shù)量的總堿基數(shù)與SSR數(shù)量的比值。根據(jù)PCR產(chǎn)物擴增情況,選取清晰易辨的條帶進行統(tǒng)計分析,有帶記為1,無帶記為0,構建0/1二元數(shù)據(jù)矩陣,計算多態(tài)性位點百分率、引物多態(tài)性信息含量(Polymorphism information content,PIC)[14]。利用NTsys-pc 2.10e軟件中的similarity程序計算材料間遺傳相似性系數(shù)(Genetic similarity,GS),基于clustering程序中的SHAN進行聚類分析,再根據(jù)Graphics程序中的tree plot繪制親緣關系樹形圖。
2.1.1菊苣EST中SSR的數(shù)量與分布特點 由表2可知,53 975 條菊苣EST拼接和聚類后獲得40 188 條Unigenes,序列總長30 723.73 kb,從中共搜索到648 個SSR位點。SSR發(fā)生頻率為1.54%,出現(xiàn)頻率為1.61%,平均每47.41 kb出現(xiàn)1個SSR。菊苣轉錄組中SSR類型豐富,且各類型出現(xiàn)數(shù)量和分布距離的差異較大,其中,三核苷酸、二核苷酸和六核苷酸重復類型占主導地位,分別占SSR位點總量的46.45%,30.56%和19.13%。SSR平均長度24.15 bp,為中等偏長的序列,其中,長度18~20 bp和21~25 bp的SSR在總SSR中占比較高,分別達到43.84%和36.64%。
表2 基于重復基元大小的 EST-SSR 分布
2.1.2菊苣EST-SSR基序重復類型和特征 菊苣EST-SSR核苷酸基序類型較豐富,648 個SSR中共搜索到146 種重復基序,六核苷酸類型中的重復基序種類最多,達到93 種,占基序類型總數(shù)的63.70%(表2)。出現(xiàn)頻率最高的6種基序類型主要存在于二核苷酸和三核苷酸(表3),分別為:TC/GA,AG/CT,TTC/GAA,ATC/GAT,ATG/CAT和TGA/TCA,六核苷酸每種基序類型出現(xiàn)頻率均很低。不同重復類型SSR基序的重復次數(shù)差異很大,范圍在4~29 次間,其中,二核苷酸基序重復次數(shù)跨度最大,在9~29 次均有分布,三核苷酸基序有10 種重復次數(shù),主要分布在6~20 次。重復次數(shù)基本上隨重復基序的核苷酸數(shù)目的增多而減少,且不同核苷酸重復基序的主導重復次數(shù)不同,三核苷酸重復6次的占主導,達26.397%,六核苷酸重復4次的占主導,為16.36%,二核苷酸重復7次的占主導,為11.42%(圖1)。
表3 菊苣EST中二核苷酸和三核苷酸重復基序特點
圖1 菊苣EST中不同SSR重復基序的重復次數(shù)分布
為了初步驗證設計的菊苣EST-SSR引物的有效性,從345 對引物中選擇152 對評分95 分以上的引物,以5份菊苣材料(表1)的基因組DNA為模板進行PCR擴增。152 對引物中有119 對引物能夠有效擴增,實際擴增率78.29%,與預期值接近。其中,87 對引物擴增片段長度與預期接近,90 對引物能擴增出清晰條帶,87 對引物在5個材料間檢測出多態(tài)性,多態(tài)率為57.24%,多態(tài)性引物信息見表4。已合成的119 對引物中,含有二、三、五和六核苷酸重復的引物分別有20,37,4和58 對,含六核苷酸重復類型的引物最多,沒有四核苷酸重復類型。
表4 引物序列及信息
續(xù)表4
續(xù)表4
2.3.1菊苣EST-SSR對近緣屬材料擴增產(chǎn)物多態(tài)性分析 在87 對具有多態(tài)性的菊苣EST-SSR引物中隨機挑選出43 對引物,以31 份萵苣亞族材料(表1)的基因組DNA為模板進行PCR擴增,37 對引物可以有效擴增,轉移擴增效率達到86.05%。挑選擴增出清晰條帶的33 對引物進行統(tǒng)計分析,由表5可知,共擴增出599 條清晰條帶,每對引物擴增條帶數(shù)范圍在8~26 條,平均每對引物擴增18.2 條條帶,引物JJ4和JJ134(見圖2)擴增條帶數(shù)最多,均為26 條。其中,多態(tài)性條帶584 條,平均每對引物擴增出17.7 條多態(tài)性條帶,多態(tài)位點在85.7%~100%間,平均97.1%。引物擴增PIC值在0.12~0.34間,平均0.21,PIC值最高的為J19。整體看,33 對引物對供試材料有較高擴增效率,參試材料種質間變異較大,存在較豐富的遺傳多樣性。
圖2 菊苣EST-SSR引物JJ-134的擴增圖譜
表5 菊苣EST-SSR引物組合對苦荬菜和萵苣擴增結果及多態(tài)性
2.3.2基于菊苣EST-SSR聚類分析 遺傳相似系數(shù)(GS)結果顯示,供試材料之間差異明顯,具有較為豐富的遺傳多樣性。31 份近緣種質間的成對GS值在0.472~0.938間,平均GS值為0.76,變幅為0.466,其中,來自四川雅安的2份材料SAU2012-2-5和SAU2012-5-5間GS值最大為0.94,其遺傳距離最小為0.472,表明其親緣關系最近,來源于四川雅安的SAU2012-2-5和內蒙的CF023567間GS值最小,其遺傳距離最大,表明其親緣關系最遠。7份苦荬菜屬種質間的成對GS值在0.49~0.874,平均GS值為0.618,23 份萵苣屬種質間的成對GS值在0.760~0.938,平均GS值為0.861,表明參試苦荬菜屬的遺傳多樣性高于萵苣屬的。在遺傳相似系數(shù)分析的基礎上,應用非加權類平均聚類方法對31 份材料進行聚類分析,構建親緣關系樹狀圖(圖3)。31 份供試材料在遺傳相似系數(shù)0.822處可以劃分為6個組群。其中,24 份萵苣屬材料全部聚在第Ⅰ組,第Ⅰ組群又包含2個亞組,第1亞組包括17 份四川的、2份黑龍江的以及1份河南的,而序號為28~31的4份萵苣屬材料聚在第2亞組。7份苦荬菜屬材料分別聚在5個組群內,第II組包含2份苦荬菜屬材料,即CF023568和CF023569,第III組、第IV組和第VI組均只有1份苦荬菜屬材料,分別為:CF023571,CF023566和CF023572。第V組也包含2份苦荬菜屬材料,分別為內蒙的CF023567和吉林的CF023570。
圖3 苦荬菜和萵苣的UPGMA聚類圖
隨著測序技術的飛速發(fā)展,大量快速增長的EST數(shù)據(jù)已成為EST-SSR標記開發(fā)的重要來源,Cordeir等[15]推測,EST文庫中大約2%~11%的EST序列中含有SSR,而不同植物物種的EST中有1%~5%能發(fā)展成SSR標記[16]。截止2020年12月,NCBI數(shù)據(jù)庫中公布的菊苣EST序列為53 975條,與水稻(Oryzasativa)(1 369 506條)、小麥(Triticumaestivum)(1 358 140條)、大麥(HordeumvulgareL.)(537 546條)等禾本科(Poaceae)作物相比,菊苣EST序列數(shù)據(jù)明顯不足[17]。本研究中菊苣SSR出現(xiàn)頻率為1.61%,略高于玉米(ZeamaysL.)的1.5%[16],但遠低于沙打旺(Astragalusadsurgens)的25.85%[18]、蘇丹草(Sorghumsudanense)的 21.75%[19]、不結球白菜(Brassicarapassp.chinensis)的34.84%[20]和水稻的27%[21]等。這種差異與物種、SSR開發(fā)工具、搜索標準及EST數(shù)量、質量、來源等因素密切相關[22]。如開發(fā)水稻EST-SSR時,搜索SSR的長度標準由12 bp增加到30 bp時,SSR的出現(xiàn)頻率從50%減少到1%[23],而在本研究中,SSR長度標準≥18 bp,搜索標準較為嚴格。
大量研究結果表明,大多數(shù)植物的EST-SSR以二、三核苷酸重復類型為主[24-25],如沙打旺[18]、藜麥(ChenopodiumquinoaWilld.)[25]、獼猴桃(Actinidia)[26]等以二核苷酸重復類型為主,本研究中,菊苣與燕麥(AvenasativaL.)、蘇丹草、甘蔗(Saccharumofficinarum)等一樣,以三核苷酸重復類型為主[17,19]。Gao等[27]發(fā)現(xiàn),許多三核苷酸與具有重要功能的基因相關。四、五核苷酸重復類型很少,與大多數(shù)研究一致。值得關注的是,本研究中六核苷酸重復類型所占比率較高,達到19.13%,表現(xiàn)出明顯的偏倚性,這在所報道的植物種類中極少見,如棗(Ziziphusjujuba)[24]、蘇丹草[19]、不結球白菜[20]等多在2%以下,但與李新鳳等[28]的研究結果相似,他們認為這種現(xiàn)象可能與編碼區(qū)域由框移突變引起的非三核苷酸SSR受抑制有關。
此外,主導重復在不同物種間也存在差異[7],Rota等[23]對水稻、小麥、大麥基因組和EST序列中SSR的分布和頻率研究發(fā)現(xiàn),二、三、四、五核苷酸重復基序類型分別有4,10,33和102 種。本研究中,菊苣二核苷酸至五核苷酸重復基序類型分別有6,27,9和11 種,優(yōu)勢重復基序類型為TC/GA (14.35%),與孫清明等[29]研究結果類似。二核苷酸重復基序出現(xiàn)的重復次數(shù)類型多、跨度大,如AG/CT和TC/GA分別有27種、23種,重復次數(shù)類型跨度從重復9次到27 次、29 次,Cho等[30]認為,SSR的重復次數(shù)與其變異呈正相關。菊苣重復基序出現(xiàn)情況及其頻率高低均表現(xiàn)出明顯的偏倚性,可能與不同物種進化水平、基序的基因表達程度或突變頻率等因素的差異有關[31],也可能與菊苣現(xiàn)有的EST數(shù)較少、覆蓋度不足有關。
利用EST設計引物的有效擴增率一般在60%~90%[32]。本研究中菊苣EST-SSR引物有效擴增率為78.29%,表明通過菊苣EST開發(fā)SSR的效率較高,開發(fā)的引物具有良好的特異性。部分引物未能擴增可能是所設計引物跨越mRNA剪切位點以及擴增產(chǎn)物包含的內含子太長所致。用于苦荬菜屬和萵苣屬材料通用性檢測分析的菊苣EST-SSR引物擴增結果顯示,PIC值均低于0.5,按照Botstein[33]對多態(tài)性的定義,均為低度多態(tài)性標記。但是,班騫等[34]采用本研究開發(fā)的菊苣EST-SSR引物構建苦荬菜指紋圖譜時,PIC值均高于0.5,平均達到0.834。這種差異與不同參試材料及來源差異、引物擴增情況等有關,也與引物序列的選擇密切相關,如引物核苷酸重復類型與次數(shù)、基序類型以及SSR的長度,當SSR長度≥20 bp時多態(tài)性較高[35],而且低級基序SSR多態(tài)性普遍比高級基序的高[36]。本研究中篩選合成引物標準為評分95 分以上的,基序為六核苷酸的引物則接近總數(shù)的50%,隨機挑選用于分析的33 對引物中,基序為六核苷酸的占比達55%,而班騫挑選引物時并未考慮綜合評分,所用引物以二、三核苷酸為主,且基序重復次數(shù)較高,增加重復次數(shù),也相應的增加了多態(tài)性的概率[31,34-35]。
大量研究表明,EST-SSR側翼序列在物種之間高度保守,具有較好的科、屬、種間通用性,親緣關系越近,擴增的譜帶越清晰,而且轉移性比基因組SSR更高[34,36-37]。本研究獲得類似結果,菊苣EST-SSR穩(wěn)定性和重復性好,擴增的譜帶清晰,轉移率較高,達到86.05%,表明菊苣EST-SSR在萵苣亞族中的通用性較強。31 份近緣種質間的遺傳相似系數(shù)在0.472~0.938間,表明參試種質資源蘊含著較豐富的遺傳多樣性。聚類分析顯示,開發(fā)的菊苣EST-SSR能夠有效鑒別萵苣屬和苦荬菜屬,參試材料地理來源與聚類的一致性較為明顯,表現(xiàn)出較明顯的地域分布規(guī)律。部分地域差異較大的材料聚在同一組,可能發(fā)生了人為或者天然基因交流。CF023571,CF023566及CF023572等3份材料分別聚在第III組、第IV組和第VI組,與3份材料來源地域差異較大,且為不同種的野生型苦荬菜密切相關,表明它們不僅與萵苣屬材料間親緣關系較遠,而且種間親緣關系也較遠,有明顯的種間遺傳差異。通用性驗證結果顯示,新開發(fā)的菊苣EST-SSR標記通用性較強,可以對菊苣及其近緣屬遺傳多樣性以及屬、種間親緣關系進行有效的鑒定。
本研究基于53 975 條菊苣EST序列搜索到648 個SSR位點,成功設計了345 對引物,并篩選出119 對評分95 分以上的有效引物,其中37 對引物通用性較強,種間轉移擴增率達86.05%。此外,苦荬菜屬和萵苣屬種質的遺傳多樣性初步分析顯示,供試材料具有較豐富的遺傳多樣性,聚類劃分與材料地理來源有相關性,不同種間存在明顯的遺傳分化。這為菊苣族分子標記開發(fā)、種質資源評價、系統(tǒng)進化研究及分子標記輔助育種奠定了重要基礎。