蔡金峰 楊曉明 郁萬文 汪貴斌 曹福亮
(南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心 南京 210037)
苦楝(Meliaazedarach)為楝科(Meliaceae)楝屬(Melia)落葉喬木,在亞洲熱帶、亞熱帶地區(qū)廣泛分布,是速生、多功能、可綜合利用的樹種(鄭萬鈞,2004)??嚅匀环植紖^(qū)廣,分布區(qū)地理氣候因子差異較大,加之苦楝長期處于野生未改良狀態(tài),生態(tài)環(huán)境和自然選擇對其影響較大,形成了具有豐富遺傳基礎(chǔ)的多種地理生態(tài)類型(程詩明等,2007)。
目前,國內(nèi)外學(xué)者先后采用RAPD、AFLP、ISSR、SRAP等分子標(biāo)記方法對苦楝遺傳多樣性和群體遺傳結(jié)構(gòu)進行了研究(Olmosetal.,2002;程詩明,2005;夏海濤,2009;陳羨德等,2010;Anoshiyaetal.,2016;廖柏勇等,2016),但與其他物種相比,苦楝在分子生物學(xué)方面的研究進展相對緩慢,特別是苦楝基因組和轉(zhuǎn)錄組的研究數(shù)據(jù)相對比較缺乏。另外,對苦楝分子標(biāo)記的開發(fā)也較為滯后,尚未有具體針對苦楝自身開發(fā)的SSR引物的相關(guān)報道,僅有王芳等(2016)參考楝科其他近緣樹種SSR分子標(biāo)記設(shè)計并篩選出15對適用于苦楝的SSR引物。因此,目前缺乏適宜的分子標(biāo)記開展苦楝種質(zhì)遺傳多樣性分子評價研究,一定程度上影響了苦楝遺傳改良。
近年來,隨著高通量測序等分子生物學(xué)相關(guān)檢測技術(shù)的快速發(fā)展,利用轉(zhuǎn)錄組測序的表達序列開發(fā)分子標(biāo)記具有明顯的優(yōu)勢。轉(zhuǎn)錄組測序不存在物種選擇性,具有高的測序靈敏度,且無需特異性探針,特別是對尚未公布基因組測序信息的物種,可以快速高效地呈現(xiàn)出覆蓋面廣、準(zhǔn)確度高的轉(zhuǎn)錄組信息(應(yīng)東山等,2018)。由此開發(fā)的EST-SSR標(biāo)記具有共顯性遺傳、多態(tài)性高、重復(fù)性好、條帶清晰、統(tǒng)計方便、節(jié)約成本等特點,而且由于EST-SSR來源于表達的基因區(qū)域,可以直接反映相關(guān)基因的多樣性,因此,被廣泛應(yīng)用于植物的遺傳育種、種質(zhì)資源保護和開發(fā)等領(lǐng)域(陳全求等,2008;徐楊等,2016;李秀宇等,2019)。為進一步豐富苦楝SSR分子標(biāo)記,本研究利用Illumina高通量測序技術(shù)對苦楝進行轉(zhuǎn)錄組測序,統(tǒng)計并分析了轉(zhuǎn)錄組序列中SSR位點的分布特征,基于轉(zhuǎn)錄組數(shù)據(jù)進行了引物批量設(shè)計,開發(fā)出16對多態(tài)性引物,以期為苦楝遺傳多樣性評價和遺傳改良提供理論基礎(chǔ)和科學(xué)依據(jù)。
轉(zhuǎn)錄組測序材料為采自南京林業(yè)大學(xué)樹木園4年生苦楝植株的復(fù)葉頂端幼葉,液氮冷凍后-80 ℃超低溫冰箱保存,干冰運至北京諾禾致源科技股份有限公司進行轉(zhuǎn)錄組測序。
SSR引物篩選與驗證材料采自江蘇、山東、河南、浙江、安徽、江西、湖北、湖南、廣東、廣西10個省(區(qū))15個苦楝天然種源的106個單株(表1),取樣單株要求生長健壯、無明顯病蟲害,單株間隔200 m以上,采集其復(fù)葉頂端幼嫩葉片,用硅膠迅速干燥,運至實驗室,置于-80 ℃超低溫冰箱保存。
表1 苦楝各種源樣本數(shù)量Tab.1 Sample number of 15 Melia azedarach provenances
采用MISA軟件(Scottetal.,2000)對轉(zhuǎn)錄組序列中的簡單重復(fù)序列進行檢測,統(tǒng)計SSR不同類型及其分布情況。參數(shù)設(shè)置為:單、二、三、四、五、六核苷酸最少重復(fù)次數(shù)分別為10、6、5、5、5、5次。
用Primer 3軟件(Rozenetal.,2000)對所篩選的SSR進行批量設(shè)計,隨機挑選100對引物(預(yù)期擴增產(chǎn)物長度為100~400 bp),由南京擎科生物科技有限公司進行合成。
采用百泰克植物基因組DNA提取試劑盒(離心柱型)進行苦楝葉片DNA提取。然后用NanoDrop 2000C分光光度計測定其濃度,同時用1%的瓊脂糖凝膠電泳對所提取DNA原液進行質(zhì)量檢測。最后統(tǒng)一將DNA原液稀釋到50 ng·μL-1。
從江蘇南京、山東東營、廣東汕頭、廣西南寧、湖北荊州、浙江樂清6個種源中,每個種源選擇1個單株的DNA為模板,對100對引物進行擴增后,分別用2%瓊脂糖凝膠電泳和PAGE凝膠電泳進行初步篩選和多態(tài)性篩選,利用來自15個種源共106個單株DNA模板對篩選出的多態(tài)性引物進行驗證。
PCR反應(yīng)體系:共20 μL,包括2 μL模板DNA(50 ng·μL-1),1 μL正向引物(10 μmol·L-1),1 μL反向引物(10 μmol·L-1),14 μL 2×T5 Super PCR Mix,2 μL雙蒸水。
PCR擴增條件:94 ℃預(yù)變性5 min;94 ℃變性15 s,55 ℃退火15 s,72 ℃延伸30 s,共進行34個循環(huán);72 ℃復(fù)延伸5 min,PCR終產(chǎn)物于4 ℃保存。
構(gòu)建原始數(shù)據(jù)矩陣,利用GenAlEx 6.5軟件(Peakalletal.,2012)計算觀測等位基因數(shù)(Na)、有效等位基因數(shù)(Ne)、Shannon信息指數(shù)(I);利用Popgene 1.32軟件計算多態(tài)性信息含量(PIC)。轉(zhuǎn)錄組數(shù)據(jù)已提交到美國國家生物信息技術(shù)中心(NCBI)數(shù)據(jù)庫(登錄號:PRJNA680228)。
苦楝轉(zhuǎn)錄組測序共得到56 373 816條原始序列(raw reads),去除質(zhì)量低、帶有接頭及N的比例大于10%的reads,共獲得有效序列(clean reads)55 805 916條,Q30高質(zhì)量序列占94.89%,Q20序列占98.06%,GC含量占總堿基44.42%,堿基錯誤率為0.01%,說明通過Illumina HiSeqTM2500平臺測序得到的苦楝數(shù)據(jù)質(zhì)量比較高,可滿足后續(xù)生物信息學(xué)分析。
利用Trinity軟件進行組裝,去除重復(fù)拼接序列,共獲得20 077條Unigenes,總長度為47 805 499 bp,其中最小拼接長度為201 bp,最大拼接長度為9 487 bp,平均長度為1 431.82 bp,N50長度為1 955 bp。由表2可知,隨著序列長度的增加Unigenes序列數(shù)量呈現(xiàn)逐步遞減趨勢,表明對苦楝測序結(jié)果以及組裝效果較好,此數(shù)據(jù)可用于基因功能相關(guān)分析。
表2 Unigenes長度分布Tab.2 Length distribution of Unigenes
利用MISA軟件,對苦楝轉(zhuǎn)錄組的20 077條Unigenes序列進行搜索,發(fā)現(xiàn)4 116條Unigenes序列中含有5 469個SSR位點,763條Unigenes含有2個及以上的SSR位點,SSR的發(fā)生頻率為20.50%,出現(xiàn)頻率為27.24%,平均距離為8.74 kb,即轉(zhuǎn)錄組序列中平均8.74 kb就可以發(fā)現(xiàn)1個SSR位點。
苦楝轉(zhuǎn)錄組中單核苷酸至六核苷酸重復(fù)均存在,單核苷酸重復(fù)最多,所占比例超過50%,其次是二核苷酸和三核苷酸重復(fù)。此外,不同重復(fù)類型間SSR序列長度有一定差異,總體長度變化范圍為10~227 bp,平均長度為19.41 bp(表3)。苦楝轉(zhuǎn)錄組序列長度以10 bp為最多,為914個SSR,占總SSR數(shù)量的16.71%,其次是15 bp(812個,占14.85%)(圖1)。
表3 苦楝轉(zhuǎn)錄組SSR各重復(fù)類型的分布特點Tab.3 Distribution characteristics of SSR repeat type in Melia azedarach transcriptome
圖1 苦楝轉(zhuǎn)錄組SSR位點長度分布Fig.1 Distribution of SSR loci length in Melia azedarach transcriptome
在考慮堿基互補的情況下,苦楝轉(zhuǎn)錄組中6種核苷酸重復(fù)類型共存在90種重復(fù)基元。由表4可知,A/T是出現(xiàn)最多的重復(fù)基元,占SSR總數(shù)的50.03%;在二核苷酸重復(fù)中,AC/GT和AT/TA分別占總數(shù)的12.78%和9.09%;在三核苷酸重復(fù)中,AAG/CTT占6.49%,是最主要的重復(fù)基元;四核苷酸、五核苷酸和六核苷酸重復(fù)的SSR重復(fù)基元分布較為分散,出現(xiàn)頻率低。
表4 苦楝轉(zhuǎn)錄組SSR各重復(fù)基元類型及數(shù)量Tab.4 The type and number of SSR repeat motifs in Melia azedarach transcriptome
由表5可知,SSR各重復(fù)類型重復(fù)次數(shù)以6~10次為主,占總數(shù)的51.27%,其次是11~15次重復(fù),占總數(shù)的29.00%,主要分布在單、二、三核苷酸重復(fù)中,15次以上重復(fù)次數(shù)也主要分布在這3個重復(fù)類型中。
表5 苦楝轉(zhuǎn)錄組SSR各重復(fù)類型的重復(fù)次數(shù)Tab.5 The repeat number of SSR repeat type in Melia azedarach transcriptome
采用Primer3.0軟件進行引物設(shè)計,共得到引物2 229對,隨機選擇100對引物對進行合成。用6個苦楝DNA模板進行PCR擴增,利用1%的瓊脂糖凝膠對這些引物進行初選,結(jié)果有72對引物的擴增產(chǎn)物顯現(xiàn)出單一條帶且條帶清晰,擴增效率為72%;再用PAGE凝膠對這72對擴增的引物進行多態(tài)性篩選,結(jié)果其中16對引物顯示出了多態(tài)性(圖2、表6),引物多態(tài)性比率為22.22%,可用于苦楝所有樣本的遺傳多樣性分析。
圖2 部分引物在6份苦楝樣本中的多態(tài)性Fig.2 Polymorphism of partial primers in 6 samples of Melia azedarach1-6分別指江蘇南京、山東東營、廣東汕頭、廣西南寧、湖北荊州和浙江樂清。1 to 6 respectively refer to Nanjing in Jiangsu,Dongying in Shandong,Shantou in Guangdong,Nanning in Guangxi,Jingzhou in Hubei,and Yueqing in Zhejiang.
利用16對EST-SSR引物對106個苦楝個體進行PCR擴增,以驗證多態(tài)性引物的有效性(圖3)。由表6可知,16個SSR位點共檢測到56個等位基因(Na)片段,變幅在2~5個之間,平均有效等位基因數(shù)為2.31個;平均Shannon多樣性指數(shù)I為0.861,平均多態(tài)信息含量(PIC)為0.507。
表6 苦楝16對多態(tài)性SSR引物信息Tab.6 Characteristics of 16 polymorphic SSR primers of Melia azedarach
圖3 多態(tài)性引物KL-P2-5對苦楝DNA擴增的PAGE 凝膠電泳成像Fig.3 The PAGE gel electrophoresis imaging for amplification of Melia azedarach DNA by polymorphic primer KL-P2-5M:DNA marker;1-106:106個苦楝單株的DNA樣本 DNA samples from 106 individual plants.
轉(zhuǎn)錄組測序可快速高效獲得數(shù)據(jù),且數(shù)據(jù)的覆蓋面廣、準(zhǔn)確度高(應(yīng)東山等,2018),這對于基因的表達水平研究、新基因發(fā)現(xiàn)、功能基因定位和分子標(biāo)記開發(fā)至關(guān)重要(李清瑩,2018)。與采用同一測序平臺進行轉(zhuǎn)錄組測序的其他木本植物(林雪瑩,2018;張文秀等,2019)相比,本研究所獲得的苦楝轉(zhuǎn)錄組序列中Unigenes平均長度或N50值均較大,說明Illumina高通量測序適合于苦楝轉(zhuǎn)錄組研究,可為苦楝分子標(biāo)記的開發(fā)及遺傳多樣性研究提供信息基礎(chǔ)。
對SSR位點分析發(fā)現(xiàn),苦楝轉(zhuǎn)錄組SSR的發(fā)生頻率為20.50%,平均分布距離為8.74 kb,低于杜仲(Eucommiaulmoides)(26.13 kb)(黃海燕,2013)和紅松(Pinuskoraiensis)(17.38 kb)(張振等,2015)等,說明苦楝具有較高的SSR分布密度,數(shù)量更加豐富;與花椒(Zanthoxylumbungeanum)(7.2 kb)(李立新,2017)和水松(Glyptostrobuspensilis)(林雪瑩,2018)(7.59 kb)的SSR分布距離相近,但高于楠木(Phoebezhennan)(3.37 kb)(時小東等,2016)和茶樹(Camelliasinensis)(3.68 kb)(陳琪等,2016)等,物種基因組大小、測序部位及搜索條件等都可能造成這種差異(Varshneyetal.,2005)。研究結(jié)果顯示,除單核苷酸重復(fù)類型外,苦楝轉(zhuǎn)錄組序列中二核苷酸和三核苷酸重復(fù)最多,與楠木(時小東等,2016)和濕地松(Pinuselliottii)(易敏等,2020)的研究結(jié)果類似。其中AC/GT和AT/TA是二核苷酸重復(fù)中最主要的重復(fù)基元,在三核苷酸重復(fù)中出現(xiàn)頻率最高的是AAG/CTT和AAT/ATT,為SSR引物的篩選提供了重要的參考依據(jù)。研究表明,SSR長度達到20 bp時,多態(tài)性較高,是理想的標(biāo)記位點(Temnykhetal.,2001)。本研究表明,苦楝SSR序列平均長度為19.41 bp,其中12~20 bp的SSR數(shù)量為2 748個(50.25%),說明苦楝轉(zhuǎn)錄組SSR大部分具有潛在的高多態(tài)性。
本研究中,隨機挑選的100對引物中有72對引物擴增出清晰條帶,其余引物無法擴增可能與測序誤差或引物設(shè)計差異等有關(guān)(李珊珊等,2017)。有研究指出,與基因組SSR相比,EST-SSR具有較好的擴增效果,但多態(tài)性相對不高(胥猛等,2008;董黎等,2019),產(chǎn)生這種現(xiàn)象的原因除了選用試驗材料和試驗方法不同外,可能是EST-SSR來源于保守性較高的功能基因序列(Eujayletal.,2001),也可能是EST-SSR來自基因的編碼區(qū),不含有內(nèi)含子等相關(guān)信息,而基因組序列中本身存在內(nèi)含子造成基因組SSR多態(tài)性高(Vanetal.,2004)。本研究中,初步篩選出的72對引物中16對引物表現(xiàn)出豐富的多態(tài)性,在106個苦楝DNA樣本中進一步驗證表明,16對引物平均多態(tài)信息含量(PIC)為0.507,根據(jù)Botstein等(1980)標(biāo)準(zhǔn),中度多態(tài)位點有9個,高度多態(tài)位點有7個,說明所選的16對SSR引物在苦楝上可檢測到較高的多態(tài)信息含量,為苦楝的遺傳多樣性等研究提供了基礎(chǔ)。
本試驗采用聚丙烯酰胺凝膠電泳對苦楝轉(zhuǎn)錄組SSR進行初步分析,與基于熒光標(biāo)記的SSR毛細管電泳技術(shù)相比,靈敏度相對較低(劉歡等,2017)。為進一步提高試驗的檢測效率和精準(zhǔn)度,在本研究的基礎(chǔ)上,可以對開發(fā)設(shè)計的苦楝SSR分子標(biāo)記進一步優(yōu)化,建立苦楝高通量熒光SSR標(biāo)記,以有效促進和推動苦楝種質(zhì)資源遺傳多樣性評價、分子標(biāo)記輔助育種、遺傳圖譜構(gòu)建和功能基因挖掘等研究。
苦楝轉(zhuǎn)錄組SSR位點具有較高的出現(xiàn)頻率和分布密度,基元類型和重復(fù)次數(shù)相對較高,具有高多態(tài)性的潛能?;谵D(zhuǎn)錄組序列設(shè)計篩選的16對SSR引物在苦楝上可檢測到較高的多態(tài)信息含量,進一步豐富了楝科現(xiàn)有SSR標(biāo)記數(shù)據(jù)庫資源,可為楝科植物在基因組水平上的遺傳多樣性分析和分子輔助育種等提供參考。