摘 要:以紫薇葉片為材料,通過Illumina Hiseq X Ten測序平臺進行高通量測序,利用MISA軟件分析轉(zhuǎn)錄組的SSR相關(guān)信息。結(jié)果表明:測序共獲得31 461條Unigene序列,總長度34 408 463 bp,其中有5 617條Unigene序列含有SSR位點,共發(fā)現(xiàn)SSR位點6 761個,出現(xiàn)頻率為21.49%,平均分布距離為5.09 kb;主要的優(yōu)勢重復(fù)類型為二核苷酸重復(fù)和三核苷酸重復(fù),分別占總SSR的44.95%和36.41%;AG/CT和A/T為SSR優(yōu)勢重復(fù)基元,出現(xiàn)頻率分別為40.23%(2 720個)和16.57%(1 120個)。分析表明,紫薇轉(zhuǎn)錄組中SSR類型豐富、位點出現(xiàn)頻率高、多態(tài)性潛力高,在紫薇種質(zhì)遺傳多樣性研究、品種鑒定、雜種鑒定等方面具有應(yīng)用價值。
關(guān)鍵詞:紫薇;轉(zhuǎn)錄組;SSR
中圖分類號:Q754 文獻標(biāo)識碼:A 文章編號:1006-060X(2023)04-0001-04
Abstract:Illumina Hiseq X Ten sequencing platform was used to conduct high-throughput sequencing on Lagerstroemia indica leaves, and SSR related information of transcriptome was analyzed by MISA software. The results showed that a total of 31 461 Unigene sequences with a total length of 34 408 463 bp were obtained, among which 5 617 Unigene sequences contained SSR loci. A total of 6 761 SSR loci were found, with a frequency of 21.49% and an average distribution distance of 5.09 kb. The dominant repeats were dinucleotide and trinucleotide, accounting for 44.95% and 36.41% of the total SSR repeats, respectively. AG/CT and A/T were SSR dominant repeat primitives, with occurrence frequencies of 40.23% (2 720) and 16.57% (1 120), respectively. The results showed that SSR types were abundant, loci appeared frequently, and polymorphism potential was high in the transcriptome of Lagerstroemia indica, which has application value in genetic diversity analysis, variety identification, hybrid identification and so on.
Key words:Lagerstroemia indica; transcriptome; SSR
紫薇(Lagerstroemia indica)屬千屈菜科紫薇屬落葉灌木或小喬木,具有花期長、花量大、抗逆性強等特點,是重要的夏季觀賞木本花卉,被廣泛應(yīng)用于世界各地的園林景觀中[1-2]。紫薇栽培歷史悠久,最早的栽培記錄可追溯至我國東晉王嘉所著的《拾遺記》。經(jīng)過長期選育,紫薇形成了豐富多樣的品種,目前全世界的紫薇品種已超過500個[3]。
SSR(Simple Sequence Repeats)又稱為微衛(wèi)星DNA(Microsatellite DNA),是由1~6個核苷酸組成的短串聯(lián)重復(fù)序列,具有可變的重復(fù)次數(shù)和保守的側(cè)翼序列,因而可通過設(shè)計特異引物進行PCR以擴增串聯(lián)重復(fù)序列的多態(tài)性[4]。SSR具有共顯性遺傳、多態(tài)性豐富、重復(fù)性高等特點,被廣泛應(yīng)用于物種親緣關(guān)系分析、遺傳多樣性分析、品種鑒定、雜種鑒定等研究中。董俊美等[5]基于山藥轉(zhuǎn)錄組數(shù)據(jù)挖掘了大量的SSR位點,并通過開發(fā)分子標(biāo)記對來自河北省、河南省、山東省及福建省等山藥主產(chǎn)區(qū)的43份山藥種質(zhì)資源進行了遺傳多樣性和親緣關(guān)系分析;胡光明等[6]基于獼猴桃全基因組數(shù)據(jù)篩選得到一批多態(tài)性高、通用性強的SSR引物,并對種質(zhì)資源進行了基因分型及親緣聚類分析;張成才等[7]通過篩選薄殼山核桃核心SSR引物,構(gòu)建了36個常見品種的特異分子指紋圖譜和分子身份證;谷艷鵬等[8]以花楸樹為母本、少葉花楸為父本進行種間雜交,利用篩選出的9對擴增結(jié)果穩(wěn)定且具多態(tài)性的EST-SSR引物,對雜交F1代群體進行雜種鑒定,并對親本和雜交F1代群體的基因分離規(guī)律以及遺傳多樣性和遺傳關(guān)系進行分析。
隨著轉(zhuǎn)錄組測序技術(shù)的不斷進步,其成本越來越低,利用轉(zhuǎn)錄組開發(fā)SSR分子標(biāo)記的技術(shù)也隨之得到普遍應(yīng)用。該研究基于紫薇轉(zhuǎn)錄組高通量測序結(jié)果,對分布于轉(zhuǎn)錄組上的SSR位點信息及其序列特征進行分析,以期為紫薇種質(zhì)資源親緣關(guān)系分析、遺傳多樣性分析、品種鑒定、雜種鑒定等提供基礎(chǔ)資料。
1 材料與方法
1.1 試驗材料
所用材料為紫薇的新鮮幼嫩葉片,采集于廣西壯族自治區(qū)林業(yè)科學(xué)研究院紫薇種質(zhì)資源圃。采集時用干凈紙巾擦掉葉片表面的雜質(zhì),接著用離心管裝好迅速放入液氮中,帶回實驗室置于-80℃冰箱中保存。
1.2 試驗方法
1.2.1 RNA提取 使用Trizol法從紫薇樣品中提取總RNA,使用DNase I(TaKara)去除基因組DNA。文庫質(zhì)量檢測合格后進行測序。
1.2.2 測序與拼接 通過Illumina Hiseq X Ten測序平臺進行高通量測序,獲得Raw reads后,去除基因列中包含接頭、含N和低質(zhì)量的參考基因合成序列,從而得到Clean reads。接著采用Trinity軟件進行拼接,將每條基因中獲得的最長轉(zhuǎn)錄本作為Unigene,用于后續(xù)分析。
1.2.3 SSR位點搜索和數(shù)據(jù)分析 使用MISA軟件對獲得的Unigene進行SSR位點搜索,搜索標(biāo)準(zhǔn)為:含有1、2、3、4、5、6核苷酸重復(fù)的最小重復(fù)次數(shù)分別為10、6、5、5、5次。復(fù)合型核苷酸2個位點之間距離小于150 bp。將生成的數(shù)據(jù)用Microsoft Excel 2016軟件進行整理,對序列特征進行分析并繪制圖表。SSR的出現(xiàn)頻率為SSR位點總數(shù)與Unigene序列總數(shù)的比值;SSR位點的平均距離為序列總長度與SSR位點總數(shù)之比。
2 結(jié)果與分析
2.1 紫薇轉(zhuǎn)錄組SSR的分布特征
通過高通量測序技術(shù)獲得紫薇葉片轉(zhuǎn)錄組數(shù)據(jù),接著利用MISA軟件進行SSR位點搜索,結(jié)果表明,在31 461條Unigenes序列中發(fā)現(xiàn)總計有5 617條序列含有SSR位點,其中含1個以上 SSR位點的序列有955條,搜索到的SSR位點總數(shù)為6 761個,SSR位點的出現(xiàn)頻率為21.49%。同時,搜索到包含復(fù)合型SSR位點的序列數(shù)為517個,占序列總數(shù)的9.2%。序列總長度為34 408 463 bp,SSR位點的分布距離為5.09 kb,即平均每5.09 kb出現(xiàn)一個SSR位點。
2.2 紫薇轉(zhuǎn)錄組SSR重復(fù)類型分析
紫薇轉(zhuǎn)錄組SSR重復(fù)類型情況如表1所示。各重復(fù)類型SSR按照豐度排序結(jié)果為二核苷酸重復(fù)>三核苷酸重復(fù)>單核苷酸重復(fù)>四核苷酸重復(fù)>五核苷酸重復(fù)>六核苷酸重復(fù)。紫薇轉(zhuǎn)錄組中的SSR主要重復(fù)類型為二核苷酸重復(fù),數(shù)量為3 039個,占比為44.95%,出現(xiàn)頻率為7.83%,平均距離13.98 kb;三核苷酸重復(fù)類型豐度次之,為2 462個,占比36.41%,出現(xiàn)頻率為9.66%,平均距離11.32 kb;第三是單核苷酸重復(fù),數(shù)量為1 132個,占比16.74%,出現(xiàn)頻率為3.60%,平均距離30.40 kb。其中,二核苷酸重復(fù)、三核苷酸重復(fù)和單核苷酸重復(fù)數(shù)量之和達到所有SSR數(shù)量的98.1%。
2.3 紫薇轉(zhuǎn)錄組SSR重復(fù)基元分析
由表2可知,由單核苷酸重復(fù)到六核苷酸重復(fù),重復(fù)基元的種類分別為2、4、10、19、18、16種,共69種。單核苷酸重復(fù)的優(yōu)勢重復(fù)單元為A/T,數(shù)量為1 120個,占單核苷酸重復(fù)的98.94%,出現(xiàn)頻率為16.57%;二核苷酸重復(fù)的優(yōu)勢重復(fù)單元為AG/CT,數(shù)量為2 720個,占二核苷酸重復(fù)的89.50%,出現(xiàn)頻率為40.23%;三核苷酸重復(fù)的優(yōu)勢重復(fù)單元為AGG/CCT,數(shù)量為751個,占三核苷酸重復(fù)的30.50%,出現(xiàn)頻率為11.11%。四、五、六核苷酸重復(fù)的優(yōu)勢重復(fù)單元分別為ACAT/ATGT、AGAGG/CCTCT、AAGGAG/CCTTCT,出現(xiàn)頻率均低于1%,分別為0.22%、0.09%和0.04%。轉(zhuǎn)錄組中主要SSR重復(fù)基元類型的和比例詳見圖1。
2.4 紫薇轉(zhuǎn)錄組SSR重復(fù)次數(shù)分析
SSR重復(fù)基元的重復(fù)次數(shù)決定了SSR序列長度的變化范圍,與其多態(tài)性密切相關(guān)。從表3可知,紫薇SSR位點重復(fù)基元的重復(fù)次數(shù)介于5~12次的比例達到90.56%,重復(fù)次數(shù)高于12次的比例為9.44%(638個)。頻率最高的是重復(fù)6次,共1 510個SSR位點,占比22.33%;其次是重復(fù)5次(1 288個,占比19.05%);按占比的高低將剩余的重復(fù)次數(shù)排列依次是重復(fù)7次(827個,占比12.23%)、重復(fù)10次(790個,占比11.68%)、重復(fù)8次(640個,占比9.47%)、重復(fù)11次(427個,占比6.32%)、重復(fù)9次(336個,占比4.97%)和重復(fù)12次(305個,占比4.51%)。
3 討論與結(jié)論
由于成本低、效率高等優(yōu)點,利用轉(zhuǎn)錄組開發(fā)SSR分子標(biāo)記已成為常規(guī)手段。該研究基于紫薇轉(zhuǎn)錄組數(shù)據(jù),共獲得Unigene序列31 461條,發(fā)現(xiàn)有5 617條Unigene序列含有SSR位點,SSR位點數(shù)量總計6 761個,出現(xiàn)頻率為21.49%。該研究中紫薇SSR的出現(xiàn)頻率高于黃稈烏哺雞竹的14.07%[9]、八角的14.24%[10]、柴胡的12.24%[11],低于小果甜柿的31.52%[12]、睡蓮的33.98%[13],與多頭菊的19.77%[14]、藍莓的20.81%[15]接近。在已有的利用轉(zhuǎn)錄組開發(fā)紫薇SSR的研究中得到的發(fā)生頻率為21.53%和20.03%[16-17],與該研究的21.49%接近。通過搜索獲得序列的總長度為344 08 463 bp,SSR的分布密度為1/5.09 kb,與已有紫薇研究中的1/5.60、1/5.46 kb接近[16-17],遠大于辣椒的1/56 kb[18],低于野柿的1/2.94 kb[19]。
SSR的出現(xiàn)頻率和分布密度在不同物種間存在差異,而紫薇中SSR分布較緊密,數(shù)量較豐富。紫薇SSR主要集中在二核苷酸重復(fù)類型(3 039個,占比44.95%)、三核苷酸重復(fù)類型(2 462個,占比36.41%)和單核苷酸重復(fù)(1 132個,占比16.74%),三者總和為98.1%。已有研究表明,植物轉(zhuǎn)錄組測序獲得的SSR以單、二、三核苷酸重復(fù)基因為主,該研究結(jié)果與前人的研究結(jié)果一致。同時前人研究發(fā)現(xiàn),SSR主導(dǎo)重復(fù)基元無明顯規(guī)律,分析認為這與物種差異、搜索參數(shù)設(shè)置差異等相關(guān)[20-21]。進一步分析發(fā)現(xiàn),AG/CT的重復(fù)頻率最高(40.23%),隨后依次是A/T(16.57%)、AGG/CCT(11.11%)、AAG/CTT(10.81%)、AGC/CTG(5.72%),而其他重復(fù)基元占比均小于2.5%。雙子葉植物常見的重復(fù)基元有AG/ CT、AT/AT、AAG/ CTT、AG/ CT、AGC/ TCG等,分析認為這可能與密碼子的偏好性有關(guān)[22]。該研究對紫薇轉(zhuǎn)錄組SSR不同重復(fù)類型在不同重復(fù)下的數(shù)量進行統(tǒng)計,結(jié)果表明,在各重復(fù)類型中,重復(fù)次數(shù)最高的為6次(1 510個,占比22.33%),隨后依次是5次(1 288個,占比19.05%)、7次(827個,占比12.23%)、10次(790個,占比11.68%),其余重復(fù)次數(shù)(不含12次以上)的占比介于4.51%~9.47%之間。SSR的多態(tài)性與重復(fù)基元類型、頻率、重復(fù)次數(shù)等密切相關(guān),該研究表明利用轉(zhuǎn)錄組開發(fā)具有多態(tài)性的紫薇SSR在理論上是可行的。
參考文獻:
[1] 張啟翔. 紫薇品種分類及其在園林中的應(yīng)用(英文)[J]. 北京林業(yè)大學(xué)學(xué)報,1991,13(4):57-66.
[2] QIN B,SUN K D,HUANG X. The complete chloroplast genome of Lagerstroemia balansae,an endangered species of genus Lagerstroemia native to China[J]. Mitochondrial DNA Part B,2021,6(2):684-685.
[3] CAI M,PAN H T,WANG X F,et al. Development of novel microsatellites in Lagerstroemia indica and DNA fingerprinting in Chinese Lagerstroemia cultivars[J]. Scientia Horticulturae,2011,131:88-94.
[4] DAVIERWALA A P,RAMAKRISHNA W,RANJEKAR P K,et al. Sequence variations at a complex microsatellite locus in rice and its conservation in cereals[J]. Theoretical and Applied Genetics,2000,101(8):1291-1298.
[5] 董俊美,李錦超,賈凱旋,等. 基于農(nóng)藝性狀的山藥種質(zhì)資源遺傳多樣性分析[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(18):136-143.
[6] 胡光明,張 瓊,韓 飛,等. 獼猴桃屬植物通用型SSR分子標(biāo)記引物的篩選及應(yīng)用[J]. 中國農(nóng)業(yè)科學(xué),2022,55(17):3411-3425.
[7] 張成才,王亞萍,王開良,等. 利用SSR構(gòu)建薄殼山核桃主要品種的分子身份證[J]. 植物遺傳資源學(xué)報,2022,23(6):1835-1846.
[8] 谷艷鵬,張澤人,孫 濤,等. 基于EST-SSR標(biāo)記的花楸樹和少葉花楸雜交F1代群體的雜種鑒定及遺傳關(guān)系分析[J]. 植物資源與環(huán)境學(xué)報,2022,31(4):65-73.
[9] 婁永峰,甘 然,朱成磊,等. 黃稈烏哺雞竹轉(zhuǎn)錄組EST-SSR分子標(biāo)記開發(fā)與應(yīng)用[J]. 植物科學(xué)學(xué)報,2022,40(3):355-364.
[10] 余興華,楊艷梅,李玉祥,等. 基于八角轉(zhuǎn)錄組序列的SSR分子標(biāo)記引物開發(fā)[J]. 西南農(nóng)業(yè)學(xué)報,2022,35(6):1261-1268.
[11] 劉 迪,歐陽艷飛,徐" 鵬,等. 柴胡轉(zhuǎn)錄組SSR的分布及序列特征分析[J]. 南方農(nóng)業(yè)學(xué)報,2022,53(3):676-683.
[12] 王藝儒,索玉靜,傅建敏. 小果甜柿果實轉(zhuǎn)錄組的SSR、SNP和InDel特征分析[J]. 西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版),2022,50(7):147-154.
[13] 蘇 群,田 敏,劉 俊,等. 基于生物信息學(xué)的睡蓮SSR位點特征分析[J]. 西南農(nóng)業(yè)學(xué)報,2021,34(10):2076-2083.
[14] 吳 超,郭方其,徐丹彬,等. 多頭菊頭狀花序轉(zhuǎn)錄組SSR特點分析[J]. 分子植物育種,2022,20(18):6067-6075.
[15] 王小敏,張春紅,胡麗超,等. 基于高通量測序的藍莓果實轉(zhuǎn)錄組SSR信息分析[J]. 北方園藝,2022(13):49-54.
[16] 李素珍,胡 玲,蔡 明,等. 基于轉(zhuǎn)錄組的紫薇SSR分子標(biāo)記開發(fā)[A]. 中國觀賞園藝研究進展2018[C]. 北京:中國林業(yè)出版社,2018. 526-532.
[17] 王 鵬,李 亞,王淑安,等. 紫薇EST-SSR標(biāo)記的開發(fā)和利用[A]. 中國觀賞園藝研究進展2016[C]. 北京:中國林業(yè)出版社,2016. 220-225.
[18] 劉 峰,王運生,田雪亮,等. 辣椒轉(zhuǎn)錄組SSR挖掘及其多態(tài)性分析[J]. 園藝學(xué)報,2012,39(1):168-174.
[19] 李樹戰(zhàn),王藝儒,孫 鵬,等. ‘龍巖野柿1號’雄花和兩性花花芽的轉(zhuǎn)錄組SSR特征分析[J]. 中南林業(yè)科技大學(xué)學(xué)報,2022,42(9):171-177,186.
[20] 烏日娜,徐 舶,石鳳翎. 基于轉(zhuǎn)錄組數(shù)據(jù)的直立型扁蓿豆SSR序列特征分析[J]. 西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版),2022,50(5):1-8.
[21] 公培民,寧書菊,葉 齊,等. 馬藍轉(zhuǎn)錄組中SSR位點信息特征分析[J]. 分子植物育種,2020,18(12):4000-4008.
[22] CHAGNé D,CHAUMEIL P,RAMBOER A,et al. Cross-species transferability and mapping of genomic and cDNA SSRs in pines[J]. Theoretical and Applied Genetics,2004,109(6):1204-1214.
(責(zé)任編輯:成 平)