秦姣姣 楊玉琦 胡曉艷
摘要:銀杏(Ginkgo biloba L.)是雌雄異株植物,其植株價(jià)值因性別不同而異。銀杏轉(zhuǎn)錄組數(shù)據(jù)中EST-SSR位點(diǎn)的生物信息學(xué)分析將為銀杏遺傳學(xué)研究開展提供重要的理論與方法支持。首先通過高通量測序技術(shù)獲得銀杏大、小孢子葉球轉(zhuǎn)錄組數(shù)據(jù),然后開展數(shù)據(jù)拼接組裝與EST-SSR位點(diǎn)挖掘及相應(yīng)的生物信息學(xué)分析。轉(zhuǎn)錄組數(shù)據(jù)處理及拼接組裝后共獲得108 307條unigenes,然后利用MISA軟件發(fā)掘銀杏轉(zhuǎn)錄組數(shù)據(jù)中的SSR位點(diǎn),最終從8 178條unigenes中檢索出9 668個(gè)SSR位點(diǎn)。其中,單核苷酸重復(fù)的數(shù)量最多,有5 663個(gè);其次是二核苷酸和三核苷酸,重復(fù)數(shù)量分別為2 471、1 438個(gè);四核苷酸至六核苷酸重復(fù)的數(shù)量相對較少,共有96個(gè)。銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)共包含147種重復(fù)基元。在單核苷酸重復(fù)中,A和T是優(yōu)勢重復(fù)基元類型,分別有2 808、2 685個(gè);在二核苷酸重復(fù)基元中,AT與TA數(shù)量較多,分別為469、383個(gè),所占比例為34.48%。此外,設(shè)計(jì)得到6 809對銀杏EST-SSR位點(diǎn)特異引物。銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)的發(fā)掘?qū)殂y杏遺傳圖譜構(gòu)建、遺傳性狀分析、幼年期性別鑒定方法的建立等提供有力的理論與方法支持。
關(guān)鍵詞:銀杏;轉(zhuǎn)錄組;SSR位點(diǎn);重復(fù)基元
中圖分類號:S664.301 ? 文獻(xiàn)標(biāo)志碼: A ?文章編號:1002-1302(2020)03-0090-05
微衛(wèi)星序列(simple sequence repeat,SSR)是指由1~6個(gè)核苷酸為重復(fù)單位組成的串聯(lián)重復(fù)序列,如Tn、(AG)n、(ATG)n、(ATGC)n等,在真核生物基因組中隨機(jī)分布。不同物種間SSR位點(diǎn)的分布差異較大,主要表現(xiàn)在基序類型、重復(fù)長度以及在染色體上的分布情況等,從而反映出物種間高水平的等位基因多樣性。雖然不同物種間SSR位點(diǎn)的差異性較大,但是SSR位點(diǎn)兩端的序列比較保守,因此可以根據(jù)SSR位點(diǎn)兩端的保守序列設(shè)計(jì)特異性引物以獲得其長度多態(tài)性,即SSR分子標(biāo)記。SSR分子標(biāo)記技術(shù)除了具有操作簡單、易檢測、共顯性、穩(wěn)定性好等優(yōu)點(diǎn)外,還具有特異性強(qiáng)、等位基因變異多、受選擇壓力小等特點(diǎn)[1]。開發(fā)SSR分子標(biāo)記的傳統(tǒng)方法所需費(fèi)用高、工作量大,并且成功獲得陽性克隆和多態(tài)性引物的概率偏低[2]。當(dāng)前,高通量測序技術(shù)發(fā)展迅速,測序成本顯著降低,為SSR分子標(biāo)記開發(fā)提供了一種全新的方法。轉(zhuǎn)錄組測序(RNA-Seq)可以全面快速地獲得某一特定組織或器官在特定狀態(tài)下幾乎所有的轉(zhuǎn)錄組信息,也可以根據(jù)測序結(jié)果開發(fā)特異EST-SSR分子標(biāo)記[3]。目前,RNA-Seq技術(shù)已在刺梨(Rosa roxbunghii)[4]、魚腥草(Houttuynia cordata)[5]、杜仲(Eucommia ulmoides)[6]等多種植物上開發(fā)出EST-SSR分子標(biāo)記,并應(yīng)用于多領(lǐng)域遺傳分析。
銀杏(Ginkgo biloba L.)為銀杏科銀杏屬落葉喬木,雌雄異株,有“金色活化石”之稱,具有良好的觀賞特性與藥用價(jià)值[7]。銀杏種子含有銀杏酸等多種生理藥理活性物質(zhì)[8],但銀杏種子成熟后外種皮有惡臭[9],易污染環(huán)境,故在園林綠化上宜使用雄株。銀杏采果園的建設(shè)與園林綠化中的資源配置都要求將雌雄株區(qū)分開來,然而銀杏實(shí)生苗在定植后需15~20年才開花,繼而才能肉眼分辨出雌雄,這顯然不能滿足早期定植時(shí)對雌雄性別區(qū)分的要求。形態(tài)特征鑒別法簡單易行,但仍處于定性階段,缺乏準(zhǔn)確的定量標(biāo)準(zhǔn);同工酶法及染色體核型分析法均可靠,但難以應(yīng)用于大規(guī)模實(shí)踐;分子標(biāo)記法及特異蛋白方面的研究更為準(zhǔn)確,但需更高的科技支撐[10]。因此,開發(fā)快捷、有效和可靠的銀杏雌雄株早期性別鑒定方法,對銀杏的資源配置及實(shí)際應(yīng)用具有重要意義。利用雌雄特異的EST-SSR標(biāo)記位點(diǎn),已經(jīng)成功地開發(fā)出一種早期鑒別杜仲性別的方法[11]。尋找在銀杏雌雄株中存在的與性別相關(guān)聯(lián)的特異EST-SSR標(biāo)記位點(diǎn),或許可以成為快速準(zhǔn)確地鑒別銀杏性別的方法,為制定科學(xué)合理的配置應(yīng)用方案提供有力的技術(shù)支持。
本研究通過RNA-Seq技術(shù)對銀杏大、小孢子葉球進(jìn)行轉(zhuǎn)錄組測序,對測序數(shù)據(jù)進(jìn)行拼接組裝后獲得unigenes,再對unigenes中包含的EST-SSR位點(diǎn)進(jìn)行分析,明確銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)的組成和分布特征,為后續(xù)銀杏遺傳分析及早期性別鑒定方法的建立等研究提供理論支持。
1 材料與方法
1.1 銀杏來源與總RNA提取
銀杏采自山東農(nóng)業(yè)大學(xué)林學(xué)院銀杏種質(zhì)資源圃,選取來自于同一家系的銀杏25年生雌雄實(shí)生苗各5株,于2015年3月取初開的銀杏大孢子葉球(雌花)和小孢子葉球(雄花)各10個(gè)作為試驗(yàn)材料。每棵樹采集2個(gè)樣本,每5個(gè)樣本作為1個(gè)生物學(xué)重復(fù),共設(shè)置2個(gè)生物學(xué)重復(fù)。所采樣品用液氮速凍后保存于-80 ℃冰箱備用。使用改良的CTAB法[12]抽取銀杏總RNA,利用Nanodrop 2000和瓊脂糖凝膠電泳檢測總RNA質(zhì)量和完整性。當(dāng)總RNA的濃度大于400 ng/μL、28S/18S>1.8時(shí),表明所提取的RNA符合轉(zhuǎn)錄組測序的要求。
1.2 轉(zhuǎn)錄組測序及序列拼接組裝
利用NEB Next UltraTM RNA Library Prep Kit for Illumina(NEB,USA)構(gòu)建cDNA文庫,然后利用Illumina Hiseq 2500測序平臺對構(gòu)建的cDNA文庫進(jìn)行雙末端測序。對測序得到的原始序列進(jìn)行去接頭、去低質(zhì)量讀段和去重復(fù)等處理后,使用軟件Trinity[13]進(jìn)行de novo組裝,最終得到盡可能長的unigenes。
1.3 銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)挖掘
利用MISA軟件[14]對銀杏轉(zhuǎn)錄組unigenes序列進(jìn)行EST-SSR位點(diǎn)搜索,搜索標(biāo)準(zhǔn)如表1所示。
1.4 銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)引物設(shè)計(jì)
利用Primer 3.0進(jìn)行銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)引物設(shè)計(jì),軟件參數(shù)設(shè)置采用默認(rèn)值,針對檢索到的每一個(gè)EST-SSR位點(diǎn)同時(shí)設(shè)計(jì)3對特異引物供后期試驗(yàn)選擇。
2 結(jié)果與分析
2.1 總RNA質(zhì)量檢測結(jié)果
經(jīng)Nanodrop 2000和瓊脂糖凝膠電泳檢測后發(fā)現(xiàn),總RNA濃度為845.7 ng/μL,28S/18S為2.01,表明本研究提取的銀杏總RNA樣品質(zhì)量高,能夠滿足后續(xù)轉(zhuǎn)錄組測序的要求。
2.2 原始序列組裝結(jié)果
銀杏轉(zhuǎn)錄組測序原始數(shù)據(jù)經(jīng)組裝拼接后共得到108 307條unigenes,這些unigenes的總長度為 86 212 372 bp,平均長度為796 bp。序列長度大于1 000 bp的unigenes有23 624條,占全部unigenes的21.81%(圖1)。
2.3 銀杏EST-SSR位點(diǎn)數(shù)量分布特征
如表2所示,銀杏轉(zhuǎn)錄組unigenes序列經(jīng)檢索后,共發(fā)現(xiàn)8 178條unigenes含有9 668個(gè)EST-SSR位點(diǎn),占總unigenes數(shù)量的7.55%。從銀杏轉(zhuǎn)錄組unigenes中共檢索到6種核苷酸重復(fù)類型,出現(xiàn)數(shù)量最多的是單核苷酸重復(fù),占總EST-SSR位點(diǎn)數(shù)量的58.57%,其次是二核苷酸重復(fù),占 25.55%,數(shù)量最少的是五核苷酸重復(fù),僅占0.14%。
2.4 銀杏EST-SSR重復(fù)基元的分布特征
如圖2所示,在9 668個(gè)銀杏EST-SSR位點(diǎn)中,共有147種重復(fù)基元出現(xiàn), 其中單核苷酸、二核苷酸、三核苷酸、四核苷酸、 五核苷酸及六核苷酸重復(fù)基元的種類分別有4、12、60、44、13、14種。單核苷酸重復(fù)基元中,A和T是優(yōu)勢重復(fù)基元類型,分別有2 808、2 685個(gè),占單核苷酸重復(fù)的97.00%;二核苷酸重復(fù)基元中,出現(xiàn)次數(shù)最多的是AT,有469個(gè),占二核苷酸重復(fù)的18.98%,其次是TA,有383個(gè),占15.50%;三核苷酸重復(fù)基元中,出現(xiàn)頻率最高的為GAA,占三核苷酸重復(fù)的4.79%;四核苷酸、五核苷酸和六核苷酸重復(fù)基元類型數(shù)量最少,占總EST-SSR位點(diǎn)數(shù)量的1.01%。
2.5 銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)引物設(shè)計(jì)
如表3所示,采用Primer 3.0軟件對本研究檢索到的銀杏EST-SSR位點(diǎn)進(jìn)行特異引物設(shè)計(jì),共得到6 809對特異引物,成功率為70.43%。在設(shè)計(jì)成功的6 809對引物中,擴(kuò)增產(chǎn)物為單核苷酸重復(fù)的最多,有4 012個(gè),占58.92%;其次為二核苷酸和三核苷酸重復(fù)基元,分別有2 413、1 095個(gè),分別占35.44%、16.08%。另外,PCR產(chǎn)物為復(fù)合型重復(fù)(含有1個(gè)以上重復(fù)基元類型)的有921個(gè),占13.53%。
2.6 銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)的可用性評價(jià)
多態(tài)性是判定分子標(biāo)記可用性的重要參考指標(biāo)之一,對于SSR分子標(biāo)記來說,長度是影響其多態(tài)性高低的一個(gè)重要因素。研究表明,當(dāng)SSR長度大于20 bp時(shí),此位點(diǎn)具有高度多態(tài)性,當(dāng)長度在 12~20 bp之間,此位點(diǎn)具有中等水平的多態(tài)性,而長度小于12 bp的SSR位點(diǎn)多態(tài)性較低[15]。因此本研究中對銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)進(jìn)行搜索時(shí),篩選標(biāo)準(zhǔn)為單核苷酸重復(fù)至少10次,二核苷酸重復(fù)至少6次,而三核苷酸至六核苷酸的重復(fù)次數(shù)要大于5次。經(jīng)統(tǒng)計(jì),銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)的長度集中分布在12~45 bp之間,其中長度大于20 bp的EST-SSR位點(diǎn)共有734個(gè),占總EST-SSR位點(diǎn)的7.59%;長度在12~20 bp之間的 EST-SSR位點(diǎn)有4 944個(gè),占總數(shù)的51.14%。Zhang等研究發(fā)現(xiàn),高級重復(fù)基元類型SSR位點(diǎn)的多態(tài)性要低于低級重復(fù)基元類型[16]。在本研究中檢索到的銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)主要是低級重復(fù)基元類型SSR位點(diǎn),如單核苷酸、二核苷酸、三核苷酸重復(fù)所占比例高達(dá)84.28%,對銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)長度進(jìn)行統(tǒng)計(jì)分析時(shí)發(fā)現(xiàn),長度大于20 bp的734個(gè)EST-SSR位點(diǎn)中,單核苷酸、二核苷酸重復(fù)基元類型有471個(gè), 占比達(dá)到64.17%,表明這部分銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)具有高度多態(tài)性潛能,有很好的利用潛質(zhì)。
3 討論與結(jié)論
SSR位點(diǎn)廣泛分布于真核生物基因組中,據(jù)統(tǒng)計(jì),真核生物基因組中每隔10~50 kb就存在1個(gè)SSR位點(diǎn),在植物基因組中,平均每23.3 kb就有1個(gè)SSR位點(diǎn)[17]。目前,轉(zhuǎn)錄組學(xué)研究涉及的物種越來越廣泛,尤其是基因組序列還未公布的物種,產(chǎn)生了大量的轉(zhuǎn)錄組測序數(shù)據(jù),對于這些數(shù)據(jù)的深度挖掘成為目前研究的熱點(diǎn)。本研究通過RNA-Seq技術(shù)對銀杏大、小孢子葉球進(jìn)行了轉(zhuǎn)錄組測序,經(jīng)過拼接組裝后得到108 307條unigenes,檢索后得到符合條件的EST-SSR位點(diǎn)9 668個(gè),出現(xiàn)頻率為8.92%,其出現(xiàn)頻率明顯高于魚腥草[5]、云南松[18]等物種,低于刺梨[4]等物種。造成不同物種間 EST-SSR位點(diǎn)出現(xiàn)頻率差異的原因可能是物種間SSR位點(diǎn)組成及分布的差異性。銀杏轉(zhuǎn)錄組中 EST-SSR位點(diǎn)種類與數(shù)量均比較豐富,可為銀杏SSR分子標(biāo)記的開發(fā)提供重要的參考。
不同物種之間EST-SSR位點(diǎn)主要重復(fù)類型同樣有所差異。很多植物的EST-SSR位點(diǎn)主要以二核苷酸、三核苷酸重復(fù)基元類型為主,比如云南松[18]。本研究發(fā)現(xiàn),銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)重復(fù)基元類型主要以單核苷酸重復(fù)為主,占全部SSR位點(diǎn)的58.57%,其次是二核苷酸重復(fù),這與紅松[19]、白皮松[20]等相似,但與云南松[18]、魚腥草[5]、刺梨[4]等物種有差異,這些物種EST-SSR位點(diǎn)的主要重復(fù)基元是三核苷酸重復(fù)。SSR位點(diǎn)基序類型中普遍存在A/T優(yōu)勢,而G/C重復(fù)基序類型出現(xiàn)頻率較低,在多數(shù)植物中很難發(fā)現(xiàn)。導(dǎo)致上述現(xiàn)象的可能原因是打破A/T堿基對之間氫鍵所需的能量要低于G/C堿基對,基因組中A/T的波動較G/C容易[21]。但也有觀點(diǎn)認(rèn)為,基因組甲基化使C轉(zhuǎn)化為T,同時(shí)3′末端polyA序列插入形成富含A的原始SSR位點(diǎn),導(dǎo)致重復(fù)基序中A/T優(yōu)勢的出現(xiàn)[22]。本研究發(fā)現(xiàn),銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)重復(fù)基序類型中單核苷酸重復(fù)基元類型出現(xiàn)最多的是A與T,兩者構(gòu)成的SSR位點(diǎn)占總SSR位點(diǎn)數(shù)量的56.82%。其次,二核苷酸重復(fù)基元類型中,AT和TA重復(fù)基序類型出現(xiàn)次數(shù)同樣很高,所占SSR位點(diǎn)比例分別為4.85%、3.96%,表現(xiàn)出較明顯的A/T優(yōu)勢。而G/C在所有重復(fù)基元類型中的出現(xiàn)頻率較低,由C和G組成的單核苷酸重復(fù)基元共19個(gè),占總SSR位點(diǎn)的0.16%,二核苷酸重復(fù)中GC和CG所占的比例僅分別為0.01%、0.003 7%。銀杏轉(zhuǎn)錄組EST-SSR位點(diǎn)不僅出現(xiàn)頻率高、平均分布頻率廣,且類型豐富,具有較高的多態(tài)性潛能和可用性。本研究積累了大量銀杏EST-SSR位點(diǎn)并明確了其基本特征,可為開發(fā)銀杏SSR分子標(biāo)記奠定重要的理論基礎(chǔ)。本研究的開展對于加快銀杏功能基因資源的開發(fā)利用,建立銀杏種質(zhì)資源評價(jià)和改良機(jī)制、快速準(zhǔn)確的苗期性別鑒定方法等具有重要的意義。
參考文獻(xiàn):
[1]趙 罕,朱高浦,劉夢培,等. 微衛(wèi)星分子標(biāo)記及其在林業(yè)中的應(yīng)用[J]. 世界林業(yè)研究,2013,26(6):21-26.
[2]程小毛,黃曉霞. SSR標(biāo)記開發(fā)及其在植物中的應(yīng)用[J]. 中國農(nóng)學(xué)通報(bào),2011,27(5):304-307.
[3]Sharma R,Maloo S R,Choudhary S,et al. Microsatellite markers:an important DNA fingerprinting tool for characterization of crop plants[J]. The Journal of Plant Science Research,2015,31(1):83.
[4]鄢秀芹,魯 敏,安華明. 刺梨轉(zhuǎn)錄組SSR信息分析及其分子標(biāo)記開發(fā)[J]. 園藝學(xué)報(bào),2015,42(2):341-349.
[5]黎曉英,劉勝貴,王 丹,等. 魚腥草轉(zhuǎn)錄組SSR位點(diǎn)信息分析及其多態(tài)性研究[J]. 中草藥,2016,47(10):1762-1767.
[6]黃海燕,杜紅巖,烏云塔娜,等. 基于杜仲轉(zhuǎn)錄組序列的SSR分子標(biāo)記的開發(fā)[J]. 林業(yè)科學(xué),2013,49(5):176-181.
[7]朱麗峰. 銀杏的景觀價(jià)值及其在園林中的應(yīng)用[J]. 林業(yè)調(diào)查規(guī)劃,2012,37(1):112-114.
[8]耿敏章. 銀杏中營養(yǎng)成分和功能因子的研究進(jìn)展[J]. 氨基酸和生物資源,2011,33(1):63-66,83.
[9]曹福亮,沈國航. 中國銀杏志[M]. 北京:中國林業(yè)出版社,2007.
[10]黃 茜,劉霽瑤,曹 敏,等. 銀杏性別特征表現(xiàn)與鑒別研究進(jìn)展[J]. 果樹學(xué)報(bào),2013,30(6):1065-1071.
[11]林開勤,趙德剛,李 巖,等. 杜仲性別相關(guān)EST-SSR標(biāo)記的開發(fā)[J]. 林業(yè)科學(xué),2016,52(10):146-152.
[12]許端祥,杜文麗,陳中釤,等. 基于瓠瓜轉(zhuǎn)錄組測序的EST-SSR標(biāo)記的開發(fā)及其應(yīng)用[J/OL]. 熱帶作物學(xué)報(bào):1-16[2019-12-19]. http://kns.cnki.net/kcms/detail/46.1019.S.20190912.1409.008.html.
[13]Grabherr M G,Haas B J,Yassour M,et al.Trinity:reconstructing a full-length transcriptome without a genome from RNA-Seq data[J]. Nature Biotechnology,2013,29(7):644-652.
[14]Faircloth B C.MSATCOMMANDER:detection of microsatellite repeat arrays and automated,locus-specific primer design[J]. Molecular Ecology Resourecs,2008,8(1):92-94.
[15]Temnykh S,Park W D,Ayres N,et al. Mapping and genome organization of microsatellite sequences in rice(Oryza sativa L. )[J]. Theoretical and Applied Genetics,2000,100(5):697-712.
[16]Zhang P Z,Dreisigacker S,Melchinger A E,et al. Quantifying novel sequence variation and selective advantage in synthetic hexaploid wheats and their backcross-derived lines using SSR markers[J]. Molecular Breeding,2005,15(1):1-10.
[17]Marathi B,Guleria S,Singh N K,et al. Molecular diversity and segregation distortion measured by SSR markers in a new plant type based recombinant inbred line population of rice[J]. Indian Journal of Genetics and Plant Breeding,2011,71(4):297-303.
[18]蔡年輝,許玉蘭,徐 楊,等. 云南松轉(zhuǎn)錄組SSR的分布及其序列特征[J]. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,37(5):770-778.
[19]張 振,張含國,莫 遲,等. 紅松轉(zhuǎn)錄組SSR分析及EST-SSR標(biāo)記開發(fā)[J]. 林業(yè)科學(xué)2015,51(8):114-120.
[20]李昕蔓,金卓穎,蘇安然,等. 白皮松EST-SSR序列分布特征及引物開發(fā)[J]. 林業(yè)與生態(tài)科學(xué),2019,34(3):266-272.
[21]Biswas M K,Chai L J,Mayer C,et al. Exploiting BAC-end sequences for the mining,characterization and utility of new short sequences repeat (SSR) markers in Citrus[J]. Molecular Biology Reports,2012,39(5):5373-5386.
[22]Li D J,Deng Z,Qin B,et al. De novo assembly and characterization of bark transcriptome using Illumina sequencing and development of EST-SSR markers in rubber tree (Hevea brasiliensis Muell.Arg.)[J]. BMC Genomics,2012,13(1):192.