賈新平,葉曉青,梁麗建,鄧衍明,孫曉波,佘建明
(江蘇省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)生物技術(shù)研究所 江蘇省農(nóng)業(yè)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京210014)
海濱雀稗(Paspalumvaginatum,Seashore paspalum)是禾本科(Gramineae)黍族(Paniceae)雀稗屬(Paspalum)的多年生草本植物,原產(chǎn)于美洲,為潮間帶草灘植被的主要組分[1-2]。海濱雀稗是目前耐鹽能力最強(qiáng)的草坪草種,還具有較強(qiáng)的耐澇、耐旱、耐踐踏和耐磨損特性,能在復(fù)雜的逆境條件下生長(zhǎng)[3-8]。海濱雀稗的葉色翠綠,景觀效果優(yōu)于狗牙根(Cynodondactylon)、結(jié)縷草(Zoysiajaponica)和假儉草(Eremochloaophiuroides)等暖季型禾草,作為草坪草在世界熱帶與亞熱帶地區(qū)廣為種植,已成為21世紀(jì)最具發(fā)展?jié)摿Φ牟萜翰莘N[9]。同時(shí),海濱雀稗還具有良好的適口性和營(yíng)養(yǎng)價(jià)值,可作為優(yōu)良牧草加以利用[10]。關(guān)于海濱雀稗的遺傳多樣性、分子標(biāo)記輔助育種等研究已有報(bào)道[11-12],但其基因組和轉(zhuǎn)錄組信息的缺乏,造成海濱雀稗分子標(biāo)記開發(fā)、遺傳圖譜構(gòu)建、生長(zhǎng)發(fā)育及其抗逆機(jī)理方面的研究相對(duì)滯后[13]。
近年來,包括基因組、轉(zhuǎn)錄組、蛋白質(zhì)組等各種組學(xué)技術(shù)在揭示細(xì)胞生理活動(dòng)規(guī)律和生物代謝機(jī)理的研究中起著越來越重要的作用,而轉(zhuǎn)錄組學(xué)是率先發(fā)展起來以及應(yīng)用最為廣泛的技術(shù)[14]。轉(zhuǎn)錄組(transcriptome)是指細(xì)胞在特定狀態(tài)下全部表達(dá)的RNA的總和,反映相同基因在不同條件下表達(dá)水平的差異,并能揭示不同基因的相互作用及各自功能[15]。轉(zhuǎn)錄組測(cè)序能全面快速地獲得某一物種特定細(xì)胞或組織在某一狀態(tài)下的基因表達(dá)情況,用于研究基因結(jié)構(gòu)和功能、可變剪接和新轉(zhuǎn)錄本預(yù)測(cè)等[16-20]。相對(duì)于傳統(tǒng)的芯片雜交平臺(tái),轉(zhuǎn)錄組測(cè)序無需已知序列設(shè)計(jì)探針,可對(duì)任意物種的整體轉(zhuǎn)錄活動(dòng)進(jìn)行檢測(cè),提供更精確的數(shù)字化信號(hào),更高的檢測(cè)通量以及更廣泛的檢測(cè)范圍。對(duì)于許多缺乏基因組信息的物種而言,轉(zhuǎn)錄組研究已在非模式植物中得到了廣泛應(yīng)用[21-26]。
盡管海濱雀稗具有很高的經(jīng)濟(jì)價(jià)值和生態(tài)價(jià)值,但其分子生物學(xué)研究進(jìn)展緩慢,基因數(shù)據(jù)庫(kù)資源也十分匱乏。隨著高通量測(cè)序技術(shù)的迅速發(fā)展,極大地促進(jìn)了植物基因表達(dá)研究,這樣不僅可降低測(cè)序的成本和時(shí)間,而且還可以獲得豐富的數(shù)據(jù),有利于植物生長(zhǎng)發(fā)育及其抗逆等方面的研究[27]。到目前為止,利用新一代高通量測(cè)序技術(shù)進(jìn)行草坪種質(zhì)資源創(chuàng)新與開發(fā)的研究還未見報(bào)道。本研究首次將Illumina HiSeq 2000高通量測(cè)序技術(shù)應(yīng)用到草坪草轉(zhuǎn)錄組研究中,將測(cè)序得到的海量數(shù)據(jù)進(jìn)行拼接與組裝,結(jié)合生物信息學(xué)方法對(duì)所獲得的unigene進(jìn)行基因功能注釋、功能分類、代謝途徑等分析,從功能基因組水平上研究海濱雀稗生長(zhǎng)發(fā)育過程中重要基因的表達(dá),同時(shí)也為進(jìn)一步的分子標(biāo)記開發(fā)和基因功能研究奠定基礎(chǔ)。
試驗(yàn)材料為海濱雀稗品種“Adalayd”,由江蘇省農(nóng)業(yè)科學(xué)院生物技術(shù)所植物細(xì)胞工程課題組提供。試驗(yàn)于2013年8月在江蘇省農(nóng)業(yè)科學(xué)院生物技術(shù)所溫室中進(jìn)行,選取長(zhǎng)勢(shì)良好、健康的植株葉片,迅速將其放入紙帶內(nèi),立即經(jīng)液氮速凍后保存于實(shí)驗(yàn)室超低溫冰箱中備用。
利用TRIzoL法提取試驗(yàn)材料海濱雀稗葉片的總RNA。將樣品放入研缽,加適量液氮迅速研磨,轉(zhuǎn)移到經(jīng)DEPC處理的2mL離心管中,加入1mL TRIzoL(Invitrogen,CarLsbad-CA92008,USA),旋渦振蕩混勻,室溫靜置10min;4℃、12000r/min離心10min,將上清液移入新的1.5mL離心管,加入等體積的氯仿∶異戊醇(24∶1)混合液,用力搖15s,室溫靜置10min;4℃、12000r/min離心10min,將上清液移至新的1.5mL離心管,加入等體積的異丙醇,室溫靜置10min;4℃、12000r/min離心15min,去除上清液,用RNase-free水配制的75%乙醇洗滌;4℃、12000r/min離心15min,去除上清液;置于冰上自然干燥5min,用RNase-free水溶解,保存于-70℃?zhèn)溆?。用AgiLent 2100BioanaLyzer檢測(cè)RNA提取質(zhì)量,RIN值≥7.0。
提取樣品總RNA后,用帶有Oligo(dT)的磁珠富集mRNA。首先加入破碎緩沖液將mRNA打斷成短序列,以這些短序列為模板,用六堿基隨機(jī)引物合成第1條cDNA鏈,然后加入緩沖液、dNTPs、RNase H和DNA polymerase I合成第2條cDNA鏈。cDNA經(jīng)過試劑盒純化并加EB緩沖液洗脫之后做末端修復(fù)、加poly(A)并連接測(cè)序接頭,然后用瓊脂糖凝膠電泳進(jìn)行序列大小選擇,最后進(jìn)行PCR擴(kuò)增,建好的測(cè)序文庫(kù)用Illumina HiSeqTM2000進(jìn)行測(cè)序。采用Illumina兩個(gè)末端(PE)測(cè)序法,最初的原始序列為100bp。原始的測(cè)序結(jié)果去除制備文庫(kù)時(shí)產(chǎn)生的接頭序列、兩端低質(zhì)量序列和低度復(fù)雜序列,再利用SOAPdenovo軟件進(jìn)行序列拼接[26],之后通過連接兩末端和填補(bǔ)空位,將拼接成的重疊群(Contig),進(jìn)一步組裝成unigene。轉(zhuǎn)錄組測(cè)序產(chǎn)生的原始序列信息已提交到NCBI的SRA數(shù)據(jù)庫(kù)(SRA BioProject:SRX383837)。
采用序列比對(duì)的方法對(duì)unigene進(jìn)行序列相似性分析,使用BLAST程序?qū)⑵唇拥玫降膗nigene與核酸、蛋白質(zhì)數(shù)據(jù)庫(kù)進(jìn)行比對(duì)(E值≤1×10-10),選取最佳的功能注釋。核酸數(shù)據(jù)庫(kù)為NCBI的非冗余核酸序列數(shù)據(jù)庫(kù)(non-redundant nucleotide database,Nt),蛋白質(zhì)數(shù)據(jù)庫(kù)包括 NCBI的非冗余核酸數(shù)據(jù)庫(kù)(non-redundant protein database,Nr)和SwissProt(swissprot protein sequence database)蛋白質(zhì)序列數(shù)據(jù)庫(kù)。根據(jù) NCBI數(shù)據(jù)庫(kù)的功能注釋信息,使用Blast2GO軟件[27]得到unigene的GO條目,然后用WEGO軟件[28]對(duì)所有的unigene進(jìn)行GO功能分類統(tǒng)計(jì)。然后對(duì)unigene分別進(jìn)行蛋白質(zhì)直系同源數(shù)據(jù)庫(kù)(cluster of orthologous groups,COG)功能分類和京東基因與基金組百科全書(kyoto encyclopedia of genes and genomes,KEGG)代謝途徑分析。
對(duì)海濱雀稗轉(zhuǎn)錄組中的unigene序列進(jìn)行簡(jiǎn)單重復(fù)序列(simple sequence repeats,SSR)位點(diǎn)搜索,搜索標(biāo)準(zhǔn)為:?jiǎn)?、二、三、四、五、六核苷酸基序(motif)至少重復(fù)次數(shù)分別為10,8,5,4,3,3,對(duì)查找的SSR類型進(jìn)行特征分析。
采用Illumina HiSeq 2000高通量測(cè)序技術(shù)對(duì)海濱雀稗葉片轉(zhuǎn)錄組進(jìn)行了測(cè)序,共得到47520544個(gè)reads片段,每個(gè)reads的長(zhǎng)度為100bp,即測(cè)序獲得了4752054400bp(4.75Gb)的序列信息。采用SOAPdenovo軟件對(duì)reads序列聚類進(jìn)行拼接,共獲得966165個(gè)contig序列。其中,長(zhǎng)度50~100bp的contig序列有761498個(gè),占總體的78.82%;100~200bp的contig序列有125173個(gè),占總體的12.96%;而≥200bp的contig序列有79494個(gè),占總體的8.22%(表1)。由此可見,contig序列主要以長(zhǎng)度為50~100bp為主,完全符合Illumina測(cè)序的預(yù)期結(jié)果,為后續(xù)的數(shù)據(jù)組裝提供很好的原始數(shù)據(jù)。
在contig數(shù)據(jù)的基礎(chǔ)上,進(jìn)一步對(duì)序列進(jìn)行組裝,共獲得81220個(gè)unigene,序列信息達(dá)到了87542503bp(87.54Mb),序列大小為201~16328bp,平均長(zhǎng)度為1077bp,N50為1680bp。其中,長(zhǎng)度200~500bp的unigene有29325個(gè),占總體的36.11%;500~1000bp的unigene有18341個(gè),占總體的22.58%;≥1000bp的unigene有33554個(gè),占總體的41.31%(表2)。
表1 海濱雀稗轉(zhuǎn)錄組contig數(shù)據(jù)組裝質(zhì)量統(tǒng)計(jì)Table 1 Data assembly for contig in the transcriptome of P. vaginatum
表2 海濱雀稗轉(zhuǎn)錄組unigene數(shù)據(jù)組裝質(zhì)量統(tǒng)計(jì)Table 2 Data assembly for unigene in the transcriptome of P. vaginatum
表3 海濱雀稗unigene的GC含量統(tǒng)計(jì)Table 3 Data assembly for GC content of P. vaginatumunigene
GC含量是基因組堿基序列的重要特征之一,能反映基因的結(jié)構(gòu)、功能和進(jìn)化信息,GC分布不均勻?qū)е禄蚪M不同GC含量序列其性質(zhì)和功能也有差異。海濱雀稗unigene的GC平均含量為49.98%,其中GC含量40%~60%的unigene(59903個(gè))占總體的73.75%,GC含量20%~40%的unigene(6552個(gè))占總體的8.07%,GC含量60%~80%的unigene(14765個(gè))占總體的18.18%,而GC含量過高(大于80%)或過低(小于20%)的unigene不存在,表明GC含量基本呈正態(tài)分布(表3)。
用RPKM方法計(jì)算unigene的表達(dá)水平,可消除基因長(zhǎng)度差異和測(cè)序深度的影響[29]。海濱雀稗全部unigene的RPKM平均值為28.68,最大值為50812.5(unigene 42358)。281個(gè)unigene的RPKM 值大于500,其中許多基因參與到海濱雀稗的多種生理活動(dòng)和代謝過程中。91個(gè)unigene的RPKM值低于0.2,說明Illumina HiSeq 2000能夠檢測(cè)到極低水平的基因表達(dá)。
2.2.1 unigene的序列相似性分析 使用BLAST程序?qū)⒔M裝得到的unigene與Nr、Nt、SwissProt數(shù)據(jù)庫(kù)進(jìn)行比對(duì),進(jìn)行unigene的序列相似性分析。結(jié)果表明,38446個(gè)unigene在Nr數(shù)據(jù)庫(kù)中可找到相似序列,E值小于1×10-100的unigene有22629個(gè)(占總體的58.86%),E值介于1×10-10~1×10-100的unigene有15817個(gè)(占總體的41.14%);相似序列匹配的近緣物種中,高粱(Sorghumbicolor)所占比例最高(45.76%),隨后依次是玉米(Zeamays,38.68%)、水稻(Oryzasativa,8.91%)、小麥(Triticumaestivum,2.45%)和其他物種(4.20%)(圖1)。46169個(gè)unigene在Nt數(shù)據(jù)庫(kù)中可找到相似序列,E值小于1×10-100的unigene有28599個(gè)(占總體的61.94%),E值介于1×10-10~1×10-100的unigene有17570個(gè)(占總體的38.06%);相似序列匹配的近緣物種中,高粱所占比例最高(62.72%),隨后依次是玉米(25.82%)、水稻(3.81%)、短柄草(Brachypodiumdistachyon,2.11%)和其他物種(5.54%)。24471個(gè)unigene在SwissProt數(shù)據(jù)庫(kù)中可找到相似序列,E值小于1×10-100的unigene有8742個(gè)(占總體的35.72%),E值介于1×10-10~1×10-100的unigene有15729個(gè)(占總體的64.28%);相似序列匹配的近緣物種中,擬南芥(Arabidopsisthaliana)所占比例最高(46.03%),隨后依次是水稻(20.10%)、玉米(8.30%)、小麥(3.73%)和其他物種(21.84%)(圖1)。由于缺乏海濱雀稗的基因組、EST和蛋白序列信息,部分unigene在數(shù)據(jù)庫(kù)中無法匹配到已知基因。
圖1 海濱雀稗unigene的序列相似性分析Fig.1 Characteristics of homology search of P. vaginatumunigene
2.2.2 unigene的GO分類 基因本體論(gene ontology,GO)是一個(gè)國(guó)際標(biāo)準(zhǔn)化的基因功能分類數(shù)據(jù)庫(kù),用于全面地描述不同生物中基因的生物學(xué)特征。結(jié)合GO數(shù)據(jù)庫(kù)對(duì)海濱雀稗的unigene進(jìn)行功能分類,從宏觀上認(rèn)識(shí)海濱雀稗表達(dá)基因的功能分布特征。GO數(shù)據(jù)庫(kù)包括3個(gè)相對(duì)獨(dú)立的本體,分別描述所處的細(xì)胞組分(cellular component)、分子功能(molecular function)和參與的生物學(xué)過程(biological process)。研究結(jié)果表明,可將海濱雀稗unigene劃分為48個(gè)功能組,并對(duì)每個(gè)功能組涉及的unigene進(jìn)行了統(tǒng)計(jì)分析。從圖2中可以看出,51497個(gè)unigene歸屬于細(xì)胞組分,22718個(gè)unigene歸屬于分子功能,60856個(gè)unigene歸屬于生物學(xué)過程,這一分類結(jié)果顯示了海濱雀稗生長(zhǎng)過程中基因表達(dá)譜的總體情況。其中,“細(xì)胞成分”(18763個(gè))、“細(xì)胞進(jìn)程”(17347個(gè))、“代謝進(jìn)程”(13891個(gè))和“結(jié)合活性”(10726個(gè))功能組中涉及的unigene較多,而“翻譯調(diào)節(jié)活性”(7個(gè))、“金屬伴侶蛋白活性”(4個(gè))、“氮素利用”(2個(gè))和“蛋白標(biāo)簽”(2個(gè))功能組中涉及的unigene較少。
2.2.3 unigene的COG功能分類 蛋白質(zhì)直系同源數(shù)據(jù)庫(kù)(cluster of orthologous groups,COG)是對(duì)基因產(chǎn)物進(jìn)行直系同源分類的數(shù)據(jù)庫(kù)。將海濱雀稗unigene與COG數(shù)據(jù)庫(kù)進(jìn)行比對(duì),預(yù)測(cè)unigene功能并進(jìn)行分類統(tǒng)計(jì)。研究結(jié)果表明,海濱雀稗unigene根據(jù)其功能大致可分為25類,并對(duì)每類的unigene進(jìn)行了統(tǒng)計(jì)分析(圖3中用A~Z表示)。從圖中可以看出,unigene涉及的COG功能類別比較全面,涉及了大多數(shù)的生命活動(dòng)。其中,一般功能預(yù)測(cè)類基因最多(4716個(gè));其次是未知功能類基因(3306個(gè))、翻譯,核糖體結(jié)構(gòu)和生物發(fā)生類基因(2662個(gè))、翻譯后修飾,蛋白質(zhì)折疊和分子伴侶類基因(2247個(gè))和碳水化合物運(yùn)輸和代謝類基因(2087個(gè));而胞外結(jié)構(gòu)類基因(11個(gè))和核結(jié)構(gòu)類基因較少(7個(gè));其他類別的基因表達(dá)豐度都各不相同。
圖2 海濱雀稗unigene的GO分類Fig.2 GO functional categories of P. vaginatumunigene
圖3 海濱雀稗unigene的COG功能分類Fig.3 COG function classification of P. vaginatumunigene
2.2.4 unigene的 KEGG分析 KEGG(kyoto encyclopedia of genes and genomes)是系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及基因產(chǎn)物功能的數(shù)據(jù)庫(kù)。根據(jù)KEGG數(shù)據(jù)庫(kù)的注釋信息能進(jìn)一步得到unigene的pathway注釋[30]。結(jié)合KEGG數(shù)據(jù)庫(kù),對(duì)海濱雀稗的unigene可能參與或涉及的代謝途徑進(jìn)行了統(tǒng)計(jì)分析。研究結(jié)果表明,可將海濱雀稗的unigene歸屬于五大類的代謝途徑,主要包括碳水化合物代謝、氨基酸代謝、脂類物質(zhì)代謝、次生物質(zhì)代謝、復(fù)制與修復(fù)、轉(zhuǎn)錄與翻譯、信號(hào)轉(zhuǎn)導(dǎo)等19類代謝途徑(圖4)。將KEGG pathway數(shù)據(jù)庫(kù)作為參考,可將unigene定位到112個(gè)具體的代謝途徑分支。其中,涉及糖異生和糖酵解途徑的基因有140個(gè),占總體的3.35%;磷脂酰肌醇信號(hào)系統(tǒng)途徑的基因有133個(gè),占總體的3.18%;甘油磷脂代謝途徑的基因有130個(gè),占總體的3.11%;苯丙氨酸代謝途徑的基因有79個(gè),占總體的1.89%;RNA降解途徑的基因有68個(gè),占總體的1.63%;黃酮類化合物合成途徑的基因有44個(gè),占總體的1.05%;植物與病原物互作的基因有23個(gè),占總體的0.56%(表4)。
圖4 海濱雀稗unigene的KEGG分類Fig.4 KEGG classification of P. vaginatumunigene
對(duì)海濱雀稗的81220個(gè)unigene進(jìn)行SSR位點(diǎn)搜索,共檢測(cè)到22721個(gè)SSR位點(diǎn)。SSR的類型豐富,單核苷酸至六核苷酸重復(fù)類型均存在,所占比例變化較大(表5)。其中,三核苷酸重復(fù)所占比例最高,達(dá)到了31.71%;比例最低的是二核苷酸重復(fù),僅為4.35%;五核苷酸重復(fù)和六核苷酸重復(fù)所占比例基本相同,分別為14.15%和14.67%。在檢測(cè)到的SSR中,出現(xiàn)頻率最高的10類基序?yàn)椋篈/T(6198個(gè))、CCG/CGG(2992個(gè))、AGC/CTG(1277個(gè))、AGG/CCT(1249個(gè))、AG/CT(776個(gè))、ACG/CGT(516個(gè))、AAG/CTT(415個(gè))、ACC/GGT(376個(gè))、AGAGG/CCTCT(259個(gè))、AGGG/CCCT(197個(gè))。上述SSR特征分析,有助于開展海濱雀稗及其同屬物種的基因組差異分析、通用性標(biāo)記開發(fā)和遺傳圖譜構(gòu)建的研究。
隨著新一代高通量測(cè)序技術(shù)的廣泛應(yīng)用,植物基因組研究得到快速發(fā)展,但草坪草基因組研究還相對(duì)較少。Illumina高通量測(cè)序的數(shù)據(jù)量大、速度快、成本低、效率高[31],適合于沒有基因組信息的海濱雀稗展開轉(zhuǎn)錄組測(cè)序研究?;谵D(zhuǎn)錄組學(xué)在功能基因組學(xué)研究中的重要價(jià)值,本研究應(yīng)用Illumina高通量測(cè)序技術(shù)對(duì)海濱雀稗轉(zhuǎn)錄組進(jìn)行測(cè)序,研究其基因表達(dá)譜和挖掘生長(zhǎng)發(fā)育過程中的重要表達(dá)基因。對(duì)海濱雀稗轉(zhuǎn)錄組進(jìn)行測(cè)序,獲得了
47520544個(gè)reads序列;對(duì)reads序列進(jìn)行拼接,共獲得了966165個(gè)contig序列。在contig數(shù)據(jù)的基礎(chǔ)上,序列組裝后得到了81220個(gè)unigene,長(zhǎng)度大小從201~16328bp,平均長(zhǎng)度為1077bp,N50值為1680bp(N50指從組裝最長(zhǎng)的unigene依次向下求長(zhǎng)度的總加和,當(dāng)累加長(zhǎng)度達(dá)到組裝長(zhǎng)度的一半時(shí),對(duì)應(yīng)的unigene長(zhǎng)度是N50長(zhǎng)度。N50值越大,反映組裝得到的長(zhǎng)片段越多,組裝效果就越好。測(cè)序數(shù)據(jù)產(chǎn)量和數(shù)據(jù)組裝質(zhì)量是轉(zhuǎn)錄組測(cè)序完成情況的重要指標(biāo)。以上研究結(jié)果表明,此次序列組裝的質(zhì)量和長(zhǎng)度可以滿足轉(zhuǎn)錄組分析的基本要求,且新一代高通量測(cè)序技術(shù)是批量發(fā)現(xiàn)海濱雀稗功能基因的更為有效手段,進(jìn)一步說明Illumina HiSeq 2000是高通量轉(zhuǎn)錄組測(cè)序的可靠平臺(tái)。
表4 海濱雀稗unigene的代謝途徑分析Table 4 Analysis of metabolic pathways of P. vaginatumunigene
續(xù)表4 Continued
表5 海濱雀稗SSR不同重復(fù)基序分布及優(yōu)勢(shì)堿基組成Table 5 Distribution and compositions of the dominant repeat of the different repeat motifs for SSR
結(jié)合生物信息學(xué)分析方法,對(duì)海濱雀稗unigene與Nr、Nt、SwissProt數(shù)據(jù)庫(kù)進(jìn)行比對(duì),進(jìn)行序列相似性和功能注釋分析。46169個(gè)unigene與其他近緣生物的已知基因具有不同程度的同源性,并且還獲得了35051個(gè)新的unigene(占總體的56.84%),表明在對(duì)海濱雀稗基因組及遺傳背景幾乎不清楚的情況下,高通量測(cè)序技術(shù)是批量發(fā)現(xiàn)海濱雀稗功能基因的有效手段。雖然GO是個(gè)標(biāo)準(zhǔn)化的生物信息本體數(shù)據(jù)庫(kù),被廣泛地用于基因的注釋功能,然而由于GO結(jié)構(gòu)設(shè)計(jì)上的缺陷以及基因的許多特征還未被發(fā)現(xiàn),使得這種基因注釋信息尚不完全。因此,本研究中的海濱雀稗unigene基于GO數(shù)據(jù)庫(kù)進(jìn)行的相關(guān)功能注釋信息還不完善,還有部分的unigene沒有賦予了可能的GO條目,有待通過其他生物信息學(xué)方法對(duì)unigene功能注釋進(jìn)一步補(bǔ)充。利用COG數(shù)據(jù)庫(kù)對(duì)海濱雀稗unigene進(jìn)行基因功能分類,可從基因組水平上找尋直系同源體,預(yù)測(cè)未知ORF的生物學(xué)功能,可以大大提高基因功能注釋的準(zhǔn)確性。根據(jù)KEGG數(shù)據(jù)庫(kù)對(duì)上述unigene進(jìn)行代謝途徑分析,涉及112個(gè)具體的代謝途徑分支,參與到海濱雀稗體內(nèi)的碳水化合物代謝、脂類代謝、次生物質(zhì)代謝等過程中,為進(jìn)一步大量挖掘海濱雀稗生長(zhǎng)發(fā)育過程中的重要表達(dá)基因,開展海濱雀稗的基因克隆及功能驗(yàn)證等研究提供了基礎(chǔ)數(shù)據(jù)。
SSR分子標(biāo)記具有操作簡(jiǎn)便、重復(fù)性好、多態(tài)性豐富、遺傳信息量大、共顯性遺傳等優(yōu)點(diǎn),已在遺傳多樣性分析、遺傳圖譜構(gòu)建、功能基因發(fā)掘、分子標(biāo)記輔助育種等研究中得到了廣泛應(yīng)用[32-36]。采取實(shí)驗(yàn)室手段開發(fā)SSR引物費(fèi)時(shí),耗力,成本高,試驗(yàn)復(fù)雜,基于轉(zhuǎn)錄組數(shù)據(jù)庫(kù)信息進(jìn)行SSR分子標(biāo)記開發(fā)將是一種既經(jīng)濟(jì)又有效的方法。目前,海濱雀稗可利用的分子標(biāo)記數(shù)量非常有限,轉(zhuǎn)錄組產(chǎn)生的海量數(shù)據(jù)為SSR分子標(biāo)記的開發(fā)提供了更豐富和極有價(jià)值的可利用資源。本研究通過查找發(fā)現(xiàn)了22721個(gè)SSR位點(diǎn),SSR不但出現(xiàn)頻率高,而且類型豐富。利用在線引物設(shè)計(jì)軟件共設(shè)計(jì)出8758對(duì)SSR引物,進(jìn)一步可對(duì)這些SSR引物進(jìn)行擴(kuò)增檢測(cè),篩選出擴(kuò)增穩(wěn)定、條帶清晰、多態(tài)性好的引物,為進(jìn)一步開發(fā)新的SSR標(biāo)記奠定了基礎(chǔ)。SSR分子標(biāo)記的開發(fā)可用于草坪草功能基因的挖掘、豐富分子標(biāo)記類型、遺傳資源評(píng)價(jià)、重要性狀的輔助選擇等研究,有助于促進(jìn)草坪草遺傳育種的發(fā)展[37-38]。
本研究首次在國(guó)內(nèi)外采用Illumina HiSeq 2000高通量測(cè)序技術(shù)建立了海濱雀稗轉(zhuǎn)錄組數(shù)據(jù)庫(kù),獲得了大量的轉(zhuǎn)錄本信息,并對(duì)表達(dá)基因進(jìn)行了序列組裝、功能注釋、代謝途徑等分析,為今后更深入研究海濱雀稗功能基因組、基因克隆及抗逆機(jī)理研究提供了極大的方便,而且該轉(zhuǎn)錄組數(shù)據(jù)還可以作為今后海濱雀稗基因組的參考序列,為海濱雀稗的分子生物學(xué)研究提供寶貴的基因組數(shù)據(jù)來源。
[1]解新明,盧小良.海雀稗種質(zhì)資源的優(yōu)良特性及其利用價(jià)值[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2004,25:64-67.
[2]常盼盼,鐘小仙,劉智微.海濱雀稗體細(xì)胞突變體SP2008-3的特異性分析[J].草業(yè)學(xué)報(bào),2012,21(6):207-212.
[3]陳靜波,褚曉晴,李珊,等.鹽水灌溉對(duì)7屬11種暖季型草坪草生長(zhǎng)的影響及抗鹽性差異[J].草業(yè)科學(xué),2012,29(8):1185-1192.
[4]盧少云,郭振飛.草坪草逆境生理研究進(jìn)展[J].草業(yè)學(xué)報(bào),2003,12(4):7-13.
[5]Cardona C A,Duncan R R,Lindstrom O.Low temperature tolerance assessment in paspalum[J].Crop Science,1997,37(4):1283-1291.
[6]Carrow R N.Seashore paspalum ecotype responses to drought and root limiting stresses[J].USGA Turfgrass and Environmental Research,2005,4(13):1-9.
[7]Huang B,Duncan R R,Carrow R N.Drought resistance mechanisms of seven warm-season turfgrasses under surface soil drying:I.Shoot response[J].Crop Science,1997,37(6):1858-1863.
[8]Unruh,J B,Brecke B J,Partridge D E.Seashore paspalum performance to potable water[J].USGA Turfgrass and Environmental Research,2007,6(23):1-10.
[9]葉曉青,佘建明,梁流芳,等.海雀稗體細(xì)胞低溫篩選獲得耐寒突變體[J].草地學(xué)報(bào),2010,18(1):97-102.
[10]劉國(guó)道,羅麗娟.中國(guó)熱帶飼用植物資源[M].北京:中國(guó)農(nóng)業(yè)大學(xué)出版社,1999:176-179.
[11]賀小霞,劉一明,王兆龍.海濱雀稗栽培品種的形態(tài)特征與AFLP分子標(biāo)記分析[J].草地學(xué)報(bào),2011,19(1):164-170.
[12]解新明,盧小良,孫雄松,等.海雀稗種質(zhì)資源RAPD分子標(biāo)記的遺傳多樣性研究[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2004,25:10-15.
[13]井趙斌,魏琳,俞靚,等.轉(zhuǎn)錄組測(cè)序及其在牧草基因資源發(fā)掘中的應(yīng)用前景[J].草業(yè)科學(xué),2012,28(7):1364-1369.
[14]Lockhart D J,Winzeler E A.Genomics,gene express and DNA arrays[J].Nature,2000,405:827-836.
[15]Velculescu V E,Zhang L,Zhou W,etal.Characterization of the yeast transcriptome[J].Cell,1997,88(2):243-251.
[16]Alagna F D,Agostino N,Torchia L,etal.Comparative 454pyrosequencing of transcripts from two olive genotypes during fruit development[J].BMC Genomics,2009,10:399.
[17]Barakat A,DiLoreto D S,Zhang Y,etal.Comparison of the transcriptomes of American chestnut(Castaneadentata)and Chinese chestnut(Castaneamollissima)in response to the chestnut blight infection[J].BMC Plant Biology,2009,9:51.
[18]Dassanayake M,Haas J S,Bohnert H J,etal.Shedding light on an extremophile lifestyle through transcriptomics[J].New Phytologist,2009,183(3):764-775.
[19]Maher C A,Kumar-Sinha C,Cao X,etal.Transcriptome sequencing to detect gene fusions in cancer[J].Nature,2009,458:97-101.
[20]Wang E T,Sandberg R,Luo S,etal.Alternative isoform regulation in human tissue transcriptomes[J].Nature,2008,456:470-476.
[21]張爭(zhēng),高志暉,魏建和,等.三年生白木香機(jī)械傷害轉(zhuǎn)錄組學(xué)研究[J].藥學(xué)學(xué)報(bào),2012,47(8):1106-1110.
[22]楊楠,趙凱歌,陳龍清.蠟梅花轉(zhuǎn)錄組數(shù)據(jù)分析及次生代謝產(chǎn)物合成途徑研究[J].北京林業(yè)大學(xué)學(xué)報(bào),2012,34(1):104-107.
[23]Franssen S U,Shrestha R P,Brautigam A,etal.Comprehensive transcriptome analysis of the highly complexPisumsativumgenome using next generation sequencing[J].BMC Genomics,2011,12:227.
[24]Der J P,Barker M S,Wickett N J,etal.De novo characterization of the gametophyte transcriptome in bracken fern,Pteridiumaquilinum[J].BMC Genomics,2011,12(1):99.
[25]王曉鋒,何衛(wèi)龍,蔡衛(wèi)佳,等.馬尾松轉(zhuǎn)錄組測(cè)序和分析[J].分子植物育種,2013,11(3):385-392.
[26]Li R Q,Zhu H M,Ruan J.De novo assembly of human genomes with massively parallel short read sequencing[J].Genome Research,2010,20(2):265-272.
[27]Conesa A,Gtz S,García-Gómez J M,etal.Blast2GO:a universal tool for annotation,visualization and analysis in functional genomics research[J].Bioinformatics,2005,21(18):3674-3676.
[28]Ye J,F(xiàn)ang L,Zheng H,etal.WEGO:a web tool for plotting GO annotations[J].Nucleic Acids Research,2006,34:293-297.
[29]Mortazavi A,Williams B A,McCue K,etal.Mapping and quantifying mammalian transcriptomes by RNA-Seq[J].Nature Methods,2008,5(7):621-628.
[30]林萍,曹永慶,姚小華,等.普通油茶種子4個(gè)發(fā)育時(shí)期的轉(zhuǎn)錄組分析[J].分子植物育種,2011,9(4):498-505.
[31]祁云霞,劉永斌,榮威恒.轉(zhuǎn)錄組研究新技術(shù):RNA-Seq及其應(yīng)用[J].遺傳,2011,33(11):1191-1202.
[32]宋建,陳杰,陳火英,等.利用SSR分子標(biāo)記分析番茄的遺傳多樣性[J].上海交通大學(xué)學(xué)報(bào),2006,24(6):524-528.
[33]陳海梅,李林志,衛(wèi)憲云,等.小麥EST-SSR標(biāo)記的開發(fā)、染色體定位和遺傳作圖[J].科學(xué)通報(bào),2005,50(20):2208-2216.
[34]劉峰,王運(yùn)生,田雪亮,等.辣椒轉(zhuǎn)錄組SSR挖掘及其多態(tài)性分析[J].園藝學(xué)報(bào),2012,39(1):168-174.
[35]Yang H B,Liu W Y,Kang W H,etal.Development of SNP markers linked to the L locus inCapsicumspp.by a compara-tive genetic analysis[J].Molecular Breeding,2009,24(4):433-446.
[36]Yi G,Lee J M,Lee S,etal.Exploitation of pepper EST-SSRs and an SSR-based linkage map[J].Theoretical and Applied Genetics,2006,114(1):113-130.
[37]曾亮,袁慶華,王方,等.冰草屬植物種質(zhì)資源遺傳多樣性的ISSR分析[J].草業(yè)學(xué)報(bào),2013,22(1):260-267.
[38]陳群,袁曉君,何亞麗.高羊茅單株耐熱性相關(guān)分子標(biāo)記的篩選及其與越夏性的關(guān)系研究[J].草業(yè)學(xué)報(bào),2013,22(5):84-95.