王 芬,木 仁,張 雯,馬 媛,郭治友,崔寶祿,李 靜
(黔南民族師范學(xué)院生物科學(xué)與農(nóng)學(xué)院,貴州 都勻 558000)
【研究意義】茶樹(shù)Camellia sinensis(L.)O.Kuntze屬山茶科、山茶屬,異花授粉植物,起源于中國(guó)西南一帶,為葉用經(jīng)濟(jì)作物,作為受大眾歡迎的世界性飲品,具有非常強(qiáng)的保健作用[1-2]。茶產(chǎn)業(yè)作為中國(guó)的優(yōu)勢(shì)特色產(chǎn)業(yè),在助力貴州農(nóng)業(yè)農(nóng)村鄉(xiāng)村振興方面具有重要的經(jīng)濟(jì)價(jià)值[3]。伴隨著茶葉貿(mào)易全球化,消費(fèi)者對(duì)茶葉質(zhì)量的追求日益提高,提高茶葉品質(zhì)是發(fā)展茶產(chǎn)業(yè)的重中之重。都勻毛尖茶在貴州省黔南州大面積推廣,種植面積高達(dá)160萬(wàn)畝,40萬(wàn)群眾以茶為業(yè)。都勻毛尖原料大部分為都勻本地種與引進(jìn)的福鼎大白茶,福鼎大白茶發(fā)芽率高、抗旱性強(qiáng),是十分優(yōu)良的茶樹(shù)遺傳資源[4]。茶中的茶多酚、氨基酸和咖啡堿是茶葉滋味和品質(zhì)的主要組成成分,其中茶多酚和氨基酸具有多種保健功能[5-7]。目前基于二代轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)茶樹(shù)的研究已經(jīng)得到廣泛應(yīng)用[8-10],但由于其讀長(zhǎng)短,拼裝困難,導(dǎo)致轉(zhuǎn)錄本的拼接組裝不完整,而三代牛津納米孔技術(shù)(Oxford Nanopore Technology, ONT)憑借其超長(zhǎng)讀長(zhǎng)的優(yōu)勢(shì)可以彌補(bǔ)二代測(cè)序技術(shù)的不足,在轉(zhuǎn)錄本等信息的識(shí)別上更全面?;贠NT全長(zhǎng)轉(zhuǎn)錄組測(cè)序可以從理論水平上更全面地挖掘與茶葉品質(zhì)、獨(dú)特芳香以及產(chǎn)量相關(guān)的代謝通路和生物過(guò)程?!厩叭搜芯窟M(jìn)展】目前,單分子ONT技術(shù)已經(jīng)在動(dòng)物、植物、微生物等領(lǐng)域得到應(yīng)用。Jansen等[11]利用ONT技術(shù)對(duì)歐洲鰻鱺的基因組進(jìn)行了測(cè)序,與之前的草圖相比準(zhǔn)確性大大增加。Fellers等[12]通過(guò)ONT技術(shù)對(duì)感染小麥組織進(jìn)行測(cè)序,證實(shí)了小麥條紋花葉病毒的存在,該結(jié)果表明ONT技術(shù)可以更準(zhǔn)確地識(shí)別病原體。Giordano等[13]證明通過(guò)單分子ONT平臺(tái)測(cè)序的數(shù)據(jù)足以完整地組裝釀酒酵母S288C菌株。同時(shí),一些茶樹(shù)的基因組相繼被測(cè)序,如云抗10號(hào)[14]、舒茶早[15-16]、小葉茶碧云[17]、古茶樹(shù)[18]等,為改良茶葉品質(zhì)、提高茶葉產(chǎn)量提供大量數(shù)據(jù)支持。RNA-Seq分析是解鎖生命密碼非常重要的工具,但由于第二代高通量測(cè)序平臺(tái)[19]的轉(zhuǎn)錄組技術(shù)測(cè)得數(shù)據(jù)的拼接準(zhǔn)確性不高,使得深入理解細(xì)胞生命活動(dòng)困難重重。與二代技術(shù)相比,第三代測(cè)序技術(shù)具有通量高、讀長(zhǎng)長(zhǎng)、成本低等優(yōu)點(diǎn),讀長(zhǎng)可達(dá)10 kb[20-21]。基于ONT[22]的全長(zhǎng)轉(zhuǎn)錄組測(cè)序技術(shù)是一種單分子實(shí)時(shí)測(cè)序技術(shù),并且在測(cè)序時(shí)無(wú)須打斷RNA片段,所測(cè)即所得[23],大大縮減生物基因組重構(gòu)和組裝的時(shí)間和成本,為轉(zhuǎn)錄組學(xué)的研究減少阻礙。第三代測(cè)序技術(shù)的錯(cuò)誤率雖然比二代高,大約為15%[24],但是利用更正軟件加大測(cè)序深度可以大大降低錯(cuò)誤率,可使準(zhǔn)確率達(dá)到99.9%[25]。此外,龐丹丹等[26]利用PacBio三代測(cè)序技術(shù)對(duì)苦茶全長(zhǎng)轉(zhuǎn)錄組進(jìn)行分析,研究結(jié)果為探索苦茶特異性狀相關(guān)基因標(biāo)記的開(kāi)發(fā)奠定基礎(chǔ)。夏麗飛等[1]通過(guò)PacBio平臺(tái)對(duì)紫娟茶樹(shù)全長(zhǎng)轉(zhuǎn)錄組進(jìn)行分析,為開(kāi)展紫娟茶樹(shù)葉片呈色機(jī)理提供數(shù)據(jù)支持。【本研究切入點(diǎn)】目前,利用三代納米孔測(cè)序技術(shù)研究茶葉的品質(zhì)和滋味鮮有報(bào)道?!緮M解決的關(guān)鍵問(wèn)題】本研究利用三代測(cè)序平臺(tái)ONT技術(shù)對(duì)都勻福鼎大白茶葉、根和莖進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序比較分析,旨在探究與茶葉品質(zhì)相關(guān)的差異基因和代謝通路,為后續(xù)分子生物學(xué)研究提供數(shù)據(jù)參考。
采摘貴州省都勻市黔南民族師范學(xué)院試驗(yàn)基地長(zhǎng)勢(shì)一致的福鼎大白茶扦插苗9株,分為3組,每組3盆,采摘嫩葉、嫩根和嫩莖分別作為葉、根和莖處理,每個(gè)組織3個(gè)生物學(xué)重復(fù),共9個(gè)樣本,包括葉片L1、L2、L3,根R1、R2、R3,莖S1、S2、S3,放入液氮中進(jìn)行固樣。將采集的樣本放入干冰中送往北京百邁客生物科技有限公司進(jìn)行全長(zhǎng)轉(zhuǎn)錄組測(cè)序分析。
利用北京天根生物技術(shù)有限公司的RNAprep Pure多糖多酚植物總RNA提取試劑盒(DP441)對(duì)都勻福鼎大白茶葉、根和莖的RNA進(jìn)行提取。采用Nanodrop、Agilent2100及Agilent RNA 6000 Nano Kit對(duì)RNA的濃度和完整性進(jìn)行檢測(cè),檢測(cè)合格的RNA樣品,使用oligod(T)磁珠從TotalRNA中純化出poly(A)+RNA。其次利用Superscript Ⅳ reverse transcriptase反轉(zhuǎn)錄合成cDNA第一鏈,再使用帶barcode的引物及LongAmpTaq2*Master Mix進(jìn)行PCR擴(kuò)增。然后使用NEBNext End repair/dA-tailing Module進(jìn)行末端修復(fù)及加A。再次使用ONT SQKLSK109試劑盒及NEBNext Quick Ligationg Module進(jìn)行測(cè)序接頭的連接。最后使用PromethION測(cè)序儀及PromethION Flow Cells 9.4進(jìn)行測(cè)序,并將三代轉(zhuǎn)錄組測(cè)序數(shù)據(jù)提交至NCBI-SRA數(shù)據(jù)庫(kù),BioProject的編號(hào)為PRJNA562747。
全長(zhǎng)轉(zhuǎn)錄組測(cè)序平臺(tái)使用Oxford Nanopore Technologies的PromethION,將原始下機(jī)序列中長(zhǎng)度小于500 bp、Qscore小于7的低質(zhì)量序列和核糖體RNA序列過(guò)濾掉,根據(jù)兩端是否存在引物得到全長(zhǎng)序列,對(duì)全長(zhǎng)序列進(jìn)行polish獲得一致性序列,然后與安徽農(nóng)業(yè)大學(xué)第一版的中國(guó)種茶樹(shù)[27]基因組或構(gòu)建的contig進(jìn)行比對(duì),將identity和coverage的值分別設(shè)置為0.9和0.85,去除冗余,得到轉(zhuǎn)錄本序列,再利用gffcompare v0.9.8將全長(zhǎng)轉(zhuǎn)錄本與基因組已知的轉(zhuǎn)錄本進(jìn)行比較,獲得新基因和新轉(zhuǎn)錄本。隨后進(jìn)行SSR分析、ORF預(yù)測(cè)、轉(zhuǎn)錄因子分析、lncRNA分析,并且將所有的轉(zhuǎn)錄本、新轉(zhuǎn)錄本、新基因、開(kāi)放閱讀框、轉(zhuǎn)錄因子和LncRNA都上傳到FigShare數(shù)據(jù)庫(kù),DOI號(hào)分別為:10.6084/m9.figshare.13671901;10.6084/m9.figshare.14370011。將Fold Change≥2且FDR<0.01作為篩選差異表達(dá)基因的標(biāo)準(zhǔn),預(yù)測(cè)出葉與根、葉與莖、莖與根的差異轉(zhuǎn)錄本。最后,應(yīng)用軟件Blast2GO v2.5對(duì)差異轉(zhuǎn)錄本進(jìn)行GO注釋,并通過(guò)將轉(zhuǎn)錄本的蛋白序列和KEGG數(shù)據(jù)庫(kù)中收錄的蛋白序列進(jìn)行BLAST比對(duì)得到KEGG功能注釋信息,繼而使用軟件blast v2.2.31將轉(zhuǎn)錄本與kog202101數(shù)據(jù)庫(kù)進(jìn)行比對(duì),得到轉(zhuǎn)錄本的KOG注釋信息。葉與根、葉與莖、莖與根的差異轉(zhuǎn)錄本的GO、KEGG和KOG注釋信息上傳至figshare數(shù)據(jù)庫(kù),DOI號(hào)為:10.6084/m9.figshare.13671901。
應(yīng)用CPM(Counts per million)[28]計(jì)算轉(zhuǎn)錄本表達(dá)量。
式中:R:比對(duì)到某一轉(zhuǎn)錄本上的reads數(shù);T:比對(duì)到參考轉(zhuǎn)錄組的片段總數(shù)。
為確保轉(zhuǎn)錄組數(shù)據(jù)質(zhì)量準(zhǔn)確性高,利用實(shí)時(shí)熒光定量PCR對(duì)隨機(jī)選擇的4個(gè)基因進(jìn)行驗(yàn)證。試驗(yàn)材料和取樣方法同1.1。利用Aidlab公司反轉(zhuǎn)錄試劑盒(TUREscript 1st Stand cDNA SYNTHESIS Kit)進(jìn)行cDNA的合成。使用Primer5.0軟件設(shè)計(jì)實(shí)時(shí)定量PCR引物(表1)。以茶樹(shù)的GAPDH(GE651107.1 EST1434)基因?yàn)閮?nèi)參基因,利用2-△△Ct計(jì)算基因相對(duì)表達(dá)量,試驗(yàn)設(shè)置3個(gè)生物學(xué)重復(fù)。實(shí)時(shí)熒光定量PCR反應(yīng)體系及程序按照Fermentas公司SYBR GREEN I說(shuō)明書(shū)進(jìn)行。
表1 qRT-PCR引物Table 1 qRT-PCR primer
通過(guò)Nanopore三代全長(zhǎng)轉(zhuǎn)錄組測(cè)序?qū)F州省都勻市種植的福鼎大白茶葉、根和莖進(jìn)行測(cè)序分析。每個(gè)樣品測(cè)序產(chǎn)出clean data均達(dá)到7.93 GB,并且所有樣本的平均質(zhì)量值都達(dá)到Q9,9個(gè)樣品得到的全長(zhǎng)序列個(gè)數(shù)介于3768495~5078770(表2),利用經(jīng)過(guò)polish處理的全長(zhǎng)序列與第一個(gè)版本的中國(guó)種茶樹(shù)進(jìn)行minimap2.1.1[29]比對(duì)(表2),提取出69379個(gè)轉(zhuǎn)錄本。然后進(jìn)行融合轉(zhuǎn)錄本的預(yù)測(cè),9個(gè)樣品的融合轉(zhuǎn)錄本個(gè)數(shù)為188~248。最后,預(yù)測(cè)出93102個(gè)SSR,獲得7556個(gè)新基因位點(diǎn),65795個(gè)新轉(zhuǎn)錄本,45852個(gè)ORF,6335個(gè)轉(zhuǎn)錄因子和2229個(gè)lncRNA,并完成了58398個(gè)新轉(zhuǎn)錄本的功能注釋。
表2 Clean data數(shù)據(jù)Table 2 Clean data
2.1.1 SSR分析 利用MISA1.0軟件[30]對(duì)福鼎大白茶葉、根和莖的全長(zhǎng)轉(zhuǎn)錄組做SSR檢測(cè),將轉(zhuǎn)錄本的序列長(zhǎng)度≥500 bp作為篩選標(biāo)準(zhǔn),共檢測(cè)到50013條序列具有SSR位點(diǎn),包含7種類型的SSR,共78931個(gè)。其中完美單堿基重復(fù)SSR個(gè)數(shù)為53433,數(shù)量最多,其次是完美雙堿基重復(fù),為27961個(gè),然后依次是完美三、四、五、六堿基重復(fù),數(shù)量分別為10316、586、254、552個(gè)。以搜索標(biāo)準(zhǔn)為1~6個(gè)堿基基序重復(fù)次數(shù)分別≥10、6、5、5、5、5在SSR位點(diǎn)中檢測(cè),單堿基重復(fù)出現(xiàn)頻率最高是T/A(38139)。雙堿基重復(fù)出現(xiàn)最多的是TC/GA(7356),其次是CT/AG(7226)。三堿基重復(fù)最多的是GAA/TTC(598)和CCA/TGG(581)。四堿基重復(fù)以TTTA/TAAA(70)和TTAT/ATAA(31)占優(yōu)勢(shì)。五堿基和六堿基重復(fù)頻率最高的分別是TGTTA/TAACA(13)和GGTGCT/AGCACC(15)。以上研究結(jié)果與紫娟茶樹(shù)[31]和藤茶[32]的結(jié)果基本一致,為未來(lái)開(kāi)展茶樹(shù)遺傳圖譜構(gòu)建、SSR分子標(biāo)記開(kāi)發(fā)及培育良種提供理論基礎(chǔ)。
2.1.2 新基因編碼區(qū)序列預(yù)測(cè) 利用TransDecoder5.0.0(https://TransDecoder.sourceforge.net)預(yù)測(cè)出開(kāi)放閱讀框58355個(gè),其中完整開(kāi)放閱讀框45852條。預(yù)測(cè)的完整開(kāi)放閱讀框編碼蛋白序列長(zhǎng)度范圍主要在0~800氨基酸,0~100氨基酸有30455個(gè),占52.19%,100~200個(gè)氨基酸的有22949個(gè),占39.33%,200~300氨基酸有3936個(gè),占6.74%(圖1A),與云南金花茶[33]通過(guò)ESTScan預(yù)測(cè)的CDS長(zhǎng)度大體趨勢(shì)相似,以上結(jié)果表明轉(zhuǎn)錄組的序列質(zhì)量較高。
2.1.3 轉(zhuǎn)錄因子預(yù)測(cè) 使用iTAK1.6軟件[34]預(yù)測(cè)都勻福鼎大白茶轉(zhuǎn)錄因子,共預(yù)測(cè)到轉(zhuǎn)錄因子6335個(gè),主要分為20類,其中GRAS家族轉(zhuǎn)錄因子數(shù)量最多,其次是MYB-related、RLK-Pelle_DLSV、WRKY和C3H(圖1B),這些轉(zhuǎn)錄因子家族成員的獲得為后續(xù)分子生物學(xué)的研究提理論參考。
2.1.4 LncRNA預(yù) 測(cè) 分 別 應(yīng) 用Cpc[35]、Cnci[36]、Cpat1.2.2[37]、Pfam1.6[38]預(yù)測(cè)lncRNA,4種方法取交集共2229個(gè)(圖1C)。lncRNA主要分為基因間lncRNA(LincRNA)(1878/84.3%)、反 義lncRNA(Antisense-lncRNA)(110/4.9%)、內(nèi) 含 子lncRNA(Intronic lncRNA)(34/1.5%)、正義lncRNA(SenselncRNA)(207/9.3%),其中LincRNA最多,以上數(shù)據(jù)為將來(lái)研究lncRNA在茶中的調(diào)控機(jī)制提供重要參考。
為了獲得轉(zhuǎn)錄本的注釋信息(表3),將得到的新轉(zhuǎn)錄本進(jìn)行eggNOG、COG、NR、Pfam、Swissprot、KEGG、GO和KOG注釋。
表3 新轉(zhuǎn)錄本注釋Table 3 New isoform annotation
2.2.1 轉(zhuǎn)錄本表達(dá)量分析 根據(jù)CPM計(jì)算出轉(zhuǎn)錄本的表達(dá)量。采用CPM箱線圖從整體上對(duì)9個(gè)樣品的表達(dá)量進(jìn)行比較,發(fā)現(xiàn)他們的表達(dá)水平基本上一致(圖1D)。
圖1 開(kāi)放閱讀框、轉(zhuǎn)錄因子、長(zhǎng)鏈非編碼RNA和轉(zhuǎn)錄本表達(dá)量分析Fig. 1 Analyses on ORF, transcription factor, lncRNA, and transcript expression
2.2.2 差異表達(dá)轉(zhuǎn)錄本 利用DESeq1.18.0[39]進(jìn)行葉、根和莖轉(zhuǎn)錄本的差異表達(dá)分析,篩選條件為Fold Chang≥2且FDR<0.01,葉和根的差異表達(dá)轉(zhuǎn)錄本最多,莖和根的差異表達(dá)轉(zhuǎn)錄本最少(表4)。對(duì)差異表達(dá)轉(zhuǎn)錄本進(jìn)行數(shù)據(jù)庫(kù)的功能注釋,共注釋了14306個(gè)差異表達(dá)轉(zhuǎn)錄本,分別有9649、2825和7349個(gè)轉(zhuǎn)錄本注釋到GO、KEGG和KOG數(shù)據(jù)庫(kù)中。
表4 差異表達(dá)轉(zhuǎn)錄本注釋Table 4 Annotation of DETs
2.2.3 差異表達(dá)轉(zhuǎn)錄本GO注釋 對(duì)差異轉(zhuǎn)錄本進(jìn)行GO注釋,一級(jí)分類主要包含3個(gè)類型,分別為生物過(guò)程、細(xì)胞組分和分子功能;二級(jí)分類主要分為52個(gè)類別。在葉與根的差異轉(zhuǎn)錄本中生物學(xué)過(guò)程涉及21個(gè)類別,以代謝過(guò)程(總轉(zhuǎn)錄本/差異轉(zhuǎn)錄本,29572/5019)、細(xì)胞過(guò)程(26938/4021)、單生物過(guò)程(19040/3581)最多。細(xì)胞組分包括16個(gè)功能組,其中細(xì)胞(27641/4454)、細(xì)胞部分(27478/4411)、膜(20620/3584)最多。分子功能分為15個(gè)功能類別,催化活性(30151/5408)、結(jié)合(24530/3744)、轉(zhuǎn)運(yùn)活性(3340/651)最多(圖2)。葉與莖、莖與根的差異轉(zhuǎn)錄本的GO、KEGG和KOG注釋信息上傳至figshare數(shù)據(jù)庫(kù),DOI號(hào)為:10.6084/m9.figshare.13671901。研究結(jié)果豐富了都勻福鼎大白茶的分子生物學(xué)信息,可為進(jìn)一步研究茶葉的品質(zhì)提供理論參考。
2.2.4 差異表達(dá)轉(zhuǎn)錄本KEGG注釋 KEGG數(shù)據(jù)庫(kù)共注釋到2825個(gè)葉與根的差異轉(zhuǎn)錄本,其中參與碳代謝(270、9.56%)、氨基酸生物合成(192、6.8%)、苯丙素生物合成(182、6.44%)、淀粉和蔗糖代謝(167、5.91%)、植物激素信號(hào)轉(zhuǎn)導(dǎo)(137、4.85%)的差異轉(zhuǎn)錄本最多(圖3)。參與茶葉品質(zhì)形成中涉及茶葉滋味相關(guān)代謝途徑的有氨基酸生物合成、各種氨基酸代謝、類黃酮生物合成和苯丙素生物合成。與香氣相關(guān)的代謝途徑有泛醌和其他萜烯醌生物合成和萜類骨架生物合成。研究結(jié)果為后期深入開(kāi)展提高茶葉品質(zhì)的研究提供理論基礎(chǔ)。
圖3 葉與根差異表達(dá)轉(zhuǎn)錄本KEGG功能分類Fig. 3 KEGG function annotation of DETs between leaf and root
2.2.5 差異轉(zhuǎn)錄本的KOG注釋 葉與根的差異轉(zhuǎn)錄本與KOG數(shù)據(jù)庫(kù)進(jìn)行比對(duì)并根據(jù)其功能進(jìn)行分類,有7349個(gè)轉(zhuǎn)錄本得到注釋。按照功能一共分為25類,注釋到一般功能預(yù)測(cè)(1531)中的差異轉(zhuǎn)錄本最多,其次是翻譯后修飾、蛋白質(zhì)轉(zhuǎn)換、伴侶蛋白(924),次級(jí)代謝生物合成運(yùn)輸和分解代謝(812)。注釋到KOG數(shù)據(jù)庫(kù)最少的葉與根差異轉(zhuǎn)錄本數(shù)是染色質(zhì)結(jié)構(gòu)和動(dòng)力學(xué)(30)、真核細(xì)胞的細(xì)胞外結(jié)構(gòu)(20)、核結(jié)構(gòu)(6)、細(xì)胞運(yùn)動(dòng)(0)(表5)。
表5 部分葉與根差異轉(zhuǎn)錄本的KOG分類Table 5 DETs KOG classification between leaf and root
以茶樹(shù)的GAPDH(GE651107.1 EST1434)基因?yàn)閮?nèi)參基因,隨機(jī)選取4個(gè)差異表達(dá)基因(ONT.4041、ONT.8670、TEA019914、TEA007016)進(jìn)行qRTPCR驗(yàn)證(圖4),結(jié)果表明其表達(dá)量與轉(zhuǎn)錄組測(cè)序結(jié)果相一致,進(jìn)一步說(shuō)明轉(zhuǎn)錄組測(cè)序質(zhì)量較高。
圖4 轉(zhuǎn)錄組測(cè)序結(jié)果與qRT-PCR表達(dá)量比對(duì)Fig. 4 Comparison between RNA-seq and qRT-PCR
ONT第三代測(cè)序技術(shù)是近年來(lái)新興的單分子測(cè)序技術(shù)[40],DNA/RNA鏈以一定的速率通過(guò)納米孔通道蛋白時(shí),單個(gè)堿基會(huì)引起不同電學(xué)信號(hào)的變化,根據(jù)電流信號(hào)對(duì)序列進(jìn)行實(shí)時(shí)測(cè)定[41-42]。本文利用ONT全長(zhǎng)轉(zhuǎn)錄組測(cè)序技術(shù)及生物信息學(xué)分析獲得了福鼎大白茶葉、根和莖9個(gè)樣品的全長(zhǎng)轉(zhuǎn)錄組。通過(guò)CPM分析葉、根和莖9個(gè)樣品的轉(zhuǎn)錄本表達(dá)量,發(fā)現(xiàn)它們的整體表達(dá)水平基本上一致。另外,我們共得到93102個(gè)SSR,其中完美單堿基重復(fù)和完美雙堿基重復(fù)最多。單堿基、雙堿基、三堿基和四堿基重復(fù)出現(xiàn)頻率最高,分別是T/A、CT/AG、GAA/TTC、TTTA/TAAA,與朱興正等[43]和鞠燁等[44]的研究結(jié)果基本一致,為未來(lái)開(kāi)展茶樹(shù)遺傳圖譜構(gòu)建、SSR分子標(biāo)記開(kāi)發(fā)及培育良種提供理論基礎(chǔ)。預(yù)測(cè)的45852個(gè)完整ORF序列,蛋白序列長(zhǎng)度范圍主要在0~800氨基酸,0~300個(gè)氨基酸最多,與夏麗飛等[1]和潘敏等[45]的研究結(jié)果大體相似,表明轉(zhuǎn)錄組的序列質(zhì)量較高。我們還對(duì)轉(zhuǎn)錄因子、LncRNA進(jìn)行了分析,研究結(jié)果為將來(lái)研究LncRNA在茶中的調(diào)控機(jī)制提供重要參考,為后續(xù)分子生物學(xué)的研究提供理論參考。
根據(jù)GO功能顯著性富集分析,上調(diào)基因和下調(diào)基因在生物過(guò)程中,代謝過(guò)程(2162/2857),即葉與根中有2162差異轉(zhuǎn)錄本在生物過(guò)程中上調(diào),2857個(gè)轉(zhuǎn)錄本在此過(guò)程中下調(diào)。單生物過(guò)程(1688/1893),細(xì)胞過(guò)程(1673/2348)、生物調(diào)節(jié)(1673/633)等顯著富集。在細(xì)胞組分中,細(xì)胞(1623/2831)、細(xì)胞部分(1608/2803)、膜(1597/1987)、膜部分(978/1201)等顯著富集。在分子功能中,催化活性(2496/2912)、結(jié)合性(1771/1973)、轉(zhuǎn)運(yùn)活性(331/320)等顯著富集。以上結(jié)果是葉與根差異轉(zhuǎn)錄本數(shù)最多的生物過(guò)程,朱興正[43]等采用PacBio平臺(tái)分析了保護(hù)品種云茶1號(hào)的全長(zhǎng)轉(zhuǎn)錄組,Unigene的GO功能注釋與本研究結(jié)果相一致。同時(shí),以上結(jié)果顯示在這些生物過(guò)程中大部分下調(diào)轉(zhuǎn)錄本數(shù)都比上調(diào)轉(zhuǎn)錄本多,即在都勻福鼎大白茶樹(shù)生長(zhǎng)發(fā)育過(guò)程中,參與葉生物過(guò)程的轉(zhuǎn)錄本比根多。
在KEGG中,葉與根的差異轉(zhuǎn)錄本中有182個(gè)差異基因參與苯丙素的生物合成,KEGG直系同源基因ID號(hào)為ko00940。對(duì)該通路的苯丙氨酸、絡(luò)氨酸、色氨酸的生物合成到木質(zhì)素的通路進(jìn)行深入分析,涉及6個(gè)節(jié)點(diǎn),其中4個(gè)節(jié)點(diǎn)中的基因全部上調(diào),2個(gè)節(jié)點(diǎn)既有上調(diào)又有下調(diào)基因。將涉及的所有基因根據(jù)基因表達(dá)量進(jìn)行聚類分析,TEA019411、TEA017242、TEA028682、 TEA029025、TEA006839、TEA017067、ONT.2421、TEA008747、TEA031671、TEA005749等基因在葉中高表達(dá),都屬于K00430,并且親緣關(guān)系較近,與過(guò)氧化物酶有關(guān),參與氧化應(yīng)激反應(yīng)。過(guò)氧化物酶與光合作用、呼吸作用有關(guān),并能使組織中所含的某些碳水化合物轉(zhuǎn)化成木質(zhì)素,增加木質(zhì)化的程度,是組織老化的一種標(biāo)志。在氨基酸生物合成中,有192個(gè)差異基因參與,其中涉及谷氨酸合成酶的基因有ONT.24127.2和TEA003892.1等,并且這兩個(gè)差異基因在根中表達(dá)上調(diào)。茶氨酸是在茶樹(shù)根部由乙胺和谷氨酸在酶的催化下合成的,然后運(yùn)輸?shù)饺~部,參與代謝過(guò)程。而茶氨酸的降解與陽(yáng)光有關(guān),影響茶氨酸向兒茶素轉(zhuǎn)化,因此,茶氨酸的合成與降解與茶葉品質(zhì)密切相關(guān)。以上結(jié)果表明,茶樹(shù)葉片通過(guò)光合作用等一系列反應(yīng)形成與茶葉品質(zhì)相關(guān)的化合物。
葉與根上調(diào)和下調(diào)差異轉(zhuǎn)錄本KOG分類中,一般功能預(yù)測(cè)(611/920),上調(diào)轉(zhuǎn)錄本611,下調(diào)轉(zhuǎn)錄本920。翻譯后修飾、蛋白質(zhì)轉(zhuǎn)換、伴侶蛋白(349/575),碳水化合物的運(yùn)輸和代謝(339/405)的分類中,大部分下調(diào)轉(zhuǎn)錄本比上調(diào)轉(zhuǎn)錄本多,再一次說(shuō)明茶樹(shù)生長(zhǎng)過(guò)程中葉的重要性。本研究的全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)和各項(xiàng)結(jié)果豐富了茶樹(shù)的分子生物學(xué)信息,可為進(jìn)一步研究茶葉的品質(zhì)和獨(dú)特的芳香及與之相關(guān)的基因提供理論基礎(chǔ)。為保障茶葉產(chǎn)量和品質(zhì)打下良好基礎(chǔ),為后續(xù)良種選育及分子生物學(xué)研究提供重要的數(shù)據(jù)支持。