江香梅,伍艷芳,肖復明,熊振宇,徐海寧
江西省林業(yè)科學院,國家林業(yè)局樟樹工程技術(shù)研究中心,南昌 330032
樟樹(Cinnamomum camphora(L.) Presl)是我國特有國家Ⅱ級保護樹種,是集材用、藥用、香料、油用、化工、觀賞、生態(tài)環(huán)境和生態(tài)文化建設(shè)等于一體的多用途樹種,可作為樟科的代表種,具有極重要的開發(fā)利用價值[1]。樟樹的化學成分復雜多樣,其根、莖、葉、花、果中均富含精油,從其精油中已鑒定出 150余種化合物,且新化合物還在不斷被鑒定出來。我國是世界上生產(chǎn)樟油最多的國家,其產(chǎn)量占世界的 80%,產(chǎn)品質(zhì)量享譽全球。樟樹按葉精油主要化學成分種類及含量的不同,可分為芳樟(精油中主成分為芳樟醇,下同)、腦樟(樟腦)、油樟(1,8-桉葉油素)、異樟(異-橙花叔醇)和龍腦樟(右旋龍腦)5種主要化學類型[2]。迄今為止,對樟樹精油化學成分分析與利用的研究較多[3~5],而對化學成分代謝途徑的研究則較少[6,7]。目前,以樟樹為代表的樟科植物尚未完成全基因組測序,EST文庫尚未建立,GenBank上樟樹EST序列也較少,相關(guān)基因的功能注釋亦不完善,給樟樹萜類化合物次生代謝途徑的研究帶來極大困難,亟需更多的基因組或轉(zhuǎn)錄組信息來解決這一問題。
新一代測序技術(shù)(Next-generation sequencing technologies,NGSTs)對分子生物學的發(fā)展起到了巨大的推動作用。其中用于轉(zhuǎn)錄組測序和數(shù)字基因表達譜(Digital gene expression profiling,DGE)研究的RNA-seq技術(shù)不僅能夠廣泛應(yīng)用于有參考基因組序列的物種研究,如水稻(Oryza sativa)[8]、葡萄(Vitis vinifera)[9]、黃瓜(Cucumis sativus)[10]等,也能應(yīng)用于無參考基因組序列的物種,如青蒿(Artemisia annua)[11]、人參(Panax ginseng)[12]、紅豆杉(Taxus mairei)[13]、羅漢果(Siraitia grosvenorii)[14]等,應(yīng)用較為廣泛[15]?;谵D(zhuǎn)錄組測序得到的基因功能注釋、蛋白編碼區(qū)注釋等大量的信息,可以從基因的表達水平[9,13]、SNP鑒定[11,16]、SSR分子標記篩選[17,18]、候選基因的挖掘[19,20]、融合轉(zhuǎn)錄本的表達[8,21]、可變剪接[8,22]等方面展開相關(guān)研究,并建立相關(guān)轉(zhuǎn)錄組數(shù)據(jù)庫[17],為進一步研究提供重要基礎(chǔ)。本研究采用 Illumina HiSeq? 2000新一代高通量測序技術(shù)對樟樹5種化學類型葉片轉(zhuǎn)錄組進行測序,對測序得到的大量Unigene進行GO、COG和KEGG分類統(tǒng)計,給出功能注釋和Pathway注釋,并預測Unigene蛋白CDS。這些注釋信息的完成將為樟樹精油主要成分合成、功能基因及相關(guān)候選基因的發(fā)掘提供基礎(chǔ)數(shù)據(jù),同時也為進一步克隆功能基因全長、研究基因功能奠定了基礎(chǔ),對推動我國樟科植物分子生物學研究將起到極大促進作用。
試驗材料采自江西省林業(yè)科學院內(nèi)年齡約 30年的樟樹成年植株。于4月底統(tǒng)一采集腦樟、芳樟、油樟、異樟、龍腦樟 5種化學類型幼嫩葉片,液氮速凍后-70℃低溫保存,用于提取RNA,測序。
1.2.1 RNA提取、純化和文庫構(gòu)建
采用通用植物總RNA提取試劑盒RNeasy Plant Mini Kit提取樟樹5種化學類型葉片總RNA,瓊脂糖凝膠電泳檢測RNA完整性,Agilent 2100 Bioanalyzer檢測總 RNA 濃度。用 Oligotex? mRNA kit(TaKaRa)分離純化 mRNA。得到的 mRNA采用fragmentation buffer打斷成小片段,經(jīng)過PCR擴增,建立小片段測序文庫。文庫測序采用 Illumina Hi-Seq? 2000完成。
1.2.2 序列拼接
測序后得到的Raw reads,去除含有帶接頭的、重復的(N>5%)、測序質(zhì)量很低的reads(質(zhì)量值Q≤10的堿基數(shù)占整個 reads的 20%以上),獲得 Clean reads。采用短 reads組裝軟件 Trinity[23]做轉(zhuǎn)錄組從頭組裝。先將具有一定長度overlap的reads連成更長的片段,得到Contig組裝片段,再將reads比對回Contig,通過 paired-end reads來確定來自同一轉(zhuǎn)錄本的不同Contig以及這些Contig之間的距離,將這些 Contig連在一起,得到兩端不能再延長的序列,即為Unigene。
1.2.3 功能注釋和CDS預測
功能注釋信息給出Unigene的蛋白功能注釋、COG功能注釋。先通過BlastX將Unigene序列比對到蛋白數(shù)據(jù)庫 Nr(NCBI非冗余蛋白庫)、SwissProt(去冗余的蛋白數(shù)據(jù)庫)、KEGG(系統(tǒng)分析基因產(chǎn)物在細胞中的代謝途徑以及這些基因產(chǎn)物功能的數(shù)據(jù)庫)和 COG(對基因產(chǎn)物進行直系同源分類的數(shù)據(jù)庫)(E值<1e-5),再通過 BlastN將Unigene比對到核酸數(shù)據(jù)庫 Nt(NCBI非冗余核酸數(shù)據(jù)庫)(E值<1e-5),得到跟給定 Unigene具有最高序列相似性的蛋白,從而得到該 Unigene的蛋白功能注釋信息。采用 Blast2GO軟件[24],根據(jù)Nr注釋信息得到 GO注釋信息; 采用 WEGO軟件[25]對 All-Unigene(按分子功能、細胞組分、生物學過程)進行GO功能分類統(tǒng)計,從宏觀上認識樟樹的基因功能分布特征。具體測序數(shù)據(jù)分析參照林萍等[26]的轉(zhuǎn)錄組注釋分類方法。將 Unigene序列按 Nr、SwissProt、KEGG和 COG的優(yōu)先級順序做BlastX比對(E值<1e-5)。取比對結(jié)果中rank最高的蛋白確定該 Unigene的編碼區(qū)序列,根據(jù)標準密碼子表將編碼區(qū)序列翻譯成氨基酸序列,從而得到該Unigene編碼區(qū)的核酸序列(序列方向5′→3′)和氨基酸序列。與 4個數(shù)據(jù)庫皆比對不上的Unigene用ESTscan[27]軟件預測其編碼區(qū),得到其編碼區(qū)的核酸序列(序列方向5'→3')和氨基酸序列。
樟樹 5種化學類型葉片轉(zhuǎn)錄組測序后得到的Raw reads及去除雜質(zhì)之后的Clean reads結(jié)果列于表1。由表1可以看出,質(zhì)量參數(shù)Q20最低為95.08%(異樟),最高達到 98.51%(腦樟); 過濾后不確定的堿基比例N值≤0.01%; 5種化學類型的GC含量在46.55%~49.29%之間。
2.2.1 數(shù)據(jù)統(tǒng)計
采用短reads組裝軟件Trinity從頭組裝的樟樹5種化學類型序列重疊群Contig和Unigene數(shù)目列于表 2。由表 2可知,經(jīng)過拼接最終獲得長度在 100~2 000 bp之間的Unigene 156 278個,總長87.09 Mb,序列平均長度584 bp,N50為1 023 bp。
表1 測序產(chǎn)量統(tǒng)計表
表2 組裝質(zhì)量統(tǒng)計表
2.2.2 Contig和Unigene的長度分布
Contig和Unigene的長度分布分別見圖1和圖2。樟樹All-Unigene長度在100~500 bp的有114 115個,占73.02%; 500~1 000的有18 316個,占11.72%;1 000~1 500的有9 144個,占5.85%; 1 500~2 000的有6 365個,占4.07%; ≥2 000的有8 338個,占5.34%。
2.3.1 注釋結(jié)果統(tǒng)計
分別將 Unigene注釋到 Nr、Nt、SwissProt、KEGG、COG、GO庫,并分別對注釋到每個庫以及所有注釋上的Unigene數(shù)目進行統(tǒng)計,結(jié)果見表3。通過Blast搜索比對,共有55 955條Unigene獲得了基因注釋,占All-Unigene的35.80%; 有100 323條Unigene(64.20%)未被注釋。Nr數(shù)據(jù)庫比對注釋的信息最多,注釋了55 257條Unigene,COG注釋的信息最少,僅21 806條Unigene得到了注釋。
2.3.2 Unigene的COG分類
為了進一步評價轉(zhuǎn)錄組文庫的完整性和注釋的有效性,對Unigene進行了COG分類(圖3)。在COG 25個類別中,“一般功能基因”為最大 5的組(7 466,34.24%),其次是“轉(zhuǎn)錄”(4 955,22.72%)和“復制、重組和修復”(3 803,17.44%)。3個最小的組別分別為“核苷酸結(jié)構(gòu)”(2,0.01%)、“細胞外結(jié)構(gòu)”(11,0.05%)和“RNA 加工與修飾”(358,1.64%)。此外,參與次生代謝生物合成、運輸和分解的有 1 296個Unigene,占5.94%。
在已經(jīng)得到的 Nr注釋信息基礎(chǔ)上,采用Blast2GO獲得樟樹Unigene的GO分類信息,共有24 717條Unigene得到GO注釋。在GO分類體系中,生物學過程、細胞組分和分子功能 3個大的類別被劃分為詳細的 44個小的類別,其中“細胞”(16 006,14.52%)、“細胞要素”(14 515,13.17%)和“細胞器”(11 547,10.48%)3個類群占了主要部分,隨后是“催化活性”(11 074,10.05%)、“結(jié)合活性”(10 642,9.65%)和“代謝過程”(9 930,9.01%)3 個類群,而“細胞殺傷”(1,0.001%)、“律動過程”(2,0.002%)和“氮素利用”(3,0.003%)僅有非常少的基因歸入,這一分類結(jié)果顯示了樟樹葉基因表達譜的總體情況(圖4)。
圖1 Contig的長度分布統(tǒng)計圖
利用KEGG數(shù)據(jù)庫進行了功能分類和Pathway注釋[28]。首先,將156 278條All-Unigene采用BlastX比對到KEGG數(shù)據(jù)庫,結(jié)果有48 875條序列能夠比對上(E值<1e-5),共有32 885條Unigene能夠注釋到217個KEGG標準Pathway,另外123 393條序列則沒有相應(yīng)的生物學 Pathway注釋(Condition:expect≤1e-5; rank≤5),選取注釋基因比例大于1%(占所有注釋基因)的Pathway列于表4。由表4可知,注釋到“代謝途徑”中的Unigene最多,有7 808條,占23.74%; 有3 350條基因(10.19%)注釋到次生代謝生物合成途徑,其中,參與單萜[PATH:ko00902](66,0.2%)、二萜[PATH:ko00904](113,0.34%)、倍半萜[PATH:ko00909](34,0.1%)和萜類骨架合成[PATH:ko00900](211,0.24%)的Unigene共424個。參與不飽和脂肪酸生物合成的 Unigene有 191條,占0.58%。這些有代表性的注釋為研究樟樹特殊生物學進程、功能和代謝提供了重要依據(jù)。
圖2 Unigene的長度分布統(tǒng)計圖
將 Unigene序列按 Nr、SwissProt、KEGG和COG數(shù)據(jù)庫的優(yōu)先級順序分別做BlastX比對(E值<1e-5),確定該 Unigene的編碼區(qū)序列,然后根據(jù)標準密碼子表將編碼區(qū)序列翻譯成氨基酸序列,從而得到該Unigene編碼區(qū)的核酸序列(序列方向 5′→3′)和氨基酸序列。最后,跟以上 4個數(shù)據(jù)庫皆比對不上的Unigene用ESTscan軟件預測其編碼區(qū),得到其編碼區(qū)核酸序列(序列方向為 5′→3′)和氨基酸序列。圖 5分別顯示All-Unigene與數(shù)據(jù)庫Blast的CDS核酸和氨基酸序列分布,ESTscan預測編碼區(qū)的核酸和氨基酸序列的長度分布。
表3 Unigene注釋結(jié)果統(tǒng)計表
樟樹5種化學類型精油的主要成分為萜類物質(zhì),且多數(shù)為單萜和倍半萜類。在 Pathway單萜合成的代謝通路中,找到9條Unigene可能編碼樟樹芳樟醇合成途徑的關(guān)鍵酶芳樟醇合酶基因,它們在 5種化學類型中的表達水平(Reads Per kb per Million reads,RPKM值)見表5。表5顯示,芳樟醇合酶基因在芳樟中優(yōu)勢表達,而在油樟中表達水平較低。這些Unigene的注釋信息將為進一步克隆功能基因的全長、研究其功能提供基礎(chǔ)數(shù)據(jù),也為樟樹精油的代謝調(diào)控研究奠定了基礎(chǔ)。
圖3 Unigene的COG分類圖
圖4 Unigene的GO分類圖
表4 KEGG pathway注釋結(jié)果統(tǒng)計表
轉(zhuǎn)錄組是功能基因組研究的一個重要功能指標[29]。本研究首次采用 Illumina高通量測序技術(shù)對樟樹 5種化學類型葉片轉(zhuǎn)錄組進行測序,共拼接得到156 278條Unigene。其中,未獲得鑒定的新Unigene 100 323條,占總數(shù)的64.20%,為進一步挖掘并鑒定新的功能基因提供了豐富的數(shù)據(jù)信息。本研究測序所得到的Unigene序列平均長度584 bp,N50為1 023 bp,完全滿足轉(zhuǎn)錄組測序的要求。傳統(tǒng)的基因表達序列標簽(Expressed sequence tags,ESTs)技術(shù)被認為是一種研究轉(zhuǎn)錄組的有效方法,廣泛應(yīng)用于新基因發(fā)現(xiàn)、基因表達分析和蛋白質(zhì)組學?;蛐酒?Gene chip)技術(shù)也廣泛用于大量核酸分子的檢測分析,為研究不同層次多基因協(xié)同作用提供手段。與EST 技術(shù)及基因芯片技術(shù)相比,基于 Illumina HiSeqTM2000 高通量測序?qū)D(zhuǎn)錄組進行比較和分析,所需的RNA量較少,背景噪音比基因芯片低,繪制轉(zhuǎn)錄組遺傳圖譜所需的費用更低。該平臺可同時用于有(無)參考基因組的轉(zhuǎn)錄組測序,通過短序列組裝軟件Trinity獲得的信息量完全可滿足研究需求。
木本植物由于多數(shù)為異交物種,雜合性較強,基因組相對較大且較為復雜,從而導致遺傳背景研究相對滯后。而對于遺傳背景不清晰的木本植物,可先采用高通量測序技術(shù)進行轉(zhuǎn)錄組測序,以獲得的大量 Unigene信息構(gòu)建遺傳和物理圖譜,為待測序的物種提供遺傳背景信息[31]。林萍等[27]曾采用Illumina的Solexa技術(shù)對普通油茶種子4個發(fā)育時期的轉(zhuǎn)錄組進行測序,經(jīng)組裝分析獲得 80 310 條Unigene,其中確定編碼蛋白功能的有 21 789 條,占All-Unigene 的27.13%。本研究中,Unigene注釋結(jié)果顯示共有 55 955條 Unigene獲得了基因注釋,占 All-Unigene的 35.80%,略高于油茶轉(zhuǎn)錄組的注釋,但是相對于草本植物來說注釋結(jié)果偏低,表明現(xiàn)有數(shù)據(jù)庫中,樟科植物基因注釋信息量極為缺乏。樟樹作為樟科植物的代表樹種,其轉(zhuǎn)錄組測序及相關(guān)注釋具有極為重要的意義,將為樟科其他物種提供注釋信息參考。高通量測序技術(shù)可以大規(guī)模的對生物體組織樣本進行測序分析,有利于建立特定時空條件下的物質(zhì)代謝途徑[29]。Sun等[19]對西洋參(Panax quinquefoliusL.)轉(zhuǎn)錄組進行測序,KEGG分析確定有 4 097條序列被定位到特定的代謝途徑中,并且初步確定了從 acetyl CoA開始經(jīng)過類異戊二烯途徑的所有參與人參皂苷骨架合成的酶。此外,東北紅豆杉(Taxus cuspidataSieb.et Zucc.)中的紫杉醇[32]、蛇足石杉(Huperzia serrata(Thunb.ex Murray)Trev.)和龍骨馬尾杉(Phlegmariurus carinatus(Desv.ex Poir.) Ching.)中的石松生物堿[33]等物質(zhì)也通過高通量測序進一步確定其次生代謝途徑。樟樹Unigene的GO分類結(jié)果顯示了樟樹5種化學類型葉基因表達譜的總體情況,共有24 717條Unigene得到GO注釋,在 44個小類別中,歸入“細胞”和“細胞器”類別的分別為 16 006(14.52%)和 11 547(10.48%)條Unigene,說明有較多的基因與細胞和細胞器中的生物代謝相關(guān)。KEGG pathways分析結(jié)果表明,共有3 350(10.19%)條基因注釋到次生代謝生物合成途徑,其中,參與萜類代謝的Unigene共424條。在此基礎(chǔ)上進行芳樟醇合成途徑分析,結(jié)果顯示芳樟醇合酶基因在芳樟中優(yōu)勢表達,而在油樟中表達水平較低,這一結(jié)果與樟樹 5種化學型中芳樟醇的含量高低相一致[2]。這些有代表性的注釋為研究樟樹次生代謝過程、脂肪酸合成途徑及其他特殊生物學進程提供了重要依據(jù)。
圖5 CDS的長度分布統(tǒng)計圖
表5 編碼芳樟醇合酶的Unigene注釋結(jié)果統(tǒng)計表
[1]戴寶合.野生植物資源學.北京:農(nóng)業(yè)出版社,1993.
[2]石皖陽,何偉,文光裕,郭德選,龍光遠,劉銀茍.樟精油成分和類型劃分.植物學報,1989,31(3):209–214.
[3]彭東輝.樟樹優(yōu)良單株選擇與組培研究[學位論文].福建農(nóng)林大學,2004.
[4]Lee HJ,Hyuna EA,Yoon WJ,Kim BH,Rhee MH,Kang HK,Cho JY,Yoo ES.In vitroanti-inflammatory and anti-oxidative effects ofCinnamomum camphoraextracts.J Ethnopharmacol,2006,103(2):208–216.
[5]Liu CH,Mishra AK,Tan RX,Tang C,Yang H,Shen YF.Repellent and insecticidal activities of essential oils fromArtemisia princepsandCinnamomum camphoraand their effect on seed germination of wheat and broad bean.Bioresour Technol,2006,97(15):1969–1973.
[6]Yang T,Li J,Wang HX,Zeng Y.A geraniol-synthase gene fromCinnamomum tenuipilum.Phytochemistry,2005,66(3):285–293.
[7]陳美蘭.藥用植物樟化學型形成機理的基礎(chǔ)研究[學位論文].中國中醫(yī)科學院,2007.
[8]Zhang GJ,Guo GW,Hu XD,Zhang Y,Li QY,Li RQ,Zhang RH,Lu ZK,He ZQ,Fang XD,Chen L,Tian W,Tao Y,Kristiansen K,Zhang XQ,Li SG,Yang HM,Wang J.Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome.Genome Res,2010,20(5):646–654.
[9]Wu J,Zhang YL,Zhang HQ,Huang H,Folta KM,Lu J.Whole genome wide expression profiles ofVitis amurensisgrape responding to downy mildew by using Solexa sequencing technology.BMC Plant Biol,2010,10:234.
[10]Guo SG,Zheng Y,Joung JG,Liu SQ,Zhang ZH,Crasta OR,Sobral BW,Xu Y,Huang SW,Fei ZJ.Transcriptome sequencing and comparative analysis of cucumber flowers with different sex types.BMC Genomics,2010,11:384.
[11]Graham IA,Besser K,Blumer S,Branigan CA,Czechowski T,Elias L,Guterman I,Harvey D,Isaac PG,Khan AM,Larson TR,Li Y,Pawson T,Penfield T,Rae AM,Rathbone DA,Reid S,Ross J,Swallwood MF,Segura V,Townsend T,Vyas D,Winzer T,Bowles D.The genetic map ofArtemisia annuaL.identifies loci affecting yield of the antimalarial drug artemisinin.Science,2010,327(5963):328–331.
[12]Chen S,Luo H,Li Y,Sun Y,Wu Q,Niu Y,Song J,Lv A,Zhu Y,Sun C,Steinmetz A,Qian Z.454 EST analysis detects genes putatively involved in ginsenoside biosynthesis inPanax ginseng.Plant Cell Rep,2011,30(9):1593–1601.
[13]Hao DC,Ge GB,Xiao PG,Zhang YY,Yang L.The first insight into the tissue specificTaxustranscriptome via Illumina second generation sequencing.PLoS ONE,2011,6(6):e21220.
[14]Tang Q,Ma XJ,Mo CM,Wilson IW,Song C,Zhao H,Yang YF,Fu W,Qiu DY.An efficient approach to findingSiraitia grosvenoriitriterpene biosynthetic genes by RNA-seq and digital gene expression analysis.BMC Genomics,2011,12(1):343.
[15]Wilhelm BT,Landry JR.RNA-Seq quantitative measurement of expression through massively parallel RNA Sequencing.Methods,2009,48(3):249–257.
[16]Zenoni S,Ferrarini A,Giacomelli E,Xumerle L,Fasoli M,Malerba G,Bellin D,Pezzotti M,Delledonne M.Characterization of transcriptional complexity during berry development inVitis viniferausing RNA-Seq.Plant Physiol,2010,152(4):1787–1795.
[17]Wang ZY,Fang BP,Chen JY,Zhang XJ,Luo ZX,Huang LF,Chen XL,Li YJ.De novoassembly and characterization of root transcriptome using Illumina paired-end sequencing and development of cSSR markers in sweetpotato(Ipomoea batatas).BMC Genomics,2010,11(1):726.
[18]李瀅,孫超,羅紅梅,李西文,牛云云,陳士林.基于高通量測序454 GS FLX的丹參轉(zhuǎn)錄組學研究.藥學學報,2010,45(4):524–529.
[19]Sun C,Li Y,Wu Q,Luo HM,Sun YZ,Song JY,Lui E MK,Chen SL.De novosequencing and analysis of the American ginseng root transcriptome using a GS FLX Titanium platform to discover putative genes involved in ginsenoside biosynthesis.BMC Genomics,2010,11(1):262.
[20]Logacheva MD,Kasianov AS,Vinogradov DV,Samigullin TH,Gelfand MS,Makeev VJ,Penin AA.De novosequencing and characterization of floral transcriptome in two species of buckwheat(Fagopyrum).BMC Genomics,2011,12(1):30.
[21]Francis RW,Thompson-Wicking K,Carter KW,Anderson D,Kees UR,Beesley AH.FusionFinder:A software tool to identify expressed gene fusion candidates from RNA-Seq data.PLoS ONE,2012,7(6):e39987.
[22]Li PH,Ponnala L,Gandotra N,Wang L,Si YQ,Tausta SL,Kebrom TH,Provart N,Patel R,Myers CR,Reidel EJ,Turgeon R,Liu P,Sun Q,Nelson T,Brutnell TP.The developmental dynamics of the maize leaf transcriptome.Nat Genet,2010,42(12):1060–1067.
[23]Grabherr MG,Haas BJ,Yassour M,Levin JZ,Thompson DA,Amit I,Adiconis X,Fan L,Raychowdhury R,Zeng Q,Chen Z,Mauceli E,Hacohen N,Gnirke A,Rhind N,Palma F,Birren BW,Nusbaum C,Lindblad-Toh K,Friedma N,Regev A.Full-length transcriptome assembly from RNA-Seq data without a reference genome.Nat Biotechnol,2011,29(7):644–652.
[24]Conesa A,G?tz S,García-Gómez JM,Terol J,Talón M,Robles M.Blast2GO:a universal tool for annotation,visualization and analysis in functional genomics research.Bioinformatics,2005,21(18):3674–3676.
[25]Ye J,Fang L,Zheng HK,Zhang Y,Chen J,Zhang ZG,Wang J,Li ST,Li RQ,Bolund L,Wang J.WEGO:a web tool for plotting GO annotations.Nucleic Acids Res,2006,34(1):W293–297.
[26]林萍,曹永慶,姚小華,王開良,滕建華.普通油茶種子 4個發(fā)育時期的轉(zhuǎn)錄組分析.分子植物育種,2011,9(4):498–505.
[27]Iseli C,Jongeneel CV,Bucher P.ESTScan:a program for detecting,evaluating,and reconstructing potential coding regions in EST sequences.Proc Int Conf Intell Syst Mol Biol,1999,138–148.
[28]Kanehisa M,Goto S,Kawashima S,Okuno Y,Hattori M.The KEGG resource for deciphering the genome.Nucleic Acids Res,2004,32(1):D277–D280.
[29]梁燁,陳雙燕,劉公社.新一代測序技術(shù)在植物轉(zhuǎn)錄組研究中的應(yīng)用.遺傳,2011,33(12):1317–1326.
[30]施季森,王占軍,陳金慧.木本植物全基因組測序研究進展.遺傳,2012,34(2):145–156.
[31]Li X,Chen GH,Zhang WY,Zhang X.Genome-wide transcriptional analysis of maize endosperm in response to ae wx double mutations.J Genet Genomics,2010,37(11):749–762.
[32]Wu Q,Sun C,Luo H,Li Y,Niu Y,Sun Y,Lu A,Chen S.Transcriptome analysis ofTaxus cuspidataneedles based on 454 pyrosequencing.Planta Med,2010,77(4):394–400.
[33]Luo HM,Li Y,Sun C,Wu Q,Song JY,Sun YZ,Steinmetz A,Chen SL.Comparison of 454-ESTs fromHuperzia serrataandPhlegmariurus carinatusreveals putative genes involved in lycopodium alkaloid biosynthesis and developmental regulation.BMC Plant Biol,2010,10(1):209.