李鐵柱,杜紅巖 ,劉慧敏,烏云塔娜,王 淋,葉生晶
杜仲果實和葉片轉(zhuǎn)錄組數(shù)據(jù)組裝及基因功能注釋
李鐵柱1a,杜紅巖2,劉慧敏1b,1c,烏云塔娜1b,1c,王 淋1b,1c,葉生晶1b,1c
(1.中南林業(yè)科技大學(xué)a.生命科學(xué)與技術(shù)學(xué)院;b.經(jīng)濟林育種與栽培國家林業(yè)局重點實驗室;c.林學(xué)院,湖南長沙 410004;2中國林業(yè)科學(xué)研究院經(jīng)濟林研究開發(fā)中心, 河南 鄭州 450003)
所構(gòu)建的杜仲果實和葉片轉(zhuǎn)錄組數(shù)據(jù)庫獲得了54 471 338條reads數(shù)據(jù),包含4 902 420 420nt數(shù)據(jù)信息,對reads進行拼接,獲得了452 421條Contig,總長度為90 705 736 nt; 對contig進行拼接后,獲得了147 027條Scaffold,總長度為65 877 052 nt;同理,對Scaffold進一步拼接后,獲得了49 610條Unigene,總長度為37 616 729 nt; Unigene和COG數(shù)據(jù)庫進行比對表明,杜仲果實和葉片轉(zhuǎn)錄組中的Unigene根據(jù)功能大致可分為25類;杜仲果實和葉片轉(zhuǎn)錄組中的Unigene根據(jù)GO功能可分為生物過程、細(xì)胞組分和分子功能3大類42分支;以KEGG數(shù)據(jù)庫為參考,依據(jù)代謝通路可以將轉(zhuǎn)錄組中的數(shù)據(jù)分成125類,包括脂類代謝,DNA剪切,植物激素生物合成,苯丙氨酸生物合成,萜類化合物與類固醇類化合物合成等。
杜仲;果實;葉片;轉(zhuǎn)錄組;基因功能
杜仲(Eucommia ulmoides)是一種名貴的藥用植物,也是溫帶最具開發(fā)意義的膠原植物, 具有重要的經(jīng)濟價值[1-2]。常規(guī)育種與分子生物學(xué)相結(jié)合是林木遺傳改良的必由之路[3]。隨著后基因組時代的到來, 轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等各種組學(xué)技術(shù)相繼出現(xiàn), 其中轉(zhuǎn)錄組學(xué)是率先發(fā)展起來以及應(yīng)用最廣泛的技術(shù)[4-5]。轉(zhuǎn)錄組研究是基因功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點, 了解轉(zhuǎn)錄組是解讀基因組功能元件和揭示細(xì)胞及組織中分子組成所必需的, 并且對理解機體發(fā)育和疾病具有重要作用[6]。細(xì)胞的功能是從基因的表達(dá)開始的,轉(zhuǎn)錄組是指某一時間細(xì)胞內(nèi)所有基因轉(zhuǎn)錄而來的RNA 總稱[7]。通過分析轉(zhuǎn)錄組,可高通量地獲得基因表達(dá)的 RNA 水平有關(guān)信息, 可以揭示基因表達(dá)與一些生命現(xiàn)象之間的內(nèi)在聯(lián)系。據(jù)此我們可以高通量表征細(xì)胞生理活動規(guī)律,確定細(xì)胞代謝特性,并進而對細(xì)胞進行修飾改造[8-9]。
目前關(guān)于轉(zhuǎn)錄組的研究也是比較多的。例如,2010年朱立煌[10]利用水稻全基因組芯片, 系統(tǒng)考察了超級雜交稻“兩優(yōu)培九”及其雙親—“培矮64s“(母本 )和“ 93—11”(父本 )在 7個不同發(fā)育時期的組織中的基因表達(dá)譜, 結(jié)果表明, 從轉(zhuǎn)錄譜來看, 雜種 F1與親本間的相似性大于親本之間的相似性; 在發(fā)現(xiàn)的 3 000多個雜種和親本間差異表達(dá)的基因中, 有各種不同的差異表達(dá)類型, 多數(shù)是偏于單親的顯性表達(dá), 但也有只在雜種中出現(xiàn)的超親表達(dá)。2011年張樂等[11]以大豆基因組的46 430個高置信編碼基因和2 071條大豆全長轉(zhuǎn)錄本序列為數(shù)據(jù)來源,應(yīng)用CodonW軟件對大豆全基因組密碼子組成、同義密碼子使用頻率和全長轉(zhuǎn)錄組編碼區(qū)密碼子使用各項參數(shù)的計算和統(tǒng)計分析發(fā)現(xiàn),基因的表達(dá)水平與編碼區(qū)G+C和GC3s含量均呈極顯著正相關(guān),且G+C和GC3s含量越高的基因密碼子使用偏好性越高,并確定了UCC和GCC為大豆最優(yōu)密碼子。2011年吳劍鋒等[12]利用 tpa 及其野生型植株的開放花制備的mRNA反轉(zhuǎn)錄成cDNA與擬南芥ATH1芯片進行雜交,篩選出在tpa及其野生型植株中表達(dá)有差異的基因,并利用RT-PCR技術(shù)對芯片篩選出的基因進行驗證,獲得了152個在野生型(W1)和完全退化株(M3)轉(zhuǎn)錄組中差異表達(dá)的基因,61個在W1和部分退化株(I2)轉(zhuǎn)錄組中差異表達(dá)的基因,以及24個在I2和M3轉(zhuǎn)錄組中差異表達(dá)的基因,通過對41個基因的RT-PCR驗證,獲得了At2g42840、At1g57750、At5g20630、At2g03090、At3g08030、At5g08000、At2g28790、At5g63310 和At2g24270等9個在 tpa 及野生型植株中具顯著不同的時空表達(dá)特性的基因。2010年Olivia Wilkins等[13]通過對擬南芥一天中4個不同時間點上干旱對轉(zhuǎn)錄組調(diào)節(jié)的影響研究支持了干旱應(yīng)答轉(zhuǎn)錄的假說,即干旱應(yīng)答轉(zhuǎn)錄是在一天的不同時間里,通過顯著的激素和應(yīng)激反應(yīng)途徑形成的。2006年M.Becerra等[14]通過研究生長在奶酪乳清蛋白培養(yǎng)基上的乳酸克魯維酵母,與生長在合成培養(yǎng)基上的該酵母作比較,發(fā)現(xiàn)當(dāng)培養(yǎng)基變化時,與糖基化和分泌途徑相關(guān)的基因表達(dá)完全發(fā)生了重排,該酵母系統(tǒng)也被用來檢測乳清補充劑作為抗氧化劑的優(yōu)勢,生長在乳清蛋白培養(yǎng)基上的乳酸克魯維酵母,其和谷胱甘肽生物合成有關(guān)的基因的轉(zhuǎn)錄并沒有增加,然而,在這種介質(zhì)中生長的酵母,其和谷胱甘肽代謝和氧化應(yīng)激反應(yīng)有關(guān)的其他基因則出現(xiàn)了過量表達(dá)。
于杜仲幼果時期(5月份左右),在國家林業(yè)局泡桐研究中心采集“華仲六號”杜仲果實和葉片為材料。
果實和葉片RNA的提取參照陳建[16]的“幾種提取杜仲RNA方法的比較”。
轉(zhuǎn)錄組測序工作委托深圳華大公司完成。
圖1 數(shù)字化轉(zhuǎn)錄組數(shù)據(jù)庫的分析Fig. 1 Data Analysis of Digital Transcriptome
本研究對杜仲果實和葉片合成調(diào)控時期的轉(zhuǎn)錄組進行測序,展開了對數(shù)據(jù)庫中Unigene的全面分析和注釋。具體流程如圖1所示。
對杜仲果實和葉片進行測序后,共獲得了54 471 338個reads片段,包含了4 902 420 420個核苷酸序列信息,其中片段長度大于20個堿基的百分比為96.05%,中間未知序列的片段為0,GC%值為47.00%,由此可以看出此次轉(zhuǎn)錄組測序結(jié)果較好,可為后續(xù)的數(shù)據(jù)組裝提供很好的原始數(shù)據(jù)。
對13 333 334個reads片段采用over-lap的方法進行拼接,共獲得了452 421個Contig片段,序列信息達(dá)到了90 705 736 nt;其中,長度在75~100 nt范圍內(nèi)的Contig片段有273 533條,比
圖2 杜仲果實轉(zhuǎn)錄組的Contig數(shù)據(jù)長度分布圖Fig. 2 Contig Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Fruits
在Contig數(shù)據(jù)的基礎(chǔ)上,進一步采用over-lap的方法進行拼接,共獲得了147 027個Scaffold片段,序列信息達(dá)到了65 877 052 nt;其中,長度在100~500 nt范圍內(nèi)的Scaffold片段有111 874條,比例達(dá)到了76.09%;500~1 000 nt的有19 303條,比例為13.13%;1 000~1 500 nt的有7 730條,占5.26%;1 500~2 000 nt的有4 113條,占2.80%;≥2 000 nt的有4 007條,2.73%(見表2、圖4、圖5)。
在Scaffold數(shù)據(jù)的基礎(chǔ)上,進一步拼接,數(shù)據(jù)共獲得了49 610個Unigene片段,序列信息達(dá)到了37 616 729 nt,片段大小從100~3 256 nt;其中,長度在100~500 nt范圍內(nèi)的Unigene片段有27 428條,比例達(dá)到了55.29%;500~1 000 nt的有例達(dá)到了60.46%;100~200 nt的有80 470條,比例為17.79%;而≥200 nt的共有88 087條,比例為19.47%(見表1、圖2、圖3)。由此可見,Contig數(shù)據(jù)主要以75~100 nt的為主,完全符合Illumina測序的預(yù)期結(jié)果。10 240條,比例為20.64%;1 000~1 500 nt的有5 136條,占10.35%;1 500~2 000 nt的有3 215條,占6.48%;≥2 000 nt的有3 591條,占7.24%(見表3、圖6、圖7)。
表1 杜仲果實和葉片轉(zhuǎn)錄組的Contig數(shù)據(jù)組裝質(zhì)量統(tǒng)計Table 1 Data Assembly for Contig in Digital Transcriptome of Eucommia ulmoides Oliv Fruits and Leaves
圖3 杜仲葉片轉(zhuǎn)錄組的Contig數(shù)據(jù)長度分布圖Fig. 3 Contig Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Leaves
表2 杜仲果實和葉片轉(zhuǎn)錄組的Scaffold數(shù)據(jù)組裝質(zhì)量統(tǒng)計Table 2 Data Assembly for Scaffold in Digital Transcriptome of Eucommia ulmoides Oliv Fruits and Leaves
圖4 杜仲果實轉(zhuǎn)錄組的Scaffold數(shù)據(jù)長度分布圖Fig. 4 Scaffold Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Fruits
圖5 杜仲葉片轉(zhuǎn)錄組的Scaffold數(shù)據(jù)長度分布圖Fig. 5 Scaffold Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Leaves
表3 杜仲果實和葉片轉(zhuǎn)錄組的Unigene數(shù)據(jù)組裝質(zhì)量統(tǒng)計Table 3 Data Assembly for Unigene in Digital Transcriptome of Eucommia ulmoides Oliv Fruits and Leaves
對Unigene進行覆蓋度的分析發(fā)現(xiàn),94 334條Unigene能夠與測序的原始數(shù)據(jù)reads相對應(yīng),且不同的Unigene與reads的對應(yīng)關(guān)系各不相同,分別用測序深度—depth(reads堿基數(shù)/ 序列長度)和覆蓋度—coverage( 中有reads覆蓋的堿基數(shù)/ 序列長度)表示,depth的范圍在0.038 3~17 784.1之間,coverage的范圍在3.83%~100%之間;所有的43 879條沒有出現(xiàn)未知序列,只有2 046條有未知序列;GC%為22.07%~71.09%;Unigene對應(yīng)的reads,即樣品中能唯一比對到指定Unigene序列的reads數(shù)(Unique-mapped-Reads)從1~81 612條范圍不等。
圖6 杜仲果實轉(zhuǎn)錄組的Unigene數(shù)據(jù)長度分布圖Fig. 6 Unigene Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Fruits
圖7 杜仲葉片轉(zhuǎn)錄組的Unigene數(shù)據(jù)長度分布圖Fig. 7 Unigene Data Length Distribution for Digital Transcriptome of Eucommia ulmoides Oliv Leaves
對杜仲轉(zhuǎn)錄組所有的Unigene的cds進行blast分析,共發(fā)現(xiàn)了30 280個Unigene片段,片段大小從100~3 256 nt;其中,長度在100~~500 nt范圍內(nèi)的Unigene片段有15 138條,比例達(dá)到了50.00%;500~1 000 nt的有9 913條,比例為32.74%;1 000~1 500 nt的有5 204條,占 17.19%;1 500~ 2 000 nt的 有2606條, 占8.61%;≥2 000 nt的有2009條,占6.63%(見表4、圖8)。
表4 杜仲轉(zhuǎn)錄組All-Unigene的cds的blast分析表Table 4 Eucommia transcriptome All-Unigene cds blast analysis
在蛋白質(zhì)數(shù)據(jù)庫中對杜仲轉(zhuǎn)錄組所有的Unigene進行blast分析后,共發(fā)現(xiàn)了28 074個Unigene片段,片段大小從100~3 256 nt;其中,長度在100~500 nt范圍內(nèi)的Unigene片段有26 575條,比例達(dá)到了94.66%;500~1 000 nt的有5 268條,比例為18.76%;1 000~1 500 nt的有588條,占2.09%;1 500~2 000 nt的有92條,占0.33%;≥2 000 nt的有31條,占0.11%(見表5、圖9)。
表5 杜仲轉(zhuǎn)錄組All-Unigene在蛋白質(zhì)數(shù)據(jù)庫中的blast分析Table 5 Eucommia transcriptome All-Unigene blast in the protein database
圖8 杜仲轉(zhuǎn)錄組All-Unigene的cds的blast分析圖Fig.8 Eucommia transcriptome All-Unigene cds blast analysis
在ESTscan數(shù)據(jù)庫中對杜仲轉(zhuǎn)錄組的cds進行分析,共發(fā)現(xiàn)1 595個Unigene片段,片段大小從100~2 000 nt;其中,長度在100~500nt范圍內(nèi)的Unigene片段有1394條,比例達(dá)到了87.40%;500~1 000 nt的有180條,比例為11.29%;1 000~1 500 nt的有16條,占1.00%;1 500~2 000 nt的有92條,占0.19%;≥2 000 nt的有31條,占0.06%(見表6、圖10)。
表6 杜仲轉(zhuǎn)錄組All-Unigene在ESTscan數(shù)據(jù)庫中的cds分析Table 6 Eucommia transcriptome All-Unigene analysis in ESTscan the database cds
圖9 杜仲轉(zhuǎn)錄組All-Unigene在蛋白質(zhì)數(shù)據(jù)庫中的blast分析圖Fig.9 Eucommia transcriptome All-Unigene database of protein blast analysis
圖10 杜仲轉(zhuǎn)錄組All-Unigene在ESTscan數(shù)據(jù)庫中的cds分析圖Fig.10 The cds Eucommia transcription group All-Unigene ESTscan database analysis
共有125 934條 可以與數(shù)據(jù)庫中的基因具有相似性,且較多的單條Unigene能夠與多種基因相對應(yīng),建立了125 934條對應(yīng)關(guān)系。杜仲果實和葉片轉(zhuǎn)錄組中的Unigene根據(jù)功能大致可分為25類(圖11中用A~Z表示),并對每一類的基因數(shù)量進行了統(tǒng)計(表7)。從表中和圖中可以看出,Unigene的COG功能種類比較全面,涉及了大多數(shù)的生命活動,整體功能類的基因數(shù)量最多,有20 153條;核結(jié)構(gòu)相關(guān)基因類的數(shù)量最少,只有3條;其他種類基因的表達(dá)豐度不盡相同,具體種類和數(shù)量見表7。
表7 杜仲果實和葉片轉(zhuǎn)錄組的UnigeneCOG功能分類Table 7 COG Function Classification of Eucommia ulmoides Oliv Fruits and Leaves in Digital Transcriptome
根據(jù)分析發(fā)現(xiàn),共有8 260條Unigene可以與數(shù)據(jù)庫中的基因具有相似性,且較多的單條Unigene能夠與多種基因相對應(yīng),建立了8 260條對應(yīng)關(guān)系,從而得到盡可能多的注釋和分類。杜仲轉(zhuǎn)錄組中的Unigene根據(jù)GO功能大致可分為生物過程、細(xì)胞組分和分子功能3大類42分支(見圖12),并對每一類的基因數(shù)量進行了統(tǒng)計(見表8)。從表中和圖中可以看出,其中細(xì)胞組分這一大類中,涉及的基因最多,有3 959條;在生物過程這一大類中,涉及的基因有2 602條;在分子功能這一大類中,涉及的基因有2 665條。其他種類基因的表達(dá)豐度不盡相同,具體種類和數(shù)量見表8。
表8 杜仲果實和葉片轉(zhuǎn)錄組的UnigeneGO功能分類Table 8 Gene Ontology of Eucommia ulmoides Oliv Fruits and Leaves Unigene in Digital Transcriptome
圖11 杜仲果實和葉片轉(zhuǎn)錄組的UnigeneCOG功能分類Fig. 11 COG Function Classification of Eucommia ulmoides Oliv Fruits and Leaves in Digital Transcriptome
圖12 杜仲果實和葉片轉(zhuǎn)錄組的UnigeneGO功能分類Fig. 12 Gene Ontology of Eucommia ulmoides Oliv Fruits and Leaves Unigene in Digital Transcriptome
利用KEGG數(shù)據(jù)庫作為參考,依據(jù)代謝通路可以將轉(zhuǎn)錄組中的數(shù)據(jù)分成125類,包括生化代謝通路,植物—真菌互作,DNA剪切,植物激素生物合成,苯丙氨酸生物合成,萜類化合物與類固醇類化合物合成,脂類代謝,RNA降解等,具體列于表9。其中,不飽和脂肪酸的生物合成,涉及的基因有93條,占整體的0.63%;黃酮類代謝,涉及的基因有249條,占整體的1.68%;苯丙素類代謝,涉及的基因有421條,占整體的2.84%;類胡蘿卜素類代謝,涉及的基因96條,占整體的0.61%;蕓苔素類代謝,涉及的基因25條,占整體的0.17%;葉酸代謝途徑,涉及的基因13條,占整體的0.09%;維生素B5代謝途徑,涉及的基因31條,占整體的0.21%;維生素B2代謝途徑,涉及的基因有24條,占整體的0.16%;α-亞麻酸代謝途徑,涉及的基因有138條,占整體的0.93%。
所構(gòu)建的杜仲果實和葉片轉(zhuǎn)錄組數(shù)據(jù)庫獲得了54 471 338條reads數(shù)據(jù),包含4 902 420 420 nt數(shù)據(jù)信息,對reads進行拼接,獲得了452 421條Contig,總長度為90 705 736 nt; 對contig進行拼接后,獲得了147 027條Scaffold,總長度為65 877 052 nt;同理,對Scaffold進一步拼接后,獲得了49 610條Unigene,總長度為37 616 729 nt;對杜仲轉(zhuǎn)錄組所有的Unigene的cds進行blast分析,共發(fā)現(xiàn)了30 280個Unigene片段, 在蛋白質(zhì)數(shù)據(jù)庫中對杜仲轉(zhuǎn)錄組所有的Unigene進行blast分析后,共發(fā)現(xiàn)了28 074個Unigene片段,在ESTscan數(shù)據(jù)庫中對杜仲轉(zhuǎn)錄組的cds進行分析,共發(fā)現(xiàn)1 595個Unigene片段,共有125 934條 Unigene可以與COG數(shù)據(jù)庫中的基因具有相似性,共有8 260條Unigene可以與GO數(shù)據(jù)庫中的基因具有相似性。
2010年高珍[16]通過對滸苔測序得到29 370 732條reads片段,平均長度75 bp,總長為2 202 804 900 bp,將Reads數(shù)據(jù)組裝成contig,得到2 288 272條contig片段,平均長度為40 bp,總長91 817 153 bp。
2011年LIU Xin- xing等[17]通過對四倍體擬南芥的轉(zhuǎn)錄組的研究,得到了23 476 310條reads片段,堿基對總長度達(dá)到了1 690 294 320 bp,非冗余副本(≥100 bp)的數(shù)量為125 953條,轉(zhuǎn)錄的中長度為41 665 175,經(jīng)過組裝,得到的contigs(≥100 bp)的數(shù)量從155 306( kmer =33 bp)條到23 117 ( kmer = 57 bp)條不等。
將本次測序結(jié)果與上述兩人的測序結(jié)果相比,可以看出本次測序得到的數(shù)據(jù)量更大,所以本次測序結(jié)果較好。
[1] 杜紅巖,李 欽,杜蘭英,等.杜仲雄花茶營養(yǎng)成分的測定分析[J]. 中南林業(yè)科技大學(xué)學(xué)報,2007,27(6):88-89.
[2] 薛 萍.杜仲研究現(xiàn)狀與發(fā)展前景[J].經(jīng)濟林研究,1995,13(3).
[3] 陳 英,江香梅,張 露,等.基于油茶59萬條EST序列的轉(zhuǎn)錄組學(xué)初步分析[J].林業(yè)科學(xué),2011,47(2):161-163.
[4] Lockhart DJ, Winzeler EA. Genomics, gene expressand DNA arrays. Nature, 2000, 405(6788): 827–836.
[5] 房學(xué)爽,徐剛標(biāo).表達(dá)序列標(biāo)簽技術(shù)及其應(yīng)用[J].經(jīng)濟林研究,2008,26(2):127-130.
[6] 祁云霞,劉永斌,榮威恒. 轉(zhuǎn)錄組研究新技術(shù):RNA-Seq 及其應(yīng)用[J].遺傳, 2011,33(11): 1191-1202.
[7] 井趙斌,魏 琳,俞 靚,等.轉(zhuǎn)錄組測序及其在牧草基因資源發(fā)掘中的應(yīng)用前景[J].草業(yè)科學(xué),2011,28(7): 1364-1369
[8] Jewett MC, Oliveira AP, Patil KR, et al. The role of highthroughput transcriptome analysis in metabolic engineering.Biotechnol Bioproc Eng, 2005, 10: 385-399.
[9] Donson J, Fang Y, Espiritu-Santo G, et al. Comprehensive gene expression analysis by transcript profiling. Plant Mol Biol, 2002,48: 75-97.
[10] 朱立煌.超級雜交水稻LYP9及其親本的轉(zhuǎn)錄組學(xué)研究[J].中國基礎(chǔ)科學(xué)·研究進展.
[11] 張 樂,金龍國,羅 玲,等. 大豆基因組和轉(zhuǎn)錄組的核基因密碼子使用偏好性分析[J]. 作物學(xué)報, 2011,37(6):965-974.
[12] 吳劍鋒,張海娟,盧海宇,等. 基因芯片分析蕪菁雌蕊退化突變體 tpa 及野生型開放花的轉(zhuǎn)錄組差異[J]. 中國農(nóng)業(yè)科學(xué) ,2011,44(5):972-981.
[13] Olivia Wilkins, Katharina Brautigam, Malcolm M.Campbell.Time of day shapes Arabidopsis drought transcriptomes[J]. The Plant Journal,2010( 63):715-727.
[14] M Becerra, M I Gonzalez-Siso, M E Cerdan. A transcriptome analysis of Kluyveromyces lactis growing in cheese whey[J].International Dairy Journal , 2006 (16):207-214.
[15] 陳 建.幾種提取RNA方法的比較[J].林業(yè)科技開發(fā),2007,21(5):19-21.
[16] 高 珍.滸苔生理生態(tài)特性和轉(zhuǎn)錄組研究[D].甘肅:甘肅農(nóng)業(yè)大學(xué),2010.
[17] LIU Xin- xing, CHEN Chao. De Novo Assembly of Allotetraploid Arabidopsis suecica Transcriptome using Short Reads for Gene Discovery and Marker Identification[J]. 中國生物工程雜志, 2011,31(7): 45-53.
Transcriptome data assembly and gene function annotation of Eucommia fruits and leaves
LI Tie-zhu1a, DU Hong-yan2, LIU Hui-min1b,1c, WUYUN Ta-na1b,1c, WANG Lin1b,1c,YE Sheng-jing1b,1c
(1a. School of Life Science&Technology; 1b. Key Lab of Non-wood Forest Product of Forestry Ministry; 1c.School of Forestry, Central South University of Forestry and Technology, Changsha 410004, Hunan, China; 2.Non - timber Forestry Research and Development Center, CAF, Zhengzhou 450003, Henan, China)
The transcriptome library of Eucommia fruits and leaves contained 54471338 reads consist of 4902420420 nt. 452421 Contigs were obtained by assembling the reads, and the total length of all Contigs was 90705736 nt;In the transcriptome library, 147027 Scaffolds were obtained by assembling the Contigs, and the total length of all Scaffolds was 6587705 nt; Also the 49610 Unigenes were obtained by by assembling the Scaffolds in the transcriptome library, and the total length of all Unigenes was 37616729 nt;Unigene and the COG database to compare, Unigene in the transcriptome of Eucommia fruits and leaves can be broadly divided into 25 classes according to the function; The Unigenes GO functions in the the transcriptome library were classificated into 3 categories: biological process, cellular component and molecular function and 42 branches;In this study,the KEGG database as a reference,data in the transcriptome can be divided into 119 classes,according to the metabolic pathway,such as lipid metabolism, DNA replication, biosynthesis of plant hormones,Biosynthesis of phenylpropanoids, Biosynthesis of terpenoids and steroids and so on.
Eucommia ulmoides;fruits;leaves; transcriptome;Gene Ontology
S722.3;Q945
A
1673-923X(2012)11-0122-09
2012-10-10
國家林業(yè)公益性行業(yè)科研專項(201004029);國家十二五科技支撐計劃(2012BAD21B0502)
李鐵柱(1979-),男,河南南陽人,博士研究生,主要從事生態(tài)學(xué)研究
杜紅巖(1963-),男,河南中牟人,研究員,博士生導(dǎo)師,主要從事杜仲育種栽培與綜合利用的研究;E-mail:dhy515@126.com
[本文編校:歐陽欽]