龔達(dá)平
(中國農(nóng)業(yè)科學(xué)院煙草研究所,青島 266101)
全長cDNA文庫代表的是mRNA的完整拷貝,能提供完整的基因編碼區(qū)信息,揭示基因的表達(dá)水平,特別是基因組測序完成后對輔助基因注釋和開展功能基因研究具有重要作用。普通煙草(Nicotiana tabacum)為異源四倍體植物,基因組大小約 4.5G,基因組結(jié)構(gòu)高度復(fù)雜。美國煙草基因組計劃對四倍體烤煙品種采用甲基過濾法測序只獲得了部分基因序列信息[1]。我國煙草基因組計劃完成了對普通煙草的兩個祖先種絨毛狀煙草(N.tomentosiformis)和林煙草(N.sylvestris)全基因組序列圖譜的繪制,更充分地驗證了煙草基因組結(jié)構(gòu)高度復(fù)雜這一事實[2]。美國煙草基因組計劃以及歐洲和日本煙草測序項目通過構(gòu)建各種煙草不同發(fā)育時期的多個cDNA文庫對基因組數(shù)據(jù)信息進(jìn)行了補(bǔ)充[3]。目前,在GenBank數(shù)據(jù)庫中登錄的煙草表達(dá)序列標(biāo)簽(expressed sequence tags,ESTs)超過30萬條,但關(guān)于煙草全長cDNA文庫的規(guī)?;瘶?gòu)建和測序分析報道較少。煙草全長cDNA文庫的構(gòu)建及測序是我國煙草基因組計劃的重要研究內(nèi)容,目前也取得了較大進(jìn)展。
采用cap-trapper、SMART和CloneMiner等多種方法,構(gòu)建了普通煙草紅花大金元、凈葉黃、小黃金1025、大白筋599、K326、白肋21、Basma等品種以及絨毛狀煙草、林煙草、殘波煙草(N.repanda)和非洲煙草(N.africana)等煙草野生種幼苗期、旺長期、成熟期葉片、腺毛、腋芽、根、花等組織器官的全長cDNA文庫和均一化文庫[4-6]。此外還構(gòu)建了馬鈴薯Y病毒、黑脛病抗性差減雜交文庫,共建成多種煙草材料的不同發(fā)育時期不同組織的cDNA文庫32個[7-8]。為進(jìn)一步獲得基因信息和篩選重要功能基因,對其中4個cDNA文庫進(jìn)行了EST測序和生物信息學(xué)分析,同時還開展了絨毛狀煙草、林煙草、耳狀煙草(N.otophora)和栽培煙草的根、莖、葉、花等主要組織共16個樣品的轉(zhuǎn)錄組測序及分析。
對紅花大金元幼苗期葉片全長cDNA文庫共測序5280個克隆,獲得5233個高質(zhì)量EST序列,平均長度518 bp,拼接出3922個非冗余基因(unigene),其中3519個基因具有功能注釋,通過同源基因比較法確認(rèn),1124個非冗余基因是全長的完整基因[4]。對普通煙草品種K326腺毛全長cDNA文庫進(jìn)行5’端測序,得到有效序列5139條,拼接出2831個非冗余基因。對林煙草共測序11 232個克隆,獲得長度大于100 bp的高質(zhì)量序列 10 503條,平均序列長度為 671 bp;通過組裝得到重疊群(contigs)1408條和單一序列(singlets)4293條,共得到5701個非冗余基因,其中全長基因數(shù)量為1611條。對絨毛狀煙草共測序11 293個克隆,獲得長度大于100 bp的高質(zhì)量序列10 450條,平均序列長度為641 bp;通過組裝得到重疊群1202條,單一序列3606條,共得到4808個非冗余基因,其中全長基因數(shù)量為1639條。
簡單重復(fù)序列(simple sequence repeat,SSR)和單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)標(biāo)記是目前應(yīng)用最為廣泛的兩種分子標(biāo)記。基于普通煙草EST序列的冗余性,結(jié)合SNP位點所在序列的文庫和品種信息以及多個SNP位點的共分離分值,鑒定了大量的編碼區(qū)SNP(coding SNP,cSNP)[9]。共計317 175條普通煙草EST拼接成至少包含4個讀長的重疊群15 429個,鑒定出53 477個冗余度大于2的候選SNP,煙草中出現(xiàn)SNP的頻率為0.34%。其中SNP的轉(zhuǎn)換率大于顛換率,插入/刪除表現(xiàn)出A/T偏好。此外,還鑒定了包含2~6個堿基重復(fù)單元的SSR位點11 869個。其中,單一類型和復(fù)合類型的SSR分別是1209個和945個,大多數(shù)序列只包含一個SSR位點。最為豐富的SSR重復(fù)單元是AG(2494個)和AAG(1576個),分別占二核苷酸重復(fù)和三核苷酸重復(fù)的21.1%和13.3%。大約每0.8 Kb長度的序列中存在 1個 SSR?;?EST序列的組裝、注釋和標(biāo)記信息,構(gòu)建了具有 blast比對和序列檢索功能的Linux+Apache+MySQL+PHP煙草EST數(shù)據(jù)庫系統(tǒng)。
基于cDNA文庫和EST測序信息,鑒定了多個參與煙堿合成、抗病歷程、香氣代謝的關(guān)鍵候選基因或轉(zhuǎn)錄因子[4];克隆了調(diào)控?zé)煵菀秆啃纬苫颍∟tLS)、煙草鈣依賴蛋白激酶基因(NtCDPK)、煙草抗馬鈴薯Y病毒病相關(guān)基因(NtPsaN)等重要基因(家族),并對其組織表達(dá)特異性進(jìn)行了研究,還對NtLS基因、含有核苷酸結(jié)合區(qū)(nucleotide binding site, NBS)結(jié)構(gòu)的抗病基因等構(gòu)建了RNAi干涉載體庫并進(jìn)行遺傳轉(zhuǎn)化,對其具體功能進(jìn)行了初步研究[10-13]。
[1]Bindler G, Plieske J, Bakaher N, et al.A high density genetic map of tobacco (Nicotiana tabacumL.) obtained from large-scale microsatellite marker development[J].Theor Appl Genet., 2011, 123(2): 219-230.
[2]國家煙草專賣局.中國煙草基因組計劃取得重大突破:絨毛狀煙草和林煙草全基因組序列圖譜完成[EB/OL].2011.http://www.tobaccoinfo.com.cn/zhxx/spgdgg/2011/12/78013.shtml.
[3]Edwards K D, Bombarely A, Story G W, et al.TobEA: an atlas of tobacco gene expression from seed to senescence[J].BMC Genomics, 2010, 11(1): 142-157.
[4]龔達(dá)平,解敏敏,孫玉合.煙草葉片全長cDNA文庫構(gòu)建及EST序列分析[J].中國農(nóng)業(yè)科學(xué),2012,45(9):1696-1702.
[5]崔紅,冀浩,張華,等.煙草腺毛全長cDNA文庫的構(gòu)建[J].廈門大學(xué)學(xué)報,2006,45(6):859-862.
[6]蔡劉體,胡重怡,張永春,等.烤煙品種江南3號均一化全長文庫構(gòu)建[J].生物技術(shù),2011(2):45-47.
[7]周佳.煙草抗馬鈴薯Y病毒病SSH文庫構(gòu)建及相關(guān)基因研究[D].北京:中國農(nóng)業(yè)科學(xué)院,2010.
[8]蘇振剛,楊愛國,孫玉合,等.黑脛病菌誘導(dǎo)的煙草SSH文庫構(gòu)建及其分析[J].作物學(xué)報,2011,37(10):1763-1770.
[9]龔達(dá)平,王魯,李鳳霞,等.基于EST序列的煙草cSNP發(fā)掘[J].中國煙草科學(xué),2012,33(6):61-65.
[10]王衛(wèi)鋒,太帥帥,王魯,等.煙草NtLS基因RNA干擾表達(dá)載體的構(gòu)建及遺傳轉(zhuǎn)化[J].中國煙草科學(xué),2011,32(4):31-35.
[11]張麗,張磊,康樂,等.絨毛狀煙草鈣依賴蛋白激酶基因家族分析[J].中國煙草科學(xué),2012,33(3):56-62.
[12]周佳,李鳳霞,陳帥,等.煙草抗馬鈴薯Y病毒病相關(guān)基因NtPsaN的克隆及表達(dá)分析[J].中國農(nóng)業(yè)科學(xué),2010,43(6):3323-3330.
[13]楊帆,李鳳霞,孫玉合,等.煙草抗病毒相關(guān)R基因RNAi表達(dá)載體的構(gòu)建[J].中國煙草科學(xué),2012,33(1):23-26.