崔雪加得拉·吐留汗于月華陳全家申麗婕葉佳麗楊颶立陶順倪志勇,2
(1. 新疆農(nóng)業(yè)大學農(nóng)學院 新疆農(nóng)業(yè)大學農(nóng)業(yè)生物技術重點實驗室,烏魯木齊 830052;2. 中國農(nóng)業(yè)科學院棉花研究所 棉花生物學國家重點實驗室,安陽 455000)
海島棉GbHCT基因克隆及生物信息學分析
崔雪1加得拉·吐留汗1于月華1陳全家1申麗婕1葉佳麗1楊颶立1陶順1倪志勇1,2
(1. 新疆農(nóng)業(yè)大學農(nóng)學院 新疆農(nóng)業(yè)大學農(nóng)業(yè)生物技術重點實驗室,烏魯木齊 830052;2. 中國農(nóng)業(yè)科學院棉花研究所 棉花生物學國家重點實驗室,安陽 455000)
克隆海島棉木質(zhì)素合成關鍵酶基因GbHCT全長cDNA序列,分析其在纖維不同發(fā)育時期的表達情況。根據(jù)海島棉轉錄組數(shù)據(jù)中的HCT序列設計引物,采用RT-PCR技術克隆基因,通過生物信息學方法分析GbHCT的cDNA序列和氨基酸序列。通過分析轉錄組數(shù)據(jù)研究GbHCT在纖維不同發(fā)育時期的表達。從海島棉中克隆了1個編碼HCT的基因GbHCT,開放閱讀框長度為1 311 bp,編碼436個氨基酸,蛋白質(zhì)分子量為48.58 kD,等電點為6.03。GbHCT氨基酸序列中含有HTLGD和DFGWG 2個保守基序。GbHCT氨基酸與陸地棉、亞洲棉和雷蒙德氏棉HCT一致性較高,與其他植物中的HCT氨基酸的一致性為55.7%-60.7%。轉錄組數(shù)據(jù)分析發(fā)現(xiàn)GbHCT在纖維不同發(fā)育階段都有表達,在5 DPA的纖維中表達量最高,表明該基因可能參與棉花纖維的發(fā)育。
海島棉;HCT;基因克?。簧镄畔W
棉花是世界上最重要的纖維作物之一,棉纖維品質(zhì)優(yōu)劣直接影響紡織品的市場競爭力[1,2]。棉花為錦葵科棉屬,棉屬有52個種,包括4個栽培棉種、47個野生棉種?,F(xiàn)廣泛種植的陸地棉和海島棉為異源四倍體栽培種[3]。 陸地棉適應性廣且產(chǎn)量高,占我國所產(chǎn)原棉的99%。海島棉在我國目前只有新疆生產(chǎn),海島棉纖維的長度、細度和強力等方面優(yōu)于陸地棉[4,5]。棉花育種家一直致力于培育具有產(chǎn)量和品質(zhì)兼?zhèn)涞拿藁ㄆ贩N,利用基因工程技術將海島棉中纖維品質(zhì)形成相關基因轉入陸地棉中來改良其纖維品質(zhì)是一種有效的方法。從分子水平上研究海島棉優(yōu)質(zhì)纖維形成的機理,克隆纖維發(fā)育相關基因尤為重要。最近研究表明苯丙烷代謝途徑及其產(chǎn)物在棉花纖維品質(zhì)形成過程中具有重要的作用[6-9],對參與苯丙烷代謝途徑的基因功能及作用機理開展研究,有望為改良纖維品質(zhì)提供新的候選基因。莽草酸/奎寧酸羥基肉桂酰轉移酶(shikimate /quinate hydroxycinnamoyl transferase,HCT)在苯丙烷C3羥基化的上、下游起著雙重調(diào)節(jié)作用,是苯丙烷代謝途徑中的關鍵酶之一[10]。在本生煙[11](Nicotiana benthamiana)和紫花苜蓿[12](Medicago sativa)中,沉默HCT基因導致減少轉基因 植株愈創(chuàng)木基木質(zhì)素(guaiacyl lignin,G-lignin)和紫丁香基木質(zhì)素(syringyl lignin,S-lignin)的含量,增加對-羥苯基木質(zhì)素(phydroxyphenyl lignin,H-lignin)的含量。在輻射松[13](Pinus radiata)中,沉默HCT基因導致轉基因植株木質(zhì)素含量減少42%,這些研究表明通過改變HCT的活性能夠調(diào)控木質(zhì)素代謝。迄今,已經(jīng)從本生煙[11]、紫花苜蓿[12]、棕色棉(Gossypium hirsutum L.)[14]、茶樹(Camellia sinensis L.)[15-19]等植物中克隆了HCT基因并鑒定了基因的功能,但海島棉中HCT基因的克隆研究尚未報道。本研究前期采用轉錄組測序方法對海島棉品種新海21胚珠,以及不同發(fā)育時期的纖維的轉錄本進行分析,從轉錄組數(shù)據(jù)中獲得HCT的序列,根據(jù)HCT序列設計引物,從海島棉品種新海21中克隆了1個GbHCT基因,分析了其序列和蛋白質(zhì)的親疏水性,二級和三級結構,亞細胞定位、跨膜域和信號肽,并利用轉錄組數(shù)據(jù)分析該基因的表達模式,旨為進一步研究海島棉GbHCT基因的功能奠定基礎。
1.1 植物材料
收集海島棉品種新海21(Gossypium barbadense L cv. Xinhai 21)生長至三葉期的葉片,液氮迅速冷凍,于-80℃保存?zhèn)溆谩?/p>
1.2 方法
1.2.1 RNA的提取及cDNA第一鏈的合成 按Trizol試劑盒(Invitrogen)使用說明,提取葉片總RNA。利用first strand cDNA Synthesis試劑盒(Thermo Fisher)反轉錄合成cDNA第一鏈。按說明書配制反轉錄第一鏈合成 反應體系。
1.2.2 GbHCT基因的克隆 根據(jù)海島棉胚珠轉錄組數(shù)據(jù)中的HCT基因序列設計一對引物,nHCT-F:5'-ATGGAGATTACTATAAAGGAGTCTGC-3'和 n H C T-R:5'-T T A A A A C T C A T A A A TAAGTTTTTCAAAAA-3',以合成海島棉品種新海2 1葉片的cDNA第一鏈為模板,擴增基因的開放閱讀框(ORF)。按TransStart Taq DNA酶說明書體系進行PCR反應液的配制。PCR 程序為:94℃預變性5 min,94℃變性30 s,56℃復性45 s,72℃延伸 1 min 30 s,共35個循環(huán);72℃延伸10 min。PCR產(chǎn)物連接到pMD18-T(TaKaRa)載 體,菌液PCR檢測后的陽性克隆送上海美季公司測序。
1.2.3 生物信息學分析 利用DNAMAN軟件和Blast檢 索GenBank進行多重序列比較和同源性分析。利用Clustalx 1.83軟件和MEGA 4.1 軟件構建系統(tǒng)發(fā)生樹。用Protparam(http://www.expas y. org/tools/protparam)在線預測蛋白的分子質(zhì)量、等電點及基本性質(zhì);利用GOR IV 程序預測蛋白質(zhì)的二級 結 構(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat. pl?page =npsa_gor4.html)。利用Swiss-Model(http:// swissmodel.expasy.org)程序預測蛋白質(zhì)的三級結構。用ProtScale(http://web.expasy.org/protscale/)分析蛋白質(zhì)的親水/疏水性。利用PSORT程序(http://www. psort.org/)對蛋白的亞細胞定位進行預測分析。利用TMpred(http://www.ch.embnet.org/software/TMPRE D_ form.html)預測跨膜域。 利用SignalP程序(http://www. cbs.dtu.dk/services/SignalP-3.0/)預測信號肽。
1.2.4 GbHCT表達模式分析 查找本實驗室海島棉纖維發(fā)育不同時期的轉錄組數(shù)據(jù),獲得在0、5、10、15和25 DPA中GbHCT對應轉錄組中unigene的reads數(shù),用RPKM值表示GbHCT基因的相對 表達量。
2.1 GbHCT基因的克隆及序列分析
根據(jù)海島棉轉錄組數(shù)據(jù)中的HCT序列設計引物,從海島棉中克隆了一個編碼HCT的基因GbHCT(圖1)。GbHCT基因開放閱讀框長度為1 311 bp,編碼436個氨基酸,GenBank登錄號為KT378286。使用Protparam在線預測GbHCT蛋白質(zhì)分子量為48.58 kD,等電點為6.03,分子式為C2206H3425N581O636S10。GbHCT與其他植物的HCT氨基酸序列進行比對發(fā)現(xiàn)其氨基酸序列中含有HTLGD和DFGWG 2個保守基序(圖2)。BLAST陸地棉基因組數(shù)據(jù)發(fā)現(xiàn)GbHCT對應陸地棉CotAD-76176,定位于第11號染色體28871744-28873146(+),含有1個內(nèi)含子。
圖1 GbHCT基因的擴增
同源性分析表明,GbHCT氨基酸與陸地棉CotAD-76176的氨基酸序列僅相差1個氨基酸,一致性達到99.77%。與亞洲棉GaHCT(KHG20214.1),雷蒙德氏棉GbHCT(XP_012455202.1)和棕色棉GhHCT(KF749428.1)的一致性分別為99.54%,97.02%和60.7%。與其他植物中的HCT氨基酸的一致性為55.7%-60%(圖2)。系統(tǒng)發(fā)生樹(圖3)分析發(fā)現(xiàn)GbHCT和陸地棉CotAD-76176,亞洲棉和雷蒙德氏棉HCT成為一個分支,而棕色棉HCT(KF749428.1)和其他植物的HCT聚在一個分支,說明GbHCT和其他植物的HCT蛋白親緣關系較遠。
2.2 GbHCT蛋白的二級,三級結構和親疏水性預測
利用GOR IV 程序預測蛋白質(zhì)的二級結構,如圖4所示GbHCT蛋白由436個氨基酸殘基組成,其中27.52%(120個)氨基酸殘基可能形成α螺旋,21.10%(92個)氨基酸殘基可能形成延伸鏈,51.38%(224個)氨基酸殘基可能形成無規(guī)卷曲。
利用SWISS-MODEL數(shù)據(jù)庫進行GbHCT蛋白質(zhì)的三級結構分析,采用同源建模的方法,選擇比對率最高的中??Х菴offea canephora HCT蛋白(SMTL id 4g0b.1)作為參照,得到GbHCT蛋白的三級結構圖(圖5)。
利用ProtScale對GbHCT蛋白進行親水/疏水性分析。結果如圖6所示,GbHCT蛋白436個氨基酸當中疏水性氨基酸最大值為2.444,親水性氨基酸最小值為-2.744,親水性總平均值為-0.151,推測GbHCT蛋白是親水性蛋白。
2.3 GbHCT蛋白的亞細胞定位、跨膜域和信號肽預測
利用 Psport 在線預測GbHCT蛋白的亞細胞定位,結果表明定位于葉綠體基質(zhì)的可能性為47.9%,定位于細胞質(zhì)的可能性為45.0%,定位于微體(過氧物酶體)的可能性為44.3%,定位于葉綠體類囊體膜的可能性為13.1%。因此推測GbHCT蛋白可能定位于葉綠體基質(zhì)。TMpred在線預測表明GbHCT蛋白存在一個跨膜域,位于301-319個氨基酸。SignalP預測表明GbHCT蛋白沒有信號肽。
2.4 GbHCT基因的表達模式
檢索海島棉纖維轉錄組數(shù)據(jù)發(fā)現(xiàn),GbHCT基因在5 DPA的纖維中表達量最高,RPKM值為145 4.89。在10,15 DPA的纖維中表達量逐漸降低,在25 DPA表達量最低,RPKM值為22(圖7)。根據(jù)Gb-HCT的表達量推測該基因可能參與棉纖維發(fā)育進程。
圖2 GbHCT與其他植物的HCT氨基酸序列比對分析
圖3 GbHCT蛋白與其他植物的HCT蛋白的系統(tǒng)發(fā)生樹分析
圖4 GbHCT蛋白的二級結構
圖5 GbHCT蛋白的三級結構同源建模
圖6 GbHCT蛋白的親/疏水性分析
木質(zhì)素代謝是苯丙烷代謝途徑重要分支代謝途徑。最近一些研究表明,木質(zhì)素的生物合成及在成熟纖維中的含量與棉花纖維的品質(zhì)有一定的關系。Fan等[7]發(fā)現(xiàn)酚類化合物結合成熟棉花纖維的細胞壁,而且在棉花纖維次生壁形成階段編碼催化木質(zhì)素代謝途徑中最后一步反應的酶基因GhCAD6為上調(diào)表達。Al-Ghazi等[6]發(fā)現(xiàn)在陸地棉和海島棉中編碼催化從苯丙烷到對香豆酸途徑的酶基因PAL,C4H和4CL具有相似的表達水平。而且在纖維發(fā)育早期這些基因是非常高的表達,C4H表達與纖維長度性狀正相關。Wang等[9]發(fā)現(xiàn)GhmiR397可能在棉纖維起始階段起正調(diào)控子作用,在野生型棉花胚珠中,GhmiR397介導的基因沉默下調(diào)控漆酶基因的表達,漆酶的減少導致木質(zhì)素產(chǎn)物減少,結果細胞壁表皮細胞松弛,促進纖維膨脹和起始。Han等[8]研究發(fā)現(xiàn)WLIM1a在棉花次生壁增厚期可以作為一個轉錄因子通過結合4CL1,CCR1和CAD6啟動子中PAL-box順式作用元件上調(diào)這些基因的表達,從而使得超表達轉基因棉花株系的木質(zhì)素含量相對于野生型含量增加,因而影響纖維次生壁成分,使得纖維變細。這表明木質(zhì)素或木質(zhì)素類似酚類化合物可能影響纖維發(fā)育質(zhì)量。對本課題組海島棉轉錄組測序數(shù)據(jù)分析發(fā)現(xiàn)苯丙烷代謝途徑中包括HCT基因在內(nèi)的多個基因在纖維發(fā)育的不同時期表達,本研究利用轉錄組數(shù)據(jù)從海島棉中克隆了GbHCT基因,對其序列進行了生物信息學分析。肖向文等[15]從棕色棉中克隆了一個HCT基因發(fā)現(xiàn),該基因在16 DPA的胚珠中表達最高,在花瓣、莖和纖維中表達量次之,在葉片中的表達量最低。本研究發(fā)現(xiàn)海島棉GbHCT基因在5 DPA的纖維中表達量最高,HCT基因在棕色棉和海島棉中表達時期的差異可能與兩者品質(zhì)的優(yōu)劣有一定的關系,下一步將通過轉化海島棉來分析GbHCT基因的生物學功能。
圖7 GbHCT基因的表達分析
從海島棉中克隆了1個編碼HCT的基因GbHCT,開放閱讀框長度為1 311 bp,編碼436個氨基酸,蛋白質(zhì)分子量為48.58 kD,等電點為6.03。GbHCT氨基酸序列中含有HTLGD和DFGWG 2個保守基序。預測了GbHCT蛋白的二級、三級結構、親疏水性、跨膜域和信號肽。GbHCT氨基酸與陸地棉CotAD-76176僅相差1個氨基酸,與其他植物中的HCT氨基酸的一致性為55.7%-60.7%。GbHCT在纖維不同發(fā)育階段都有表達,在5 DPA的纖維中表達量最高,表明該基因可能參與棉花纖維的發(fā)育。
[1] 喻樹迅, 王子勝. 中國棉花科技未來發(fā)展戰(zhàn)略構想[J]. 沈陽農(nóng)業(yè)大學學報:社會科學版, 2012, 14(1):3-10.
[2] 喻樹迅. 我國棉花生產(chǎn)現(xiàn)狀與發(fā)展趨勢[J]. 中國工程科學, 2013, 15(4):9-13.
[3] 李付廣, 袁有祿. 棉花分子育種進展與展望[J]. 中國農(nóng)業(yè)科技導報, 2011, 13(5):1-8.
[4] Li F, Fan G, Wang K, et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics, 2014, 46(6):567-572.
[5] Wang K, Wang Z, Li F, et al. The draft genome of a diploid cotton Gossypium raimondii[J]. Nature Genetics, 2012, 44(10):1098-1103.
[6] Al-ghazi Y, Bourot S, Arioli T, et al. Transcript profiling during fiber development identifies pathways in secondary metabolism and cell wall structure that may contribute to cotton fiber quality[J]. Plant and Cell Physiology, 2009, 50(7):1364-1381.
[7] Fan L, Shi WJ, Hu WR, et al. Molecular and biochemical evidence for phenylpropanoid synthesis and presence of wall-linked phenolics in cotton fibers[J]. Journal of Integrative Plant Biology, 2009, 51(7):626-637.
[8] Han LB, Li YB, Wang H Y, et al. The dual functions of WLIM1a in cell elongation and secondary wall formation in developing cotton fibers[J]. The Plant Cell, 2013, 25(11):4421-4438.
[9] Wang ZM, Xue W, Dong CJ, et al. A comparative miRNAome analysis reveals seven fiber initiation-related and 36 novel miRNAs in developing cotton ovules[J]. Molecular Plant, 2012, 5(4):889-900.
[10] Hoffmann L, Maury S, Martz F, et al. Purification, cloning, and properties of an acyltransferase controlling shikimate and quinate ester intermediates in phenylpropanoid metabolism[J]. Journal of Biological Chemistry, 2003, 278(1):95-103
[11] Hoffmann L, Besseau S, Geoffroy P, et al. Silencing of hydroxycinnamoyl-Coenzyme A shikimate/quinate hydroxycinnamoyl- transferase affects phenylpropanoid biosynthesis[J]. The Plant Cell, 2004, 16(6):1446-1465.
[12] Chen F, Reddy MSS, Temple S, et al. Multi-site genetic modulation of monolignol biosynthesis suggests new routes for formation ofsyringyl lignin and wall-bound ferulic acid in alfalfa(Medicago sativa L. )[J]. Plant Journal, 2006, 48:113-124.
[13] Wagner A, Ralph J, Akiyama T, et al. Exploring lignification in conifers by silencing hydroxylcinnamoyl-CoA:shikimate hydroxycinnamoyltransferase in Pinus radiate[J]. Proceedings of the National Academy of Sciences of the United States of America. 2007, 104(28):11856-11861.
[14] 謝素霞, 程琳, 曾威, 等. 茶樹HCT基因的克隆及表達[J].東北林業(yè)大學學報, 2013, 41(6):19-22, 37.
[15] 肖向文, 朱奇朗, 劉海峰, 等. 棉花莽草酸/奎寧酸羥基肉桂酰轉移酶基因(GhHCT)的克隆、生物信息學分析及表達特性[J]. 農(nóng)業(yè)生物技術學報, 2014, 22(5):572-579.
[16] 何柳, 徐曉蘭, 王振中, 等. 金銀花莽草酸/奎寧酸香豆酰轉移酶(LjHCT)基因克隆與序列分析[J]. 世界科學技術-中醫(yī)藥現(xiàn)代化, 2014, 16(2):263-268.
[17] 王雪霞, 曹方, 薛永常. 楊樹木質(zhì)素合成酶hct基因的克隆及核苷酸序列分析[J]. 遼寧林業(yè)科技, 2009, 6:4-7.
[18] 葛文雅, 惠偉, 閆洪波, 等. 鴨梨PbHCT3基因的克隆及表達分析[J]. 西北植物學報, 2012, 32(5):871-875.
[19] 劉偉, 李高, 楊杞, 等. 檸條錦雞兒HCT基因克隆及序列分析[J]. 內(nèi)蒙古農(nóng)業(yè)大學學報, 2014, 35(1):77-82.
(責任編輯 狄艷紅)
Cloning and Bioinformatics Analysis of Gene GbHCT from Gossypium barbadense
CUI Xue1JIADELA·Tuliuhan1YU Yue-hua1CHEN Quan-jia1SHEN Li-jie1YE Jia-li1YANG Ju-li1TAO Shun1NI Zhi-yong1,2
(1. College of Agronomy,Xinjiang Agricultural University,Key Laboratory of Agricultural Biological Technology,Xinjiang Agricultural University,Urumqi 830052;2. Institute of Cotton Research,Chinese Academy of Agricultural Sciences,State Key Laboratory of Cotton Biology,Anyang 45500)
This study is to isolate full-length cDNA of a key enzyme gene GbHCT related to lignin metabolism in cotton(Gossypium barbadense L.),and analyze the expression of GbHCT in the different developing stages of cotton’s fiber. The primers were designed according to the HCT sequence in transcriptome data of sea island cotton,then the gene was cloned using RT-PCR,and the cDNA sequence and the amino acid sequence of GbHCT were analyzed by bioinformatics methods. The expressions of gene GbHCT in developing fibers of cotton were analyzed from the transcriptome data of sea island cotton. A gene encoding HCT,designated as GbHCT,was isolated from G. barbadense. The full-length of the GbHCT consisted of a 1,311 bp open reading frame(ORF)encoding 436 amino acids. The molecular weight of protein was 48.58 kD,with an isoelectric point(pI)of 6.03. The deduced amino acid sequence of the GbHCT had two conservative motifs HTLGD and DFGWG. The deduced amino acid sequence had a high homology with HCT from Gossypium hirsutum,Gossypium arboretum and Gossypium raimondii,however,it showed 55.7%-60.7% identities with HCTs of other plants. Analyzing the transcriptome data of sea island cotton revealed that gene GbHCT was expressed in all different development stages of fiber,and the peak of expression reached in 5 days post anthers(DPA)fiber cells,suggesting that this gene may be involved in fiber development.
Gossypium barbadense L.;HCT;gene cloning;bioinformatics
10.13560/j.cnki.biotech.bull.1985.2016.04.010
2015-07-18
棉花生物學國家重點實驗室開放課題基金資助項目(CB2015A26),國家自然基金項目(31360264),國家大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(201510758001),新疆維吾爾自治區(qū)自然科學基金資助項目(2014211A025;2013211B19),新疆維吾爾自治區(qū)高技術研究發(fā)展計劃(201411103),中國博士后科學基金(2015M582741),新疆維吾爾自治區(qū)優(yōu)秀博士后普通資助
崔雪,女,研究方向:生物技術;E-mail:1067526924@qq.com
倪志勇,男,博士,副教授,研究方向:棉花纖維品質(zhì)改良研究;E-mail:nizhiyong@126.com