曹 丹,金孝芳*,馬林龍,劉艷麗,郭桂義
(1.湖北省農(nóng)業(yè)科學(xué)院果樹茶葉研究所,湖北 武漢 430064;2.信陽農(nóng)林學(xué)院/河南省豫南茶樹資源綜合開發(fā)重點(diǎn)實(shí)驗(yàn)室,河南 信陽 464000)
【研究意義】硒是人和動(dòng)物必需的微量元素之一,過量或不足對(duì)機(jī)體都有不可忽視的影響[1]。通過調(diào)查發(fā)現(xiàn)我國(guó)有近66.7 %的人口不同程度缺硒[2],因其有益與有害的閾值較低,故開發(fā)安全有效的硒資源非常有必要。茶是一種非常流行的飲品,茶樹的富硒能力較強(qiáng),但是其硒含量因品種、部位和生長(zhǎng)環(huán)境的不同而表現(xiàn)出較大的差異[3],茶樹硒累積的分子機(jī)理至今尚并不明確。bHLH轉(zhuǎn)錄因子參與植物多種生物學(xué)過程,對(duì)茶樹bHLH基因進(jìn)行生物信息學(xué)分析,有助于理解其在茶樹硒吸收轉(zhuǎn)運(yùn)過程中的生物學(xué)功能,進(jìn)一步對(duì)利用生物技術(shù)手段調(diào)控茶葉硒含量以及茶樹新品種的培育都具有非常重要的作用?!厩叭搜芯窟M(jìn)展】轉(zhuǎn)錄因子bHLH(basic helic-loop-helic,bHLH)廣泛存在于真核生物中[4],是植物體內(nèi)第二大家族轉(zhuǎn)錄因子。bHLH結(jié)構(gòu)域約含60個(gè)氨基酸,由2個(gè)功能不同的區(qū)域組成,一個(gè)是能與DNA結(jié)合的堿性區(qū)域[5],另一個(gè)是α螺旋-環(huán)-α螺旋結(jié)構(gòu),其中的α螺旋親水又親脂,被不同長(zhǎng)度的連接區(qū)分開[6]。bHLH轉(zhuǎn)錄因子內(nèi)部或者轉(zhuǎn)錄因子之間的2個(gè)α螺旋可以相互作用,形成同源或者異源二聚體,并與靶基因啟動(dòng)子區(qū)域的順式作用元件結(jié)合,對(duì)下游基因發(fā)揮調(diào)控作用[7]。目前,通過對(duì)一些重要物種的研究發(fā)現(xiàn),擬南芥(ArabidopsisthalianaL.)、煙草(NicotianatabacumL.)、水稻(OryzasativaL.)、葡萄(VitisvinferaL.)、玉米(Zeamays)、楊樹(Populustrichocarpa)等中分別含有164、190、180、191、276、183個(gè)bHLH轉(zhuǎn)錄因子[8-10]。在植物中該類轉(zhuǎn)錄因子主要參與了與種子萌發(fā)[11-12]、雄性不育[13]、分枝發(fā)育[14]、離子轉(zhuǎn)運(yùn)[15]、激素應(yīng)答[16-17]、逆境脅迫[18-19]等過程。茶樹bHLH轉(zhuǎn)錄因子的研究也有一些進(jìn)展,如CsbHLH2從抗逆性較強(qiáng)的品種‘陜茶一號(hào)’中被成功克隆出來[20],趙磊等[21]發(fā)現(xiàn)CsbHLH2和CsbHLH24與茶樹類黃酮合成相關(guān),然而通過對(duì)bHLH的進(jìn)化樹分析發(fā)現(xiàn),在功能已知的第IIIf亞組中,沒有茶樹基因組中的bHLH轉(zhuǎn)錄因子,認(rèn)為更多的茶樹bHLH需要進(jìn)一步挖掘;孫彬妹等[22]克隆了2個(gè)與擬南芥高度同源bHLH轉(zhuǎn)錄因子GL3和EGL3,分析發(fā)現(xiàn)其參與調(diào)控了花青素的合成。迄今為止,bHLH轉(zhuǎn)錄因子在茶樹硒富集過程中的作用少有報(bào)道。【本研究切入點(diǎn)】本研究團(tuán)隊(duì)對(duì)茶樹品種進(jìn)行了轉(zhuǎn)錄組測(cè)序,通過分析篩選出一個(gè)表達(dá)豐度較高、差異倍數(shù)較大的bHLH轉(zhuǎn)錄因子(Unigene0020663),結(jié)合基因功能注釋,將其命名為CsbHLH62,通過對(duì)其進(jìn)行生物信息學(xué)分析,探討其生物學(xué)功能?!緮M解決的問題】旨在為進(jìn)一步驗(yàn)證該基因功能奠定基礎(chǔ)。
1年生茶苗(鄂茶1號(hào))于2016年夏季在湖北省農(nóng)業(yè)科學(xué)院果樹茶葉研究所溫室大棚進(jìn)行水培培養(yǎng)(處理?xiàng)l件為內(nèi)部資料,未發(fā)表),分別對(duì)茶樹的根部及葉片進(jìn)行轉(zhuǎn)錄組測(cè)序,由廣州基迪奧生物科技有限公司完成。
CsbHLH62基因的開放閱讀框采用NCBI中的ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)預(yù)測(cè),功能結(jié)構(gòu)利用ScanProsite程序(http://www.expasy.org/tools/scanprosite/)分析,編碼產(chǎn)物理化性質(zhì)采用ProtParam程序(https://expasy.org/tools/protparam.html)分析,信號(hào)肽分析、跨膜結(jié)構(gòu)域與亞細(xì)胞定位分別由在線軟件SignalP4.1(http://www.cbs.dtu.dk/services/SignalP/)、TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)和Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)預(yù)測(cè),磷酸位點(diǎn)預(yù)測(cè)利用在線軟件NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)進(jìn)行,二級(jí)、三級(jí)結(jié)構(gòu)分別由在線程序SMOPA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)預(yù)測(cè),采用軟件DNAman和MEGA6進(jìn)行多序列比對(duì)和同源性分析。
該基因全長(zhǎng)933 bp,共編碼277個(gè)氨基酸,開放閱讀框(ORF)長(zhǎng)831 bp,5’非編碼區(qū)(5’UTR)長(zhǎng)102 bp。
利用在線程序ProtParam分析蛋白質(zhì)的理化性質(zhì),得到該基因編碼蛋白的化學(xué)方程式為C1318H2122N390O438S9,預(yù)測(cè)分子量30728.24 kD,共包括4277個(gè)原子,理論等電點(diǎn)7.73,脂肪系數(shù)62.64,不穩(wěn)定系數(shù)36.46(不穩(wěn)定指數(shù)大于40時(shí),表示不穩(wěn)定),表明該蛋白穩(wěn)定。
該基因編碼276個(gè)氨基酸,組成中最多的氨基酸是絲氨酸(Ser),所占比例為11.6 %,其次是亮氨酸(Leu)和賴氨酸(Lys),均占7.6 %(圖1)。另外,負(fù)電荷殘基總數(shù)(Asp+Glu)是36,正電荷殘基總數(shù)(Arg + Lys)是37。
利用Protscale程序預(yù)測(cè)CsbHLH62編碼產(chǎn)物的疏水性/親水性(圖2),分析氨基酸殘基的分值發(fā)現(xiàn),多肽鏈的第191位具有最高的分值1.422,疏水性最強(qiáng);第104和106位具有最低的分值-2.933,親水性最強(qiáng),總平均親水性(Grand average of hydropathicity )為-0.851,整條多肽鏈表現(xiàn)為親水性,故推測(cè)該蛋白是一種可溶性蛋白這有利于其發(fā)揮轉(zhuǎn)錄因子的功能。
利用軟件SignalP4.1進(jìn)行信號(hào)肽(Signal peptide)分析,結(jié)果如圖3所示。C-score是原始信號(hào)肽裂解位點(diǎn)的分值,數(shù)值越大表明該點(diǎn)出現(xiàn)裂解位點(diǎn)的概率就越大;S-score是信號(hào)肽分值,數(shù)值越大表明該氨基酸位于信號(hào)肽區(qū)域的可能性就越大,數(shù)值越低表示該氨基酸不含信號(hào)肽或者位于成熟蛋白部分;Y-score是基于C值和S值的斜率得出的幾何平均數(shù),是最大可能的信號(hào)肽裂解位點(diǎn);D-score是S均值和Y最大值的加權(quán)平均值,用于區(qū)分信號(hào)肽和非信號(hào)肽[23]。C、S、Y的最大值值分別是0.109、0.116、0.105,S-mean和D值分別是0.097、0.101,另外Signal peptide結(jié)果顯示為No,表明CsbHLH62編碼的蛋白不存在信號(hào)肽,是一種非分泌蛋白。
圖1 氨基酸含量分布Fig.1 Distribution of amino acid content
通過TMHMM分析CsbHLH62蛋白質(zhì)的跨膜結(jié)構(gòu),結(jié)果如圖4所示,CsHLH62編碼的1~277位氨基酸都位于細(xì)胞膜表面,另外,蛋白N端位于膜內(nèi)的可能性為0.01881,非跨膜螺旋區(qū)預(yù)測(cè)值是0,該值大于18表示預(yù)測(cè)蛋白是跨膜蛋白[23],綜合分析表明CsbHLH62基因編碼產(chǎn)物不是跨膜蛋白質(zhì),在細(xì)胞中處于游離狀態(tài)。采用Cell-PLoc 2.0[24]程序進(jìn)行亞細(xì)胞定位分析,結(jié)果表明該基因編碼的蛋白定位于細(xì)胞核。
圖2 CsbHLH62編碼蛋白疏水性/親水性分析Fig.2 Hydrophilia/hydrophobicity analysis of CsbHLH62 encoding protein
圖3 CsbHLH62編碼產(chǎn)物信號(hào)肽預(yù)測(cè)Fig.3 Signal peptide prediction of CsbHLH62 encoding protein
利用NCBI上Blast在線工具,對(duì)CsbHLH62編碼蛋白進(jìn)行同源性檢索,發(fā)現(xiàn)其與胡桃(JuglansregiaXP_018844170.1)、綠豆(Vignaradiatavar.RadiataXP_014496615.1)、大豆(GlycinemaxXP_003532257.1)、桃(PrunuspersicaXP_007201182.1)、菜豆 (PhaseolusvulgarisXP_007140690.1)、短小蛇根草 (OphiorrhizapumilaBAU67840.1)、木豆(CajanuscajanXP_020234271.1)、歐洲越橘(VacciniumcorymbosumAOY34395.1)、棗(ZiziphusjujubaXP_015892293.1)的相似性在50 %~70 %,其中與歐洲越橘的序列同源性最高,相似性為68 %。通過對(duì)bHLH62編碼氨基酸序列進(jìn)行同源性分析(圖5),發(fā)現(xiàn)該基因在不同植物間結(jié)構(gòu)上保守性較強(qiáng)。
圖4 CsbHLH62編碼產(chǎn)物跨膜結(jié)構(gòu)域預(yù)測(cè)Fig.4 Transmembrance domain prediction of CsbHLH62 encoding protein
圖5 bHLH62同源基因氨基酸序列對(duì)比Fig.5 Homologous alignments of the bHLH62 genes
采用MEGA6.0鄰接法構(gòu)建系統(tǒng)進(jìn)化樹(圖6),結(jié)果表明CsbHLH62基因與歐洲越橘bHLH024親緣關(guān)系最近,推測(cè)與其具有相似的功能。
將CsbHLH62基因編碼序列輸入ScanProsite在線程序,進(jìn)行功能結(jié)構(gòu)域搜索,結(jié)果表明該基因編碼蛋白有1個(gè)Myc型的螺旋-環(huán)-螺旋(basic helix-loop-helix,bHLH)結(jié)構(gòu)域,該結(jié)構(gòu)域分布在第131~181位氨基酸之間。
數(shù)字表示支持率,分枝長(zhǎng)短代表親緣關(guān)系遠(yuǎn)近圖6 不同物種的bHLH62編碼產(chǎn)物的系統(tǒng)進(jìn)化樹Fig.6 Phylogenetic tree of bHLH62 genes in different plants
應(yīng)用NetPhos 3.1 Server在線軟件對(duì)CsbHLH62基因翻譯后磷酸化情況進(jìn)行分析,結(jié)果如圖所示,該基因編碼的蛋白可能發(fā)生磷酸化的位點(diǎn)有35個(gè),其中絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)可能發(fā)生磷酸化修飾的位點(diǎn)分別有24、10、1個(gè)(圖7~8)。
利用SMOPA程序預(yù)測(cè)CsbHLH62編碼產(chǎn)物的二級(jí)結(jié)構(gòu)。結(jié)果如圖9所示,134個(gè)氨基酸形成了無規(guī)則卷曲(Random coil),占整體的48.38 %;86個(gè)氨基酸組成α-螺旋(Alpha helia)結(jié)構(gòu),占整個(gè)二級(jí)結(jié)構(gòu)的31.05 %;延伸鏈(Extended strand)和β轉(zhuǎn)角(Beta turn)分別由35、22個(gè)氨基酸殘基構(gòu)成,在所占比例分別為12.64 %和7.94 %。以上結(jié)果表明無規(guī)則卷曲和α-螺旋是CsbHLH62編碼產(chǎn)物的主要結(jié)構(gòu)。
圖7 CsbHLH62編碼產(chǎn)物結(jié)構(gòu)域分析Fig.7 Domain analysis of CsbHLH62 encoding protein
圖8 CsbHLH62編碼產(chǎn)物磷酸位點(diǎn)分析Fig.8 Phosphorylation sites analysis of CsbHLH62 encoding protein
圖9 CsbHLH62編碼產(chǎn)物二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.9 Secondary structure prediction of CsbHLH62 encoding protein
圖10 CsbHLH62編碼產(chǎn)物三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.10 3D structure of prediction of CsbHLH62 encoding protein
將 CsbHLH62氨基酸序列提交至Phyre2中進(jìn)行預(yù)測(cè),得到了該基因編碼產(chǎn)物的三維模型(圖10)。
茶樹是一種重要的經(jīng)濟(jì)型作物,培育優(yōu)良茶樹品種對(duì)于茶產(chǎn)業(yè)的發(fā)展具有重要的意義。前期通過轉(zhuǎn)錄組測(cè)序發(fā)現(xiàn)一個(gè)在根部表達(dá)豐度較高的bHLH轉(zhuǎn)錄因子,該結(jié)果與黃芪響應(yīng)硒的研究相似[25],但其在硒吸收及累積過程中的生物學(xué)功能還不明確,本研究通過對(duì)其進(jìn)行生物信息學(xué)分析,為后續(xù)的研究做好準(zhǔn)備。
CsbHLH62基因編碼是一種可溶性蛋白,無信號(hào)肽,二級(jí)結(jié)構(gòu)主要由無規(guī)則卷曲和α-螺旋組成,這與在苦蕎、蘋果和丹參等物種中的bHLH轉(zhuǎn)錄因子的分析結(jié)果一致[26-28],該基因定位在細(xì)胞核中,這與在茶樹中另一bHLH轉(zhuǎn)錄因子的研究類似[20]。其中二級(jí)結(jié)構(gòu)中的無規(guī)則卷曲所占比例最大,前人認(rèn)為其可用于分子識(shí)別,在蛋白質(zhì)特性和功能中發(fā)揮關(guān)鍵作用[29];而對(duì)于該基因的三維結(jié)構(gòu),雖然SWISS-MODEL同源建模應(yīng)用較廣,但可能會(huì)出現(xiàn)目標(biāo)基因預(yù)測(cè)模型和模板不一致的情況,而Phyre2使用遠(yuǎn)程同源檢測(cè)的方法,較好地彌補(bǔ)了這一缺陷[30];此外,CsbHLH62因含有MYC型的bHLH結(jié)構(gòu)域而歸屬于bHLH類轉(zhuǎn)錄因子家族。以往研究發(fā)現(xiàn)MYC類轉(zhuǎn)錄因子是植物茉莉酸信號(hào)轉(zhuǎn)導(dǎo)途徑中的核心轉(zhuǎn)錄因子,在植物生長(zhǎng)發(fā)育、次級(jí)代謝和抵御反應(yīng)中具有重要的作用[31]。比如擬南芥中的MYC2與JA誘導(dǎo)的許多抗蟲基因正相關(guān),對(duì)提高其抵抗蟲害的能力中發(fā)揮重要作用[32]。在煙草中MYC類轉(zhuǎn)錄因子也參與了尼古丁的生物合成[33]。在本研究中,轉(zhuǎn)錄組分析發(fā)現(xiàn)茶樹受到硒的刺激后,茉莉酸類相關(guān)基因的表達(dá)發(fā)生顯著變化,根據(jù)bHLH轉(zhuǎn)錄因子的結(jié)構(gòu)特點(diǎn),猜測(cè)CsbHLH62是與茉莉酸類相關(guān)基因的DNA結(jié)合,進(jìn)而調(diào)控其下游的響應(yīng)基因,該結(jié)論尚需進(jìn)一步的試驗(yàn)驗(yàn)證。
本研究利用生物信息學(xué)手段獲得關(guān)于CsbHLH62基因及其編碼產(chǎn)物的預(yù)測(cè)結(jié)果,為進(jìn)一步對(duì)該基因的克隆、時(shí)空表達(dá)特征以及亞細(xì)胞定位和功能驗(yàn)證等奠定前期基礎(chǔ)。