劉 潮,韓利紅,王海波,唐利洲
(曲靖師范學(xué)院 云南高原生物資源保護(hù)與利用研究中心,生物資源與食品工程學(xué)院,云南省高校云貴高原動植物多樣性及生態(tài)適應(yīng)性進(jìn)化重點實驗室,云南曲靖 655011)
病程相關(guān)蛋白(Pathogenesis related protein,PR)是植物受病原物侵染或非生物因子刺激后產(chǎn)生的一類水溶性蛋白。目前,發(fā)現(xiàn)至少17個PR家族[1]。類甜蛋白(Thaumatin like protein,TLP)屬于PR5家族,因與熱帶植物西非竹竽(ThaumatococcusdanielliBenth.)果實中分離到的甜蛋白(Thaumatin)氨基酸序列有很高的同源性而得名,廣泛分布于多種植物、動物及微生物中[2-3]。典型的TLP由16個半胱氨酸殘基對形成8個二硫鍵,不僅穩(wěn)定了分子結(jié)構(gòu),也保證蛋白的正確折疊,能夠抵抗熱變性、酸、堿和蛋白酶降解作用[4-5]。大多數(shù)TLP均具有索瑪甜家族標(biāo)簽和5個保守的氨基酸殘基[6],后者參與蛋白維持適當(dāng)?shù)耐負(fù)浣Y(jié)構(gòu)和酸裂周圍的表面靜電勢,對TLPs抗真菌活性必不可少[7]。TLP家族蛋白進(jìn)化分析發(fā)現(xiàn),動物TLP單獨分在一支,并以單一祖先序列的形式來自于植物[3],陸生植物進(jìn)化過程中TLP基因含量和多樣性顯著增加[8],而水稻和擬南芥TLP分布于多個支系,并存在染色體內(nèi)和染色體間的復(fù)制[3]。單子葉和雙子葉植物進(jìn)化上發(fā)生分離后,TLP基因在進(jìn)化枝上發(fā)生不對稱的增加[3]。Liu等[9]認(rèn)為TLP基因來自于大約10億年前的植物、動物和真菌的共同祖先。在有些植物中,同一染色體上甚至同一位點存在TLP基因簇,說明串聯(lián)重復(fù)是TLP超家族不對稱擴(kuò)張的重要機(jī)制[9]。研究表明,TLP具有抗真菌活性[10-11]、葡聚糖酶活性[12]、致敏原活性[13]等,在植物的生長發(fā)育和抵御脅迫過程中發(fā)揮作用。
密碼子具有簡并性,在物種的穩(wěn)定上起著重要的作用。同義密碼子在不同物種不同基因間的使用頻率不同,特定物種或基因家族在長期進(jìn)化中形成了適應(yīng)自身基因組環(huán)境的密碼子使用偏性。研究表明,同義密碼子的選擇使用對基因的表達(dá)起著重要的調(diào)節(jié)作用,有利于翻譯的準(zhǔn)確性和效率[14]。密碼子偏性分析有助于預(yù)測基因的表達(dá)水平[15]、基因功能分析[16]、選擇基因異源表達(dá)最適宿主和優(yōu)化密碼子以提高異源表達(dá)水平等[17]。
谷子(Setariaitalica)為禾本科糧食作物,富含蛋白質(zhì)、脂肪和維生素,廣泛栽培于歐亞大陸的溫帶和熱帶地區(qū),其主產(chǎn)區(qū)多為干旱少雨地區(qū)[18],中國主要集中在黃河中上游地區(qū),是北方地區(qū)的主要糧食之一。栽培過程中,谷瘟病、干旱等生物和非生物脅迫是谷子高產(chǎn)的嚴(yán)重障礙,抗病和抗脅迫相關(guān)基因的研究將為谷子品種的選育提供借鑒。目前,谷子全基因組數(shù)據(jù)已公布[18],這為基因功能和進(jìn)化研究提供了條件。本試驗從蛋白氨基酸和基因的堿基組成出發(fā),對谷子TLP家族蛋白聚類關(guān)系、基因選擇性、編碼序列(Coding sequence,CDS)密碼子的組成及使用偏性進(jìn)行分析,旨在闡明TLP家族基因特征,為進(jìn)一步利用TLP家族基因培育優(yōu)良谷子品種奠定基礎(chǔ)。
以擬南芥TLP序列為探針,搜索谷子基因組數(shù)據(jù)庫(http:∥www.plantgdb.org/SiGDB/)和GenBank谷子蛋白數(shù)據(jù)庫,候選蛋白序列在SMART數(shù)據(jù)庫(http:∥smart.embl-heidelberg.de/)中對蛋白功能域進(jìn)行確認(rèn)。所有蛋白序列生理生化特征通過Expasy(http:∥www.expasy.org/tools/)預(yù)測。
谷子TLP對應(yīng)的基因序列和CDS序列從GenBank數(shù)據(jù)庫中下載。使用基因結(jié)構(gòu)顯示系統(tǒng)(http:∥gsds.cbi.pku.edu.cn/index.php)繪制基因結(jié)構(gòu)示意圖。
利用基因本體(Gene ontology)數(shù)據(jù)庫(http:∥amigo1.geneontology.org/cgi-bin/amigo/blast.cgi)查詢TLP功能分類。利用WEGO在線軟件(http:∥wego.genomics.org.cn/)對蛋白Gene ontology(GO)富集度進(jìn)行計算。應(yīng)用MEGA 5.0軟件,采用鄰接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)發(fā)育樹。NJ進(jìn)化樹分析步長值為1 000,采用泊松校驗(Poisson correction)的方法計算距離,其余參數(shù)取默認(rèn)值。
通過GenBank數(shù)據(jù)庫獲取谷子TLP基因轉(zhuǎn)錄起始位點上游1 kb序列,通過PlantCARE(http:∥bioinformatics.psb.ugent.be/webtools/plantcare/html/)數(shù)據(jù)庫進(jìn)行基因啟動子區(qū)順式作用元件分析。
使用軟件CodonW對谷子TLP基因CDS序列密碼子使用性參數(shù)進(jìn)行分析。參數(shù)包括:密碼子適應(yīng)指數(shù)(Codon adaptation index,CAI)、有效密碼子數(shù)(Effective number of codons,ENC)、密碼子的第3位的G+C含量(GC3s)。以GC3s為橫坐標(biāo),ENC為縱坐標(biāo),繪制ENC與GC3s的關(guān)聯(lián)分布圖[19]。圖中曲線為密碼子偏性僅受堿基突變影響時的ENC預(yù)期值的位置,計算公式為:ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。使用EMBOSS explorer網(wǎng)站(http:∥emboss.toulouse.inra.fr/)在線軟件對同義密碼子相對使用度(Relative synonymous codon usage,RSCU)進(jìn)行分析。根據(jù)ENC偏性對最優(yōu)密碼子(Optimal codon)進(jìn)行分析,選擇ENC值前后各10%作為低表達(dá)和高表達(dá)基因,分別計算2組基因中TLP基因密碼子的RSCU。當(dāng)△RSCU>0.3,且在高表達(dá)組中RSCU>1,在低表達(dá)組中RSCU<1,可確定該密碼子為最優(yōu)密碼子[20]。
以擬南芥TLP序列為探針,從谷子基因組數(shù)據(jù)庫中共搜索并鑒定到43個TLP家族成員(表1)。通過SMART在線數(shù)據(jù)庫對谷子TLP進(jìn)行結(jié)構(gòu)分析發(fā)現(xiàn),均含有典型索瑪甜(Thaumatin,THN)結(jié)構(gòu)域。谷子TLP基因在所有9條染色體上均有分布,其中Ⅸ和Ⅲ號染色體上基因成員較多(基因數(shù)均為9),其次為Ⅱ、Ⅰ和Ⅴ號染色體(基因數(shù)分別為7、5和5),Ⅳ、Ⅵ、Ⅶ和Ⅷ號染色體較少(基因數(shù)分別為2、3、1和2)。生理生化分析顯示,蛋白氨基酸數(shù)為160~666,其中氨基酸數(shù)較多的Si003953m和Si004228m均含有蛋白激酶功能域,可能在蛋白的磷酸化過程中發(fā)揮作用。蛋白等電點為4.42~9.17,其中酸性蛋白占76.7%。疏水性與蛋白結(jié)構(gòu)域形成和高級結(jié)構(gòu)的穩(wěn)定性有重要關(guān)系,谷子TLP中疏水性蛋白占60.5%,具有較強(qiáng)親水和疏水活性的蛋白均為酸性蛋白。
表1 谷子中TLP家族信息Table 1 Information of TLP family in foxtail millet
通過基因結(jié)構(gòu)顯示系統(tǒng)對谷子TLP基因結(jié)構(gòu)、內(nèi)含子組成與相位進(jìn)行分析(圖1)。43個谷子TLP基因分為3種結(jié)構(gòu)類型,其中含有1、2和3個外顯子的基因數(shù)目分別為16、12和15個。1-2型內(nèi)含子相位類型的基因數(shù)目最多(14個),其次為1型和2型相位類型(均為5個),同一聚類組中的多數(shù)基因外顯子數(shù)和內(nèi)含子相位類型一致(圖1)。
參考擬南芥和水稻等的研究[3,21]對谷子TLP家族進(jìn)行聚類分析。谷子TLP家族歸為12個聚類組,各聚類組中基因數(shù)不一致,聚類組5和6中基因數(shù)較多(分別為12和11),其他聚類組中基因數(shù)相對較少(圖1)。聚類組5中的基因Si023305m、Si023379m、Si024779m、Si023433m均來自Ⅲ號染色體,基因Si037366m、Si039423m來自Ⅸ號染色體并且均只有1個外顯子,聚類組6中的基因Si017836m、Si017932m、Si017852m、Si019513m、Si020024m均位于Ⅰ號染色體,并且其位置臨近,內(nèi)含子相位均為1-2型。
TLP進(jìn)化組編號參考Shatters等[3],Zhao等[21]Evolution group numbers according to the results of the evolutionary analysis Shatters,etal.[3],Zhao,etal[21]
圖1谷子TLP家族進(jìn)化及基因結(jié)構(gòu)
Fig.1EvolutionandgenestructureofTLPfamilyinfoxtailmillet
分析TLP的GO組成和功能分類,對了解其在植物生命進(jìn)程中的功能具有重要意義。在43條谷子TLPs中,發(fā)現(xiàn)12條不同的GO注釋子條目(圖2)。4類為細(xì)胞結(jié)構(gòu)組分,其中參與細(xì)胞(cell,GO:0005623)和細(xì)胞組分(cell part,GO:0044464)結(jié)構(gòu)組成的均占58.1%,參與胞外區(qū)作用的(extracellular region,GO:0005576)占86.0%,參與共質(zhì)體構(gòu)成的(symplast,GO:0055044)占16.3%。3類在分子功能中起作用,具有結(jié)合功能(binding,GO:0005488)和催化活性(catalytic activity,GO:0003824)的蛋白均占4.7%,分子轉(zhuǎn)導(dǎo)活性(molecular transducer activity,GO:0060089)的蛋白占2.3%。5類參與了生物學(xué)過程,其中參與胞內(nèi)進(jìn)程(cellular process,GO:0009987)和代謝進(jìn)程(metabolic process,GO:0008152)的只占4.7%,參與多器官進(jìn)程(multi-organism process,GO:0051704)和響應(yīng)應(yīng)激(response to stimulus,GO:0050896)的均占88.4%,參與免疫系統(tǒng)進(jìn)程(immune system process,GO:0002376)的占20.9%。
圖2 谷子TLP蛋白GO功能分類Fig.2 GO classification of TLP in foxtail millet
通過PLACE數(shù)據(jù)庫對谷子TLP基因上游1 kb啟動子區(qū)順式作用元件進(jìn)行分析(表2),發(fā)現(xiàn)所有基因啟動子區(qū)均含有多個TATA-box和CAAT-box,部分基因含有Py-rich;所有基因啟動子區(qū)均含有1個到多個激素響應(yīng)元件,包括脫落酸響應(yīng)元件ABRE,茉莉酸響應(yīng)元件CGTCA-motif,赤霉素響應(yīng)元件GARE-motif和P-box,水楊酸響應(yīng)元件TCA-element等;每個基因啟動子區(qū)均含有多個脅迫響應(yīng)元件,包括熱激響應(yīng)元件HSE,低溫反應(yīng)順式作用元件LTR,干旱響應(yīng)MYB結(jié)合位點MBS,防御和脅迫相關(guān)響應(yīng)元件TC-rich,受傷和真菌激發(fā)子響應(yīng)元件W-box?;蚝械募に鼗蛎{迫響應(yīng)元件數(shù)量和類型不同,可能是不同的基因在不同的信號通路中發(fā)揮作用,也說明該家族基因功能的多樣性和復(fù)雜性。
利用CodonW軟件和EMBOSS explorer數(shù)據(jù)庫對基因密碼子使用偏性進(jìn)行分析(表3),發(fā)現(xiàn)谷子TLP基因的CAI值平均為0.282,60.5%的基因ENC值為28.12~35.00,ENC值反映基因編碼對密碼子選擇性強(qiáng)弱,一般ENC值低于35表示基因表達(dá)對密碼子的使用偏性較強(qiáng)。93.0%的基因GC3s為0.834~0.973,分布較集中,GC3s分布反映了植物所受的選擇壓力,GC3s分布范圍越小,表明密碼子使用偏性受自然選擇壓力影響越大[22]。以上結(jié)果表明,谷子TLP家族基因密碼子使用偏性較強(qiáng),多數(shù)基因具有較高的表達(dá)潛力,基因在進(jìn)化過程中主要受到自然選擇壓力影響。
ENC與GC3s關(guān)聯(lián)分析顯示,谷子TLP基因分布在標(biāo)準(zhǔn)曲線下方,多數(shù)ENC較小,ENC和GC3s分布相對集中(圖3),說明不同的基因密碼子偏性較強(qiáng),多數(shù)基因進(jìn)化過程中主要受到自然選擇壓力影響。
谷子TLP基因密碼子RSCU分析顯示(表4),RSCU>1的密碼子均以G或C結(jié)尾,發(fā)現(xiàn)10個最優(yōu)密碼子,△RSCU>1的分別為編碼丙氨酸(Ala,GCG)、谷氨酸(Glu,GAG)、異亮氨酸(Leu,CTG)、脯胺酸(Pro,CCG)、精氨酸(Arg,CGC)、蘇氨酸(Thr,ACG)(表4),表明谷子TLP家族基因偏好使用G或C結(jié)尾的密碼子。
表2 谷子TLP基因啟動子區(qū)順式作用元件信息Table 2 Information about putative cis-acting elements in the 1 kb upstream promoter region of TLP genes in foxtail millet
注:TATA-box轉(zhuǎn)錄起始區(qū)-30 bp核心啟動子元件; Py-rich高轉(zhuǎn)錄水平相關(guān)順式作用元件;CAAT-box啟動增強(qiáng)元件;ABRE脫落酸響應(yīng)元件;CGTCA-motif茉莉酸響應(yīng)元件;GARE-motif赤霉素響應(yīng)元件;P-box赤霉素響應(yīng)元件;TCA-element水楊酸響應(yīng)元件;HSE熱激響應(yīng)元件;LTR參與低溫反應(yīng)的順式作用元件;MBS干旱響應(yīng)MYB結(jié)合位點;TC-rich防御和脅迫相關(guān)響應(yīng)元件;W-box受傷和真菌激發(fā)子響應(yīng)元件。
Note:TATA-box core promoter element around -30 of transcription start;Py-rich cis-acting element conferring high transcription levels;CAAT-box common cis-acting element in promoter and enhancer regions;ABRE cis-acting element involved in the abscisic acid responsiveness;CGTCA-motif cis-acting regulatory element involved in the MeJA-responsiveness;GARE-motif gibberellin-responsive element;P-box gibberellin-responsive element;TCA-element cis-acting element involved in salicylic acid responsiveness;HSE cis-acting element involved in heat stress responsiveness;LTR cis-acting element involved in low-temperature responsiveness;MBS MYB binding site involved in drought-inducibility;TC-rich cis-acting element involved in defense and stress responsiveness;W-box fungal elicitor responsive element.
表3 谷子TLP家族基因密碼子使用特性Table 3 Characterization of codon usage of TLP genes in foxtail millet
圖3 谷子TLP家族基因ENC與GC3s的關(guān)系Fig.3 Correlative analysis of ENC and GC3s of TLP genes in foxtail millet
谷子是目前種植第二廣泛的粟類作物,屬于典型的C4植物,比C3植物具有更高的水分利用效率和光合效率,特別能適應(yīng)干旱環(huán)境條件,是非生物脅迫抗性,特別是抗旱研究的模式植物[23]。Zhang等[18]研究發(fā)現(xiàn),谷子在進(jìn)化過程中發(fā)生了3次染色體重組事件,其中2次發(fā)生在谷子從水稻分化之后,1次發(fā)生在谷子從高粱分化之后。這些事件導(dǎo)致部分基因家族大量擴(kuò)張,并為谷子具有強(qiáng)的抗旱能力奠定了基礎(chǔ)。TLP屬于多基因家族,不同物種基因組中TLP數(shù)量有很大差異,胡蘿卜(Daucuscarota)、黃瓜(Cucumissativus)等蔬菜中大約30個,水稻(Oryzasativa)、高粱(Sorghumbicolor)等作物中50~60個,火炬松(Pinustaeda)中大于80個[24]。研究表明,植物TLP家族蛋白在植物的生長發(fā)育和抵御脅迫過程中發(fā)揮作用[6-7]。
本研究通過生物信息學(xué)方法從谷子基因組中共發(fā)現(xiàn)43個TLP基因,多數(shù)為酸性蛋白。有3種基因結(jié)構(gòu)類型,其中僅有1個外顯子的基因有16個,1-2型內(nèi)含子相位的基因有14個,主要來自聚類組5和6中。這些基因多數(shù)位于同一染色體上,說明這些基因可能來源于同一祖先基因,是染色體內(nèi)和染色體間復(fù)制的結(jié)果。蛋白GO分類分析顯示86.0%的蛋白參與胞外作用,88.4%的蛋白參與多器官發(fā)育進(jìn)程和響應(yīng)應(yīng)激反應(yīng),說明該家族蛋白在信號肽的引導(dǎo)下在胞外空間參與器官發(fā)育和應(yīng)對脅迫等進(jìn)程,在植物的生長發(fā)育和抵御環(huán)境脅迫過程中發(fā)揮重要作用。啟動子是基因表達(dá)調(diào)控的重要元件,通過分析和預(yù)測啟動子區(qū)順式作用元件可以為基因表達(dá)和功能研究奠定基礎(chǔ)。谷子TLP家族啟動子區(qū)富含植物激素和病原響應(yīng)元件,表明這些基因參與植物多種生命進(jìn)程。
表4 谷子TLP基因同義密碼子使用情況Table 4 Usage of synonymous codon of TLP genes in foxtail millet
注:最優(yōu)密碼子標(biāo)注如下*.△RSCU>0.3;** △RSCU>0.6;*** △RSCU>1。
Note:Optimal codon marked as * △RSCU>0.3;** △RSCU>0.6;*** △RSCU>1.
在進(jìn)化過程中,植物基因組密碼子偏性主要受堿基突變和自然選擇壓力的影響,不同物種以及同一物種的不同基因受到的兩種壓力強(qiáng)度也不同。密碼子偏性與物種進(jìn)化和生存環(huán)境有關(guān),密碼子偏性越強(qiáng),基因在進(jìn)化過程中受到的選擇壓力越強(qiáng)。谷子TLP家族多數(shù)基因ENC低于35,GC3s分布集中,表明基因密碼子偏性強(qiáng),基因具有較高的表達(dá)潛力,進(jìn)化過程中主要受自然選擇壓力影響。單子葉植物植物偏好G或C結(jié)尾的密碼子[25]?;騌SCU>1的密碼子均為G或C結(jié)尾,10個最優(yōu)密碼子,其中7個以G結(jié)尾,3個以C結(jié)尾,表明谷子偏好使用G或C結(jié)尾的密碼子,與玉米[25]、水稻和高粱[26]等密碼子使用偏性一致。物種受到正向選擇時會形成大量最優(yōu)密碼子[27],進(jìn)一步說明谷子TLP基因在進(jìn)化過程中受到較強(qiáng)的正向選擇。進(jìn)行基因工程操作時,基因表達(dá)往往受到宿主密碼子偏性影響,通過修改外源基因密碼子,使之與宿主密碼子偏性一致,可實現(xiàn)外源基因的高效表達(dá)[17,28]。本研究為谷子TLP基因的開發(fā)利用和轉(zhuǎn)基因研究提供了借鑒。
Reference:
[1] VAN LOON L C,REP M,PIETERSE C M.Significance of inducible defense-related proteins in infected plants[J].AnnualReviewofPhytopathology,2006,44:135-162.
[2] ABAD L R,D'URZO M P,LIU D,etal.Antifungal activity of tobacco osmotin has specificity and involves plasma membrane permeabilization[J].PlantScience,1996,118(1):11-23.
[3] SHATTERS RG,BOYKIN L M,LAPOINTE S L,etal.Phylogenetic and structural relationships of thePR5 gene family reveal an ancient multigene family conserved in plants and select animal taxa[J].JournalofMolecularEvolution,2006,63(1):12-29.
[4] SMOLE U,BUBLIN M,RADAUER C,etal.Mal d 2,the thaumatin-like allergen from apple,is highly resistant to gastrointestinal digestion and thermal processing[J].InternationalArchivesofAllergyandImmunology,2008,147(4):289-298.
[5] FIERENS E,ROMBOUTS S,GEBRUERS K,etal.TLXI,a novel type of xylanase inhibitor from wheat (Triticumaestivum) belonging to the thaumatin family[J].BiochemicalJournal,2007,403(3):583-591.
[6] JAMI S K, ANURADHA T S,GURUPRASAD L,etal.Molecular,biochemical and structural characterization of os-motin-like protein from black nightshade (Solanumnigrum)[J].JournalofPlantPhysiology,2007,164(3),238-252.
[7] LIU D,HE X,LI W,etal.Molecular cloning of a thaumatin-like protein gene fromPyruspyrifoliaand overexpression of this gene in tobacco increased resistance to pathogenic fungi[J].PlantCell,TissueandOrganCulture(PCTOC),2012,111(1):29-39.
[8] PETRE B,MAJOR I,ROUHIER N,etal.Genome-wide analysis of eukaryote thaumatin-like proteins (PR5s) with an emphasis on poplar[J].PlantBiology,2011,11(1):33.
[9] LIU J J,STURROCK R,EKRAMODDOULLAH A K M.The superfamily of thaumatin-like proteins:its origin,evolution,and expression towards biological function[J].PlantCellReports,2010,29(5):419-436.
[10] RAMOS M V,DE OLIVEIRA R S B,PEREIRA H M,etal.Crystal structure of an antifungal osmotin-like protein fromCalotropisproceraand its effects onFusariumsolanispores,as revealed by atomic force microscopy:insights into the mechanism of action[J].Phytochemistry,2015,119:5-18.
[11] LIU C,CHENG F,SUN Y,etal.Structure-function relationship of a novel PR-5 protein with antimicrobial activity from soy hulls[J].JournalofAgriculturalandFoodChemistry,2016,64(4):948-959.
[12] VAN DAMME E J,CHARELS D,MENU-BOUAOU ICHE L,etal.Biochemical,molecular and structural analysis of multiple thaumatin-like proteins from the elderberry tree (SambucusnigraL.)[J].Planta,2002,214(6):853-862.
[13] BREITENEDER H.Thaumatin-like proteins-a new family of pollen and fruit allergens[J].Allergy,2004,59(5):479-481.
[14] CARLINI D B,CHEN Y,STEPHAN W.The relationship between third-codon position nucleotide content,codon bias,mRNA secondary structure and gene expression in the drosophilid alcohol dehydrogenase genes Adh and Adhr[J].Genetics,2001,159(2):623-633.
[15] PEK H B,KLEMENT M,ANG K S,etal.Exploring codon context bias for synthetic gene design of a thermostable invertase inEscherichiacoli[J].EnzymeandMicrobialTechnology,2015,75:57-63.
[16] PAN L L,WANG Y,HU J H,etal.Analysis of codon use features of stearoyl-acyl carrier protein desaturase gene inCamelliasinensis[J].JournalofTheoreticalBiology,2013,334:80-86.
[17] ZHOU M,WANG T,FU J,etal.Nonoptimal codon usage influences protein structure in intrinsically disordered regions[J].MolecularMicrobiology,2015,97(5):974-987.
[18] ZHANG G,LIU X,QUAN Z,etal.Genome sequence of foxtail millet (Setariaitalica) provides insights into grass evolution and biofuel potential[J].NatureBiotechnology,2012,30(6):549-554.
[19] WRIGHT F.The ‘effective number of codons’ used in a gene[J].Gene,1990,87(1):23-29.
[20] DURET L,MOUCHIROUD D.Expression pattern and,surprisingly,gene length shape codon usage inCaenorhabditis,Drosophila, andArabidopsis[J].ProceedingsoftheNationalAcademyofSciences,1999,96(8):4482-4487.
[21] ZHAO J P,SU X H.Patterns of molecular evolution and predicted function in thaumatin-like proteins ofPopulustrichocarpa[J].Planta,2010,232(4):949-962.
[22] KAWABE A,MIYASHITA N T.Patterns of codon usage bias in three dicot and four monocot plant species[J].Genes&GeneticSystems,2003,78(5):343-352.
[23] LI P,BRUTNELL T P.Setaria viridis andSetariaitalica,model genetic systems for the Panicoid grasses[J].JournalofExperimentalBotany,2011,62(9),3031-3037.
[24] 劉 潮,韓利紅,王海波,等.胡蘿卜類甜蛋白家族鑒定與生物信息學(xué)分析[J].中國蔬菜,2017(2):38-44.
LIU CH,HAN L H,WANG H B,etal.Identification and bioinformatics analysis of thaumatin-like protein family inDaucuscarota[J].ChinaVegetables,2017(2):38-44.
[25] LIU H,HE R,ZHANG H,etal.Analysis of synonymous codon usage inZeamays[J].MolecularBiologyReports,2010,37(2):677.
[26] TATARINOVA T V,ALEXANDROV N N,BOUCK J B,etal.GC 3 biology in corn,rice,sorghum and other grasses[J].BMCGenomics,2010,11(1):308.
[27] HERSHBERG R,PETROV D A.Selection on codon bias[J].AnnualReviewofGenetics,2008,42:287-299.
[28] ZELASKO S,PALARIA A,DAS A.Optimizations to achieve high-level expression of cytochrome P450 proteins usingEscherichiacoliexpression systems[J].ProteinExpressionandPurification,2013,92(1):77-87.