李 翔 范作義 王井源 王 淇 李喜鵬 王德秋孔令遠(yuǎn) 曹森林 孟慶剛 趙曦陽(yáng)*
(1.林木遺傳育種國(guó)家重點(diǎn)實(shí)驗(yàn)室,東北林業(yè)大學(xué)林學(xué)院,哈爾濱 150040; 2.吉林省臨江林業(yè)局,臨江 134600)
在生物體內(nèi),三聯(lián)體密碼子是由信使RNA分子中四個(gè)堿基組成3個(gè)核苷酸形成的,編碼一個(gè)特定的氨基酸,進(jìn)行遺傳信息的傳遞。一般地,密碼子存在簡(jiǎn)并性,即每個(gè)特定的氨基酸可對(duì)應(yīng)1~6種密碼子[1]。在生物的長(zhǎng)期進(jìn)化過(guò)程中,由于受到自然選擇壓力、變異和突變的影響,不同生物體在編碼氨基酸時(shí)并不是完全隨機(jī)選擇密碼子,而是對(duì)某些特定的同義密碼子存在一定的使用偏好性,即存在密碼子使用偏好性現(xiàn)象(codon bias),該現(xiàn)象在自然界中普遍存在。目前,在細(xì)菌、哺乳動(dòng)物和植物等多個(gè)物種中,均觀察到明顯的密碼子使用偏好性現(xiàn)象[2]。密碼子偏好性不但可以影響蛋白質(zhì)翻譯的速度和折疊,還可以影響mRNA水平的轉(zhuǎn)錄調(diào)控及外源基因的表達(dá)量[3~4]。前人研究發(fā)現(xiàn),在大量組織中普遍表達(dá)且表達(dá)水平相對(duì)恒定的基因的表達(dá)量與密碼子使用偏好性存在較強(qiáng)的相關(guān)性,這些基因受到了明顯的翻譯選擇作用[5]。另外,不同物種、不同生物體的基因、基因家族或基因組密碼子在使用上存在很大的差異,對(duì)功能基因的翻譯調(diào)控產(chǎn)生重要的影響[6~7],進(jìn)而會(huì)影響基因的功能。即使在一個(gè)基因內(nèi),密碼子的使用偏好性也會(huì)有很大的差異。因此,分析同義密碼子的使用偏好性將有助于揭示物種的起源和分子進(jìn)化規(guī)律,提高翻譯的準(zhǔn)確性和效率,為研究生物體進(jìn)化、基因功能、蛋白質(zhì)結(jié)構(gòu),提高外源基因的表達(dá)量提供了重要信息,同時(shí),可利用編碼區(qū)和非編碼區(qū)的基因組特征差異進(jìn)行全基因組掃描,發(fā)現(xiàn)新基因,對(duì)研究基因功能和蛋白質(zhì)功能具有重要的參考價(jià)值[8]。
目前,關(guān)于密碼子使用偏好性的研究表明,密碼子偏好性是通過(guò)選擇、突變和遺傳漂變之間的平衡來(lái)維持的。密碼子偏好性可能與3個(gè)原因有關(guān),一是避免轉(zhuǎn)錄終止,影響基因表達(dá),二是密碼子與反密碼子的相互作用強(qiáng)度適中,有利于蛋白質(zhì)生物合成的迅速進(jìn)行,三是密碼子偏好性可提高翻譯效率,增加細(xì)胞內(nèi)tRNA的含量。此外,密碼子偏好性受其他因素影響,如基因的堿基組成、GC含量、基因長(zhǎng)度、表達(dá)水平、蛋白質(zhì)親水性、蛋白質(zhì)二級(jí)結(jié)構(gòu)、表達(dá)水平等[9]。近年來(lái),隨著高通量測(cè)序技術(shù)的快速發(fā)展,多個(gè)物種基因組測(cè)序已經(jīng)完成,將有助于在全基因組水平上揭示密碼子使用偏好性。目前,已在多個(gè)模式生物和非模式生物中對(duì)單基因或基因組密碼子使用偏好性進(jìn)行了深入的研究,如毛果楊(Populustrichocarpa)[10]水稻(Oryzasativa)[11]和蘋果(Malusdomestica)[12]等。而紅松(Pinuskoraiensis)基因組測(cè)序尚未完成,相關(guān)分子研究基礎(chǔ)較為薄弱,在紅松中還未見(jiàn)對(duì)單基因進(jìn)行密碼子偏好性分析的報(bào)道。
紅松為松科(Pinaceae)松屬(PinusLinn.)常綠針葉樹(shù),是我國(guó)東北地區(qū)珍貴的用材樹(shù)種和經(jīng)濟(jì)林樹(shù)種,具有重要的經(jīng)濟(jì)價(jià)值和生態(tài)價(jià)值[13~14]。其材質(zhì)輕軟、耐腐蝕性強(qiáng),樹(shù)皮富含松多酚,具有極高的開(kāi)發(fā)價(jià)值。多酚是一種廣泛存在于植物的根、葉、皮等器官中的一種次生代謝化合物,具有多種生理功能,可降低血脂,減緩衰老,現(xiàn)已在材料、食品等多個(gè)領(lǐng)域被廣泛應(yīng)用。松多酚是松科植物中特有的多酚類化合物,其含量豐富,具有抗炎鎮(zhèn)痛、降血壓等功效,科研工作者對(duì)松多酚開(kāi)展了大量的研究[15]。研究發(fā)現(xiàn),松多酚中含有類黃酮和花色素,使植物的花、果實(shí)等器官呈現(xiàn)不同的顏色[16]。關(guān)于松多酚的分子研究較為廣泛,松多酚合成過(guò)程中相關(guān)功能基因很多,主要包括查爾酮合成酶(CHS)、黃酮醇合成酶(FLS)和查爾酮異構(gòu)酶(CHI)等。其中,查爾酮合成酶(CHS)是植物中黃酮、花色素和異黃酮等化合物合成的關(guān)鍵酶之一,在多酚合成過(guò)程中發(fā)揮著重要的作用,可影響植物的花色及防御反應(yīng)[17]。查爾酮合成酶基因CHS于1983年首次在荷蘭芹(Petroselinumcrispum)[18]中發(fā)現(xiàn),現(xiàn)已在多個(gè)植物中克隆得到了CHS基因,如甘薯(Pomoeabatatas)[19]、桂花(Osmanthusfragrans)[20]和樟子松(Pinussylvestris)[21]和擬南芥(Arabidopsisthaliana)[22]等。而關(guān)于CHS基因密碼子偏好性的研究較少,僅有部分植物研究中有報(bào)道。前人研究發(fā)現(xiàn),不同植物中的CHS密碼子偏好性存在一定差異,如蓼科大黃屬物種[23]和獼猴桃中CHS基因[8]最優(yōu)密碼子偏愛(ài)以G/C結(jié)尾,而豆科植物CHS基因[24]對(duì)A或U結(jié)尾的密碼子偏好性較強(qiáng)。目前,關(guān)于紅松CHS基因方面的報(bào)道較少[25~26],相關(guān)功能還不清楚,開(kāi)展CHS密碼子偏好性分析將有助于研究該基因的遺傳特征和分子機(jī)理,進(jìn)而為有效利用松多酚資源奠定一定的基礎(chǔ)。筆者從GenBank中獲得紅松查爾酮合成酶基因CHS序列,采用EMBOSS在線程序、MEGA7.0軟件[27]和CodonW分析其密碼子偏好性,運(yùn)用R語(yǔ)言軟件(version 3.5.0)[28]和SPSS(version 23.0)軟件[29]統(tǒng)計(jì)密碼子偏好性參數(shù),為CHS基因功能和分子進(jìn)化的深入研究提供理論依據(jù)。此外,將CHS的密碼子偏好性與大腸桿菌、酵母、煙草和擬南芥的基因組密碼子進(jìn)行比較,以期為篩選該基因的理想表達(dá)系統(tǒng)奠定基礎(chǔ)。
本研究采用的紅松查爾酮合成酶基因CHS編碼區(qū)序列來(lái)自NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/),Genbank登錄號(hào)為KJ796482.1。以Chalcone Synthase為關(guān)鍵詞從NCBI中檢索并下載蘋果(Malusdomestica)、北美喬松(Pinusstrobus)、大豆(Glycinemax)、獼猴桃(Actinidiachinensis)和玉米(Zeamays)等其他24種植物CHS基因的編碼序列用于本研究,登錄號(hào)見(jiàn)表1。
表1 不同植物CHS基因完整CDS編碼序列
Table 1 Complete CDS sequence coding frame ofCHSgene in different plants
序號(hào)Number物種Species編號(hào)ID登陸號(hào)Accession number1紅松Pinus koraiensisPkKJ796482.12甘藍(lán)Brassica oleraceaBoHQ189776.13北美喬松Pinus strobusPsAJ004800.14碧桃Prunus persicaPpHM543568.15草莓Fragaria×ananassaFaAB201758.16大豆Glycine maxGmXM_003553938.47杜鵑花Rhododendron simsiiRsAJ413277.18柑橘Citrus sinensisCsAB009350.19高粱Sorghum bicolorSbAF15255310菊花Chrysanthemum×morifoliumCmDQ521272.111大麥Hordeum vulgareHvAY28609312獼猴桃Actinidia chinensisAcKF157394.113擬南芥Arabidopsis thalianaAtNM_121396.414蘋果Malus domesticaMdAB074485.115葡萄Vitis viniferaVvNM_001281135.116水稻Oryza sativaOsAB000801.217王府海棠Malus hybridMhFJ599763.118西洋梨Pyrus communisPcDQ901397.219煙草Nicotiana tabacumNtNM_001326166.120玉米Zea maysZmNM_001148774.121赤松Pinus densiflora pdchsxPdAB01549022毛果楊Populus trichocarpaPtDQ37180423馬尾松Pinus massonianaPmKF30388324輻射松Pinus radiataPrKF70481725海岸松Pinus pinasterPp1AY168850
1.2.1 密碼子偏好性參數(shù)分析
將25種植物的CDS序列整理后,利用分析平臺(tái)Galaxy(version 1.4.4)(https://galaxy.pasteur.fr/)中的CodonW模塊和EMBOSS在線軟件(http://www.bioinformatics.nl/emboss-explorer/)的CUSP模塊與CHIPS模塊對(duì)CHS進(jìn)行密碼子偏好性參數(shù)分析,包括同義密碼子相對(duì)使用度(RSCU)、密碼子適應(yīng)指數(shù)(CAI)、有效密碼子數(shù)(ENC)、密碼子G和C總含量(GC)、密碼子末位堿基G或C的含量(GC3s)和密碼子使用頻率(frequency)等。從Condo Usage Database(http://www.kazusa.or.jp/codon/)數(shù)據(jù)庫(kù)中獲得模式生物擬南芥(Arabidopsisthaliana)、酵母(Saccharomycescerevisiae)、大腸桿菌(Escherichiacoli)和煙草(Nicotianasylvestris)基因組的密碼子使用頻率數(shù)據(jù)。
RSCU是指某些特定密碼子在同義密碼子中的相對(duì)概率,一般地,RSCU值大于1,表示該密碼子使用偏好性強(qiáng),而RSCU值小于1,表示無(wú)使用偏好性[10]。ENC值可反映所有密碼子中同義密碼子使用偏好程度,其分布范圍為20~61,該值是反應(yīng)密碼子使用偏離隨機(jī)選擇的程度。ENC值越靠近20,該基因的密碼子偏好性越強(qiáng),而越靠近61,偏好性越弱[30]。CAI值范圍為0~1,該值越接近1,表明該基因的偏好性越強(qiáng),而越接近0,則偏好性越弱[31]。密碼子的第3位堿基中G+C的含量與第3位堿基總量的比值即GC3s。GC含量是指目的序列中鳥(niǎo)嘌呤(G)和胞嘧啶(C)所占的比率。
1.2.2 聚類分析
基于密碼子使用偏好性的聚類分析是以不同物種的簡(jiǎn)并密碼子(去除終止密碼子TAA、TAG和TGA,起始密碼子ATG和甲硫氨酸TGG)的RSCU值為變量,采用R語(yǔ)言中的pheatmap包(https://cran.r-project.org/web/packages/pheatmap/index.html)繪制系統(tǒng)聚類熱圖。基于CDS編碼區(qū)序列的聚類分析是采用MEGA7.0(Neighbour-Joining,NJ)構(gòu)建的系統(tǒng)發(fā)育樹(shù),并利用在線軟件繪圖工具iTOL(Interactive Tree Of Life,https://itol.embl.de/)對(duì)進(jìn)化樹(shù)進(jìn)行可視化展示。
對(duì)紅松CHS基因使用頻率和RSCU值統(tǒng)計(jì)發(fā)現(xiàn)(詳見(jiàn)表2),61個(gè)密碼子中使用頻率最大的是AAG和GAG(45.34%),26個(gè)密碼子RSCU值大于1,是紅松CHS基因的偏好密碼子。GCC、TTC、GGA、ATC、CCC、AGA、AGT、CTC、CTG、TAC共10個(gè)密碼子的RSCU值大于1.5,表明是該基因的高頻率密碼子,其中GGA(2.06)、CCC(2.48)、AGA(2.47)、CTG(2.31)這4個(gè)密碼子的RACU值均大于2,表明該基因?qū)@些密碼子具有極強(qiáng)的偏好性。我們發(fā)現(xiàn),編碼Leu的CTA的RSCU值為0,說(shuō)明該密碼子可能不參與紅松CHS基因的翻譯過(guò)程。此外,紅松中NTA型密碼子(GTA:0.38,ATA:0.33,TTA:0.15,CTA:0)的RSCU值較低,這可能有利于mRNA的降解以提高蛋白含量,NCG型的密碼子RSCU值(CCG:0.19,GCG:0.48,TCG:1.43,ACG:0.50)較低,表明紅松可能是一種甲基化程度較高的植物。
表2 紅松CHS基因同義密碼子相對(duì)使用度
注:下劃線表示紅松CHS基因該密碼子使用頻率較高
Note:The underlines mean codon usage with high frequency inCHSofP.koraiensis
表3 物種間CHS密碼子偏好性分析
圖1 基于密碼子使用頻率的聚類分析 *表示RSCU值大于1的密碼子Fig.1 Cluster analysis heatmap of codon usage frequency * means the RSCU value is more than 1
圖2 25種植物CHS基因的聚類樹(shù)狀圖 ★代表被研究的物種Fig.2 Cluster dendrogram of CHS gene from 25 plant species ★ represents the species studied
根據(jù)密碼子偏好性參數(shù)分析結(jié)果(詳見(jiàn)表3),發(fā)現(xiàn)紅松CHS基因編碼區(qū)的ENC值為48.92,遠(yuǎn)離20,更接近61,表明該基因的密碼子使用偏好性較弱,蛋白質(zhì)的表達(dá)量可能偏低;CAI值為0.762,表明其密碼子偏好性一般;紅松CHS基因編碼區(qū)的GC含量為0.548,略大于0.5,而GC3s值是0.351,小于0.5,表明紅松CHS基因在堿基利用時(shí),更傾向于C+G,對(duì)以A/T結(jié)尾的密碼子偏好性較強(qiáng)。
25種植物的GC3s、GC含量、CAI值、RSCU值和ENC值如表3所示。25個(gè)物種的ENC平均值為50.29,最小的是玉米(29.05),表達(dá)水平較高,最大的是柑橘(58.89),表達(dá)水平較低。進(jìn)一步分析ENC值發(fā)現(xiàn),多數(shù)植物CHS基因的ENC值均大于35.0,表明多數(shù)植物CHS基因的密碼子偏好性較弱,而禾本科植物CHS基因的ENC值均小于35(除高粱外),表明禾本科植物CHS基因具有更強(qiáng)的密碼子偏好性。25個(gè)物種CHS基因的CAI值介于0.647~0.762,平均值為0.729,表明密碼子選擇偏好性一般。對(duì)GC含量研究發(fā)現(xiàn),GC含量范圍為0.473~0.984,平均值為0.632,其中22個(gè)物種的GC含量均大于0.5,而GC3s值大于0.5的物種也有22個(gè),表明不同物種CHS密碼子選擇偏好性存在差異,多數(shù)物種的G+C含量高于A+T含量,且密碼子更偏好C/G結(jié)尾。通過(guò)RSCU值對(duì)25個(gè)物種CHS密碼子使用偏好性分析,結(jié)果表明,菊花RSCU>1的密碼子數(shù)目最多為31個(gè),高粱、擬南芥、赤松、輻射松最少為23個(gè);水稻RSCU>1.5的密碼子最多達(dá)23個(gè),海岸松最少有7個(gè)。同時(shí),禾本科植物RSCU>1.5的密碼子數(shù)目要比其他植物多,表明禾本科植物密碼子使用偏好性比其他植物強(qiáng),與基于ENC的分析結(jié)果相同。除毛果楊外,其他24種植物共同偏好使用的密碼子是CTC,該密碼子在禾本科植物CHS基因中使用偏好性明顯較其他植物強(qiáng)(見(jiàn)圖1)。
對(duì)25種植物的CHS基因密碼子使用偏好性進(jìn)行聚類分析(見(jiàn)圖1)。結(jié)果表明,25個(gè)物種CHS分為2大類,樣本數(shù)分別為4和21,其中禾本科植物聚成一大類(水稻、高粱、玉米、大麥),剩余的植物聚為一大類,說(shuō)明它們之間的密碼子偏好性存在明顯的差異,其他分支又分為許多小的聚類中心。其中同屬于松科的馬尾松、赤松和紅松的CHS基因聚在一個(gè)小支上,輻射松、海岸松和北美喬松聚在另一個(gè)小支上,這兩個(gè)小支共聚在一個(gè)大支上面,表明具有相近親緣關(guān)系的物種在密碼子使用模式上較為相似。進(jìn)一步分析發(fā)現(xiàn),同屬薔薇科的王府海棠、西洋梨和蘋果也聚在一個(gè)小支上,碧桃和草莓聚在一個(gè)小支上,這兩個(gè)小支共聚在一個(gè)大支上面,說(shuō)明基于RSCU值的聚類結(jié)果與傳統(tǒng)分類學(xué)很相近。而毛果楊、擬南芥和獼猴桃各單獨(dú)成為一個(gè)小分類,說(shuō)明毛果楊、擬南芥和獼猴桃的CHS基因在密碼子使用上與其他植物存在差異。同時(shí),擬南芥和紅松聚在一個(gè)大支上,一定程度上說(shuō)明擬南芥作為受體植物研究紅松CHS基因更具有優(yōu)勢(shì)。此外,不是同一科的煙草、菊花和柑橘聚在一個(gè)小支上,說(shuō)明它們的CHS基因在密碼子使用偏好性上較為相似。因此,RSCU值是研究植物進(jìn)化關(guān)系一個(gè)很好的參數(shù)。對(duì)25種植物的CHS基因密碼子使用頻率統(tǒng)計(jì)發(fā)現(xiàn),61個(gè)密碼子可分為4大類,其中CTC密碼子在所有物種中均出現(xiàn),其在單子葉植物中的使用頻率明顯高于雙子葉植物。值得注意的是,AGA、GGA、GGT和TCT等密碼子僅在部分雙子葉植物中使用頻率較高,而在單子葉中使用頻率較低,甚至不會(huì)出現(xiàn)。運(yùn)用MEGA7.0將不同物種的CDS序列進(jìn)行聚類分析,進(jìn)一步分析紅松CHS基因與其他物種間的親緣關(guān)系,結(jié)果發(fā)現(xiàn)(見(jiàn)圖2)禾本科4種植物的CDS序列同源性較高,聚在一個(gè)大的分支上,這一聚類結(jié)果與基于RSCU值的聚類分析結(jié)果相似,但此時(shí)水稻和大麥沒(méi)有聚在一個(gè)小分支上。另外,從圖中可看出紅松、赤松、海岸松、北美喬松、馬尾松和輻射松等6種松科植物均聚在一個(gè)大支上,這一結(jié)果與基于RSCU值的聚類結(jié)果一致,其中紅松CHS基因的CDS序列與北美喬松和海岸松的同源性較高?;赗SCU值聚類結(jié)果在一定程度上可反映紅松的進(jìn)化規(guī)律,但基于CDS序列的聚類結(jié)果與普通分類學(xué)結(jié)果更接近。
密碼子使用頻率的比值大小是評(píng)價(jià)不同物種間密碼子使用偏好性的重要參數(shù),當(dāng)該值≤0.5或≥2時(shí),表示兩個(gè)物種間密碼子使用偏好性差異較大,反之密碼子使用較為一致。將紅松CHS密碼子使用頻率與煙草、大腸桿菌、擬南芥和酵母進(jìn)行比較分析(見(jiàn)表4)。由表4可知,紅松CHS與煙草、大腸桿菌、擬南芥和酵母基因組中使用偏好性差異較大的密碼子分別有31、31、28和34個(gè),大腸桿菌、酵母菌密的碼子使用頻率差異較小,其中大腸桿菌表達(dá)系統(tǒng)更適用于紅松CHS的異源表達(dá),擬南芥可能為CHS基因遺傳轉(zhuǎn)化試驗(yàn)最佳的受體材料。
表4 紅松CHS基因與部分模式植物基因組密碼子使用偏好性比較
Table 4 Comparison of codon usage preference betweenCHSgene inP.koraiensisand the other representative organisms
密碼子Condon氨基酸Amino acidPkScEcNsAtPk/ScPk/EcPk/NsPk/AtGCAA17.616.22322.917.51.090.7670.771.01GCCA32.712.621.612.910.32.601.5162.543.18GCGA10.16.221.14.791.630.4782.141.12GCTA22.721.218.934.528.31.071.1990.660.80TGCC15.14.85.57.57.23.152.7482.022.10TGTC5.08.15.98.710.50.620.8540.580.48GACD35.320.217.916.217.21.751.9702.182.05GATD22.737.633.735.636.60.600.6730.640.62GAAE15.145.635.135.834.30.330.4310.420.44GAGE45.319.219.427.932.22.362.3371.631.41TTCF32.718.413.917.420.71.782.3561.881.58TTTF5.026.124.423.621.80.190.2060.210.23GGAG42.810.913.626.224.23.933.1491.631.77GGCG25.29.820.614.39.22.571.2231.762.74GGGG5.06.012.311.210.20.840.4100.450.49GGTG10.123.923.731.622.20.420.4250.320.45CACH12.67.87.38.78.71.611.7251.451.45CATH5.013.612.410.813.80.370.4060.470.37ATAI5.017.813.310.612.60.280.3790.480.40ATCI30.217.219.413.918.51.761.5582.171.63ATTI10.130.129.626.121.50.330.3400.390.47AAAK17.641.937.228.430.80.420.4740.620.57AAGK45.330.815.332.432.71.472.9631.401.39CTAL0.013.45.67.19.90.000.0000.000.00CTCL30.25.49.511.916.15.603.1822.541.88CTGL37.810.537.47.49.83.601.0105.113.86CTTL15.112.314.525.424.11.231.0420.600.63TTAL2.526.217.412.012.70.100.1450.210.20TTGL12.627.212.923.320.90.460.9760.540.60ATGM32.720.923.724.224.51.571.3821.351.34AACN15.124.820.316.920.90.610.7440.890.72AATN12.635.729.322.722.30.350.4300.550.56CCAP7.618.39.123.516.10.410.8300.320.47CCCP32.76.86.26.95.34.825.2824.756.18CCGP2.55.314.54.88.60.480.1740.520.29CCTP10.113.59.520.818.70.751.0610.480.54CAAQ12.627.314.421.519.40.460.8750.590.65CAGQ35.312.126.716.415.22.911.3212.152.32AGAR17.621.37.116.719.00.832.4831.060.93AGGR10.19.24.013.811.01.102.5190.730.92CGAR0.03.04.84.26.30.000.0000.000.00CGCR5.02.614.04.93.81.940.3601.031.33CGGR7.61.77.94.74.94.450.9571.611.54CGTR2.56.415.910.79.00.390.1580.240.28AGCS12.69.814.39.811.31.290.8811.291.11AGTS15.114.213.212.114.01.061.1451.251.08TCAS0.018.713.114.618.30.000.0000.000.00TCCS10.114.29.711.011.20.711.0390.920.90TCGS12.68.68.23.39.31.461.5363.821.35TCTS2.523.513.121.925.20.110.1920.120.10ACAT15.117.815.115.515.70.851.0010.980.96ACCT17.612.718.910.610.31.390.9331.661.71ACGT7.68.013.63.77.70.940.5562.040.98ACTT20.220.313.121.017.50.991.5380.961.15GTAV7.611.813.111.19.90.640.5770.680.76GTCV30.211.813.111.112.82.562.3072.722.36GTGV22.710.819.917.417.42.101.1391.301.30GTTV20.222.121.628.427.20.910.9330.710.74TGGW10.110.413.412.612.50.970.7520.800.81TACY17.614.811.714.913.71.191.5071.181.29TATY5.018.821.616.914.60.270.2330.300.35TAA*2.51.12.00.70.92.291.2603.602.80TAG*0.00.50.30.50.50.000.0000.000.00TGA*0.00.71.11.21.20.000.0000.000.00
同義密碼子由于存在簡(jiǎn)并性,往往不會(huì)影響氨基酸的編碼,進(jìn)而不會(huì)改變蛋白質(zhì)的結(jié)構(gòu)功能,因此,不會(huì)對(duì)細(xì)胞功能產(chǎn)生嚴(yán)重的影響。但是,經(jīng)過(guò)長(zhǎng)期的進(jìn)化,有些密碼子在基因或測(cè)序基因組中比其他密碼子出現(xiàn)得更頻繁,密碼子偏好性是廣泛存在且在部分物種中是非常強(qiáng)烈的,將特定的密碼子進(jìn)行的同義突變處理,可使目的基因的表達(dá)量顯著提高[32],在提高外源基因轉(zhuǎn)化效率方面具有重要的作用。
密碼子使用偏好性是物種在漫長(zhǎng)的自然選擇和進(jìn)化進(jìn)程中形成的適應(yīng)性選擇,對(duì)研究基因的進(jìn)化和功能鑒定具有重要的意義。然而,紅松中相關(guān)研究還未見(jiàn)報(bào)道。本研究通過(guò)對(duì)紅松CHS基因密碼子使用模式進(jìn)行分析,確定了GCC、TTC、GGA、ATC、CCC、AGA、AGT、CTC、CTG、TAC共10個(gè)密碼子是該基因的高頻率密碼子,其中GGA、CCC、AGA、CTG這4個(gè)密碼子具有極強(qiáng)的偏好性,可作為該基因的最優(yōu)密碼子,同時(shí)也存在CTA、CGA和TCA等不參與該基因編碼過(guò)程的密碼子,說(shuō)明紅松CHS進(jìn)化過(guò)程可能較為復(fù)雜。紅松CHS與赤松、馬尾松、海岸松、北美喬松和輻射松的ENC值均大于48,可見(jiàn)松科植物的密碼子使用偏好性相對(duì)較弱,對(duì)密碼子的選擇具有較高的隨機(jī)性。先前的研究發(fā)現(xiàn),單子葉植物基因偏向于C/G結(jié)尾的密碼子,雙子葉植物基因偏向于A/T結(jié)尾的密碼子[33],而在裸子植物中還沒(méi)有相關(guān)的結(jié)論。本研究表明,在基因密碼子堿基選擇時(shí),紅松CHS基因編碼區(qū)GC3s含量小于0.5,更偏好于A/T結(jié)尾的密碼子,這可能是由于紅松在進(jìn)化過(guò)程中主要以GC到AT突變方向?yàn)橹饔嘘P(guān),而松科的其他幾個(gè)物種的GC3s含量均大于0.5,AT到GC的突變壓力要比GC到AT的突變壓力大,說(shuō)明紅松存在特殊的密碼子使用模式和進(jìn)化形式。此外,4個(gè)NTA和NCG型密碼子的RSCU值較低,說(shuō)明紅松的甲基化程度可能較高。
研究表明,基因的密碼子使用特性在不同物種之間可能存在明顯差異,但在親緣關(guān)系較近的物種之間差異較小,反之差異較大[34]?;诿艽a子使用偏好性和基于CDS序列的聚類分析結(jié)果存在著一定的差異,這與前人的研究結(jié)果一致[35]。而將兩種方法相結(jié)合可在一定程度上客觀反應(yīng)出物種的進(jìn)化規(guī)律,其中基于CDS序列的聚類分析更能反映出系統(tǒng)分類學(xué)中物種間的親緣關(guān)系。本研究表明紅松與赤松、海岸松、北美喬松、馬尾松和輻射松等6種松科植物在兩種聚類方式中均聚在一個(gè)大支上,同屬薔薇科的王府海棠、西洋梨、蘋果、碧桃和草莓也聚在一個(gè)大支上,進(jìn)一步說(shuō)明親緣關(guān)系較近的物種一般具有相似的密碼子使用偏好性,這與在大豆(Glycinemax)[24]、籽粒莧(Amaranthushypochondriacus)[36]、小麥(Triticumaestivum)[37]等植物中的研究結(jié)果一致。研究中發(fā)現(xiàn)禾本科4種植物的CDS序列同源性較高,這一聚類結(jié)果與基于RSCU值的聚類分析結(jié)果相似,但在更小的分類單元上,水稻和大麥沒(méi)有聚在一個(gè)小分支上,這可能是由于在物種進(jìn)化過(guò)程中由于發(fā)生突變而造成CHS基因密碼子使用偏好性存在差異。
在基因工程研究中,外源目的基因在受體細(xì)胞中的表達(dá)效率常與外源基因的結(jié)構(gòu)密切相關(guān),其中外源目的基因與模式物種基因組密碼子使用偏好性是一個(gè)重要的指標(biāo),尤其是稀有密碼子,可在一定程度上影響外源基因的轉(zhuǎn)化、轉(zhuǎn)錄表達(dá)水平及相應(yīng)功能[38]。本研究表明,擬南芥和大腸桿菌可能作為紅松CHS遺傳轉(zhuǎn)化和異源表達(dá)較為理想的受體,這與陳義挺等[10]對(duì)獼猴桃的研究結(jié)論一致。通過(guò)遺傳轉(zhuǎn)化技術(shù)改良林木品質(zhì)是一種強(qiáng)有力的方法,可對(duì)CHS基因的部分密碼子進(jìn)行特殊優(yōu)化和定向改造,以期獲得穩(wěn)定高效表達(dá)的遺傳轉(zhuǎn)化體系。隨著測(cè)序技術(shù)的不斷發(fā)展,越來(lái)越多的林木完成了全基因測(cè)序,為林木基因工程的開(kāi)展和遺傳改良奠定了基礎(chǔ)。今后,根據(jù)林木CHS基因或基因家族的密碼子使用偏好性特征,在全基因組水平上進(jìn)行相應(yīng)的遺傳改造,不僅能有效促進(jìn)類黃酮類物質(zhì)的合成,還對(duì)林木花色、抗逆性、轉(zhuǎn)基因育種、基因家族起源及基因復(fù)制的研究具有巨大的理論意義。