郭 松, 梁湘蘭, 黃青青, 盧 祥, 嚴(yán)其偉, 張 鵬, 覃逸明 *
( 1. 廣西科技師范學(xué)院 食品與生化工程學(xué)院, 廣西 來(lái)賓 546199; 2. 廣西科技師范學(xué)院 特色瑤藥資源研究與開發(fā)重點(diǎn)實(shí)驗(yàn)室, 廣西 來(lái)賓 546199 )
密碼子是聯(lián)結(jié)生物體內(nèi)遺傳物質(zhì)和蛋白質(zhì)翻譯的紐帶(謝平,2017;柳燕杰等,2020),在生物體內(nèi)起著重要作用。20種常見(jiàn)氨基酸,除了蛋氨酸(methionine,Met)和色氨酸(tryptophane,Trp)具有單一密碼子外,其余氨基酸均由2~6個(gè)同義密碼子編碼(胡曉艷等,2019)。同義密碼子的使用具有非均一性的特點(diǎn)(梁菲菲,2010)。某一物種或者某一基因傾向使用一種或者使用幾種特定的同義密碼子的現(xiàn)象稱為密碼子的使用偏好性(codon usage bias,CUB)(吳憲明等,2007)。密碼子偏好性是生物長(zhǎng)期進(jìn)化過(guò)程中所形成,不同物種間密碼子使用的偏好性不同(趙森等,2020)。隨著高通量測(cè)序技術(shù)的發(fā)展,目前已經(jīng)有多種藥用植物葉綠體基因組完成了密碼子偏好性的分析,對(duì)于探索物種進(jìn)化及提高外源基因的表達(dá)水平起到了推動(dòng)作用。
紫九牛為傳統(tǒng)老班瑤藥“虎牛鉆風(fēng)”中的“牛”類藥物,來(lái)源于鼠李科屬植物翼核果()的根和莖,別名血風(fēng)藤、鐵牛入石、紅穿破石、青筋藤、牛參等?,庒t(yī)認(rèn)為紫九牛具有養(yǎng)血祛風(fēng)、舒筋活絡(luò)、固腎益精等功效(覃迅云等,2001),民間常用其治療慢性肝炎、肝風(fēng)化、風(fēng)濕筋骨疼痛、風(fēng)濕性關(guān)節(jié)炎、腰肌勞損等疾病(林明琛等,2020)?,F(xiàn)代醫(yī)藥學(xué)研究表明,紫九牛中富含翼核果醌和大黃素等活性化合物(應(yīng)百平等,1988;王雪芬等,1993),具有抗菌、止咳、抗腫瘤等活性(Wang et al.,2008;梁冰等,2012;Hu et al.,2020)。作為一種經(jīng)典瑤藥,已經(jīng)開始被廣泛應(yīng)用于多種疾病的開發(fā)治療,但是對(duì)于紫九牛葉綠體基因組密碼子偏好性的分析,尚未有研究。
本文利用Codon W 1.4.2、在線軟件CUSP和Chips、R語(yǔ)言等軟件和程序,對(duì)紫九牛葉綠體基因組的密碼子進(jìn)行分析,研究其密碼子的偏好性以及偏好性形成的因素,并確立最優(yōu)密碼子,為紫九牛葉綠體基因組基因的改良,目標(biāo)基因的優(yōu)化提供依據(jù)。
紫九牛葉綠體基因組序列信息由本實(shí)驗(yàn)室測(cè)序獲得,已上傳NCBI數(shù)據(jù)庫(kù)(GenBank登錄號(hào)為MT974496),共有91條可以編碼蛋白質(zhì)的基因序列(coding DNA sequence,CDS)。選擇其中長(zhǎng)度大于300 bp的蛋白質(zhì)編碼序列為分析樣本,最終得到50條CDS用于后續(xù)的分析。
1.2.1 密碼子偏好性相關(guān)參數(shù)分析 使用軟件Codon W 1.4.2計(jì)算紫九牛葉綠體基因組同義密碼子的相對(duì)使用度(relative synonymous codon usage, RSCU)。根據(jù)RSCU分析的結(jié)果:當(dāng)RSCU=1時(shí),該密碼子不存在偏性(吳妙麗等,2019;梁曉靜等,2020);當(dāng)RSCU>1時(shí),同義密碼子中偏好使用該密碼子,并將該密碼子確定為高頻密碼子(林濤等,2002),反之亦然。使用在線軟件Chips可以分析各CDS的有效密碼子數(shù)(effective number of codons,ENC),ENC值可以反映密碼子偏倚性的強(qiáng)弱,其取值范圍為20到61,當(dāng)ENC值為20時(shí),同義密碼子完全處于偏倚狀態(tài),當(dāng)ENC值為61時(shí),則表明同義密碼子沒(méi)有偏倚(趙森等,2020);ENC值從大到小偏倚性由弱變強(qiáng),通常ENC值45作為區(qū)分偏倚性強(qiáng)弱的標(biāo)準(zhǔn)(吳憲明等,2007)。通過(guò)在線軟件CUSP,分析各CDS的GC含量,分別用GC、GC、GC來(lái)表示密碼子第一、第二、第三位的G/C含量,用GC來(lái)表示三個(gè)密碼子的平均GC含量。
1.2.2 影響密碼子偏好性的因素 使用軟件SPSS 19.0對(duì)各CDS中不同位置的GC,即GC、GC、GC、GC,以及密碼子數(shù)目(N)和ENC進(jìn)行相關(guān)性分析,判斷各參數(shù)之間的相關(guān)性,進(jìn)而判斷密碼子偏好性受到的因素影響。通過(guò)中性繪圖,分析GC和GC的平均值GC和GC的相關(guān)性。將各CDS同義密碼子的第三位堿基GC(用GC表示)和ENC利用R語(yǔ)言作ENC-plot分析,標(biāo)準(zhǔn)曲線方程為ENC=2+GC+{29/[GC+(1-GC)]}(羅洪等,2015)。并利用標(biāo)準(zhǔn)方程求出ENC,根據(jù)ENC=(ENC-ENC)/ENC,根據(jù)數(shù)據(jù)分析50個(gè)基因中ENC的期望值與實(shí)際值的相差程度。
1.2.3 最優(yōu)密碼子的確定 以ENC為基準(zhǔn),從兩端各選10%的基因,即兩端各選5條CDS,以ENC值較小的5條CDS確定為高基因表達(dá)庫(kù),ENC數(shù)值較大的5條CDS確定為低基因表達(dá)庫(kù),將從兩端篩選出來(lái)的兩個(gè)高低基因庫(kù)的基因序列分別整合到兩個(gè)fasta文件中,通過(guò)軟件Codon W 1.4.2來(lái)分析其RSCU值,以得到高低基因庫(kù)的△RSCU,將△RSCU≥0.08的密碼子確定為高表達(dá)的優(yōu)越密碼子(林濤等,2002)。若一密碼子既符合高表達(dá)優(yōu)越密碼子的條件,又符合高頻密碼子的條件,則將該密碼子確定為最優(yōu)密碼子(劉慧等,2017)。
2.1.1 RSCU分析 通過(guò)軟件Codon W 1.4.2分析了紫九牛葉綠體基因組50條CDS中的各同義密碼子的相對(duì)頻率,結(jié)果如表1所示。各同義密碼子中RSCU>1的有29個(gè),其中以A/U結(jié)尾的有28個(gè),說(shuō)明了紫九牛葉綠體基因偏好以A/U結(jié)尾。
表 1 紫九牛葉綠體基因組中各氨基酸的RSCU分析Table 1 RSCU analysis of amino acids in chloroplast genomes of Ventilago leiocarpa
2.1.2 GC含量及ENC分析 通過(guò)在線軟件CUSP和Chips分析了紫九牛各CDS不同位置的GC含量,結(jié)果如表2所示。可以看出GC平均含量:GC(47.38%)>GC(39.81%)>GC(29.60%),GC含量最高,GC含量最低,不同位置的GC含量存在較大差異。而此處ENC值的范圍為37.350~55.547,平均值為48.227,其中ENC值大于45的有40個(gè),小于45的僅有10個(gè),進(jìn)一步說(shuō)明了紫九牛葉綠體基因組密碼子具有較弱的偏好性。
表 2 紫九牛葉綠體基因組50條CDS序列密碼子不同位置的GC含量Table 2 GC contents in different positions of codons in chloroplast genomes 50 CDS of Ventilago leiocarpa
2.2.1 相關(guān)性分析及中性繪圖分析 利用軟件SPSS 19.0對(duì)50條CDS序列密碼子不同位置的GC、密碼子數(shù)量N以及ENC值進(jìn)行相關(guān)性分析,結(jié)果如表3所示。GC與GC、GC沒(méi)有顯著相關(guān)性,而與GC、N以及ENC呈顯著相關(guān)性,三位堿基的組成存在差異,初步說(shuō)明了紫九牛葉綠體基因受到選擇作用的影響。ENC與GC、GC達(dá)到顯著相關(guān)的水平,說(shuō)明了紫九牛葉綠體基因的后兩位密碼子的堿基會(huì)影響密碼子的使用偏好性。
表 3密碼子各位置GC含量、數(shù)量N及ENC值相關(guān)性分析Table 3 Correlation analyses of GC content, number (N) and ENC on chloroplast genomes of Ventilago leiocarpa
以GC和GC的平均值GC為縱坐標(biāo),GC為橫坐標(biāo)進(jìn)行中性繪圖分析,結(jié)果如圖1所示。結(jié)果表明,相關(guān)系數(shù)=0.131,相關(guān)性不顯著,密碼子偏好性主要受到選擇的影響。
圖 1 紫九牛葉綠體基因中性繪圖分析Fig. 1 Neutrality plot analysis of chloroplast genes of Ventilago leiocarpa
2.2.2 ENC-plot分析 由圖2可知,紫九牛葉綠體基因主要分布于標(biāo)準(zhǔn)曲線附近,密碼子偏好性主要受到突變的影響。通過(guò)表4分析可知,密碼子基因組限在-0.05~0.05附近的基因占52%,組限在其以外的占48%。
圖 2 紫九牛葉綠體基因組的ENC-plot分析Fig. 2 ENC-plot analysis of chloroplast genomes of Ventilago leiocarpa
表 4 ENC比值頻數(shù)分布Table 4 Number distribution of ENC ratio
利用軟件Codon W 1.4.2來(lái)計(jì)算高低基因庫(kù)中各同義密碼子的RCSU值,進(jìn)而得到△RSCU,結(jié)果如表5所示。由表5可知,△RSCU≥0.08的密碼子有22個(gè),其中大于0.3的有14個(gè),大于0.5的有5個(gè)。由表1可知,RSCU>1的密碼子有29個(gè)。將兩者共有的密碼子確定為最優(yōu)密碼子,最終得到密碼子15個(gè),分別為GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU,其中有14個(gè)以A/U結(jié)尾。
表 5 紫九牛葉綠體基因組最優(yōu)密碼子分析Table 5 Analysis of optimal codons in chloroplast genomes of Ventilago leiocarpa
在紫九牛葉綠體基因組的RSCU分析中,由于TAG、TAA和TGA為葉綠體通用密碼子表64種密碼子中的終止密碼子,不編碼任何氨基酸,而ATG是蛋氨酸唯一密碼子,TGG是色氨酸唯一密碼子,沒(méi)有偏性,在RSCU分析中被剔除(柳燕杰等,2020)。剩下的59種密碼子中,RSCU>1的有29個(gè),RSCU<1的有30個(gè),約各占一半, 且并未發(fā)現(xiàn)RSCU>2的密碼子,初步說(shuō)明了紫九牛的密碼子存在較弱的偏好性。而且,在50個(gè)基因中,表示密碼子偏倚程度的ENC值小于45的僅有10個(gè),ENC 的平均值為48.277,大于45,這進(jìn)一步說(shuō)明紫九牛密碼子的偏好性較弱。29個(gè)RSCU>1的密碼子當(dāng)中,有28個(gè)密碼子以A/U結(jié)尾,這與已經(jīng)發(fā)表的大多數(shù)物種例如美國(guó)紅梣()(柳燕杰等,2020)、云南藍(lán)果樹()(原曉龍等,2020)、蒺藜苜蓿()(楊國(guó)鋒等,2015)等葉綠體密碼子偏好性較弱且偏好以A/U結(jié)尾的結(jié)果一致。
密碼子是生物體內(nèi)聯(lián)結(jié)核酸和蛋白質(zhì)的鑰匙,而密碼子的使用頻率在不同植物和基因中存在差異,這種密碼子偏好性是物種在長(zhǎng)期進(jìn)化和對(duì)環(huán)境的適應(yīng)過(guò)程中形成的(趙洋等,2016)。密碼子的偏好性是多個(gè)因素共同作用的結(jié)果,中性選擇影響和方向突變影響是兩個(gè)主要因素,關(guān)于二者在密碼子偏好性形成中的作用大小是當(dāng)下關(guān)于密碼子偏好性研究所關(guān)注的熱點(diǎn)。生物在進(jìn)化過(guò)程中形成穩(wěn)定的密碼子偏好性,即相對(duì)固定的密碼子使用模式,其中GC含量是生物基因組中堿基組成的一個(gè)重要指標(biāo)(楊國(guó)鋒等,2015),在基因組的演變中具有重要意義。方向性突變的強(qiáng)弱可以通過(guò)GC含量判斷,尤其是密碼子的第三位堿基。由于密碼子第三位受到的選擇壓力比前兩位小,故GC常常被用來(lái)衡量密碼子偏好性的指標(biāo)(柳燕杰等,2020)。紫九牛葉綠體基因組中GC與GC,GC沒(méi)有顯著相關(guān)性,說(shuō)明偏好性受到選擇的影響,這與已經(jīng)報(bào)道了的美國(guó)紅梣 ()(柳燕杰等,2020)、黃芩 ()(王文斌等,2018)、普通油茶 ()(王鵬良等,2018)、樟樹 ()(秦政等,2018)的葉綠體特征相同。而ENC-plot分析中,密碼子大部分都位于標(biāo)準(zhǔn)曲線附近,只有少量基因的ENC值離標(biāo)準(zhǔn)曲線較遠(yuǎn),表明密碼子偏好性還受到突變作用的影響,與蒺藜苜蓿()(楊國(guó)鋒等,2015)相類似。
我們此次將RSCU>1且△RSCU≥0.08的密碼子確定為最優(yōu)密碼子,得到15個(gè)最優(yōu)密碼子為GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU。其中,以A/U結(jié)尾有14個(gè),這與上述中的紫九牛葉綠體基因組密碼子偏好以A/U結(jié)尾的結(jié)論一致。
在紫九牛葉綠體基因工程的外源基因載體設(shè)計(jì)時(shí)選用以A/U結(jié)尾的最優(yōu)密碼子可以提高外源基因的表達(dá)效率。紫九牛葉綠體基因組偏好性的研究以及最優(yōu)密碼子的確立,為優(yōu)化目標(biāo)基因,通過(guò)基因工程來(lái)改良紫九牛的性狀提供了科學(xué)的依據(jù)。同時(shí),對(duì)于物種的進(jìn)化,以及提高外源基因表達(dá)水平具有重大意義。