摘要:運(yùn)用CodonW程序?qū)M南芥(Arabidopsis thaliana)POT基因密碼子組成、同義密碼子使用頻率和全長(zhǎng)編碼區(qū)密碼子進(jìn)行分析。結(jié)果表明,擬南芥POT基因密碼子適應(yīng)指數(shù)(CAI)與同義密碼子第三位堿基含量(C3s)、密碼子偏愛指數(shù)(CBI)均呈顯著正相關(guān)(P<0.05),與最優(yōu)密碼子使用頻率(FOP)呈極顯著正相關(guān)(P<0.01)。有效密碼子數(shù)(ENC)與同義密碼子第三位堿基含量(C3s)呈顯著正相關(guān)(P<0.05),與GC3s呈極顯著正相關(guān)(P<0.01),與同義密碼子第三位堿基含量(T3s)呈極顯著負(fù)相關(guān)(P<0.01)。擬南芥POT基因密碼子使用相對(duì)概率(RSCU)>1的密碼子多以堿基A或T結(jié)尾。
關(guān)鍵詞:擬南芥(Arabidopsis thaliana);POT基因;密碼子
中圖分類號(hào):Q943 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)04-0956-03
Characterization of Codon Usage of Arabidopsis thaliana POT Gene
WANG Fu-yuan1,TANG Ning2,YANG Ping2
(1.Higher Vocational and Technology School, China Pharmaceutical University, Nanjing 211198, China;
2.School of Biochemistry and Environmental Engineering, Nanjing Xiaozhuang College, Nanjing 211171, China)
Abstract: CodonW software was applied to analyze the nucleotide composition, relative synonymous codon usage and other parameters of Arabidopsis thaliana POT gene. The results indicted that CAI was significantly positively correlated with C3s and CBI(P<0.05), and very significantly positively correlated with FOP(P<0.01); ENC was significantly positively correlated with C3s content(P<0.05), very significantly positively correlated with GC3s(P<0.01), and very significantly negatively correlated with T3s(P<0.01). Most codons with RSCU>1 of A. thaliana POT gene ended with A and T.
Key words: Arabidopsis thaliana; POT gene; codon
POT基因是擬南芥編碼高親和性K+載體蛋白的基因[1],將AtPOT1基因?qū)虢湍妇扁洜I(yíng)養(yǎng)突變體,可使其恢復(fù)對(duì)K+的吸收[2,3]。同義密碼子的使用偏好性與諸多生命活動(dòng)密切相關(guān)。目前密碼子的使用偏好性主要集中在對(duì)已知全基因組序列的低等生物和模式生物的基因組密碼子使用模式研究[4-6],對(duì)單一功能基因家族的密碼子用法研究還比較少[7,8]。本研究通過(guò)分析擬南芥POT基因家族全長(zhǎng)編碼框密碼子的使用特性,為深入研究POT基因的進(jìn)化、表達(dá)調(diào)控機(jī)制等提供重要的理論依據(jù)。
1 材料與方法
1.1 擬南芥POT基因序列
從TAIR(http://www.arabidopsis.org/)和Uniport(http://www.uniprot.org/)獲得擬南芥POT基因家族序列。序列名稱及Uniport對(duì)應(yīng)登錄號(hào)如下:AtPOT1:022397;AtPOT2:022881;AtPOT3:Q9FE38;AtPOT4: Q9LD18; AtPOT5: Q9M7K4; AtPOT6:Q8W414; AtPOT7: Q9FY75; AtPOT8: Q9M7J9;AtPOT9: O49423; AtPOT10: Q9SA05; AtPOT11:O64769;AtPOT12:O80739;AtPOT13:Q8LPL8。
1.2 方法
利用CodonW(http://codonw.sourceforge.net/)和CUSP(http://bioweb2.pasteur.fr)軟件分析擬南芥POT基因密碼子使用特性的參數(shù)包括:氨基酸數(shù)(L_aa)、同義氨基酸數(shù)(L_sym)、氨基酸組分指數(shù)[平均親水性值(Gravy)和芳香性值(Aroma)]、A3s、 T3s、G3s、C3s(同義密碼子在第三位上腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶的出現(xiàn)頻率)、GC含量(基因的G+C含量)、GC3s(編碼同一氨基酸的同義密碼子的第三位的GC含量)、ENC(有效密碼子數(shù))、FOP(最優(yōu)密碼子使用頻率)、CBI(密碼子偏愛指數(shù))、RSCU(密碼子使用相對(duì)概率)、CAI(密碼子適應(yīng)指數(shù))等。運(yùn)用SPSS 17.0統(tǒng)計(jì)軟件進(jìn)行密碼子組成和使用偏好性各參數(shù)間相關(guān)性的分析。
2 結(jié)果與分析
2.1 擬南芥POT基因的密碼子組成和使用性參數(shù)分析
擬南芥POT基因氨基酸數(shù)(L_aa)、同義氨基酸數(shù)(L_sym)、氨基酸組分指數(shù)(平均親水性值和芳香性值)、A3s、T3s、G3s、C3s、GC3s、ENC、CAI、GC含量等密碼子使用特性見表1。由表1可知,擬南芥POT基因GC含量為42.70%~46.30%,這表明13個(gè)基因在整體編碼框區(qū)域內(nèi)都傾向于使用腺嘌呤(A)和胸腺嘧啶(T)。利用CUSP軟件分析擬南芥POT基因編碼區(qū)GC含量為42.70%~46.30%,與整個(gè)基因組GC含量44.59%基本相當(dāng)[9]。Gravy值均為正值,表明擬南芥POT基因?yàn)槭杷缘鞍踪|(zhì)。
ENC是衡量單個(gè)基因密碼子非均衡使用的偏好程度,取值范圍為20(每個(gè)氨基酸只使用1個(gè)密碼子)到61(各個(gè)密碼子被均衡使用)。其值越低表明該基因的密碼子使用偏好性越強(qiáng)。Jiang等[10]將ENC 35作為偏性強(qiáng)弱的區(qū)分標(biāo)準(zhǔn)。擬南芥POT基因家族ENC取值范圍為49.90~57.77,除AtPOT1的ENC為49.90,其他ENC都大于50,表明擬南芥POT基因家族密碼子偏性較弱。CAI是基因編碼區(qū)同義密碼子與密碼子最佳使用相符合程度的參數(shù)指標(biāo),其取值范圍為0~1。擬南芥POT基因CAI為0.179~0.219,表明擬南芥POT基因密碼子偏性較弱。
2.2 擬南芥POT基因密碼子使用參數(shù)的相關(guān)性分析
擬南芥POT基因密碼子使用性各參數(shù)之間相關(guān)分析見表2。由表2可知,CAI與C3s、CBI均呈顯著正相關(guān)(P<0.05),與FOP呈極顯著正相關(guān)(P<0.01)。ENC與同C3s呈顯著正相關(guān)(P<0.05),與GC3s呈極顯著正相關(guān)(P<0.01),與T3s呈極顯著負(fù)相關(guān)(P<0.01)。由各參數(shù)間的相關(guān)性關(guān)系表明,同義密碼子第三位的堿基含量對(duì)基因的表達(dá)水平和密碼子使用偏好性程度有一定的影響。
2.3 擬南芥POT基因密碼子的對(duì)應(yīng)性分析
根據(jù)CodonW軟件分析,擬南芥POT基因相對(duì)同義密碼子的對(duì)應(yīng)性分析結(jié)果表明,擬南芥POT基因前兩個(gè)軸對(duì)變異方差的貢獻(xiàn)率分別為19.29%和16.64%,其余各軸對(duì)變異方差的貢獻(xiàn)更小。可以將擬南芥POT基因密碼子放在這兩條軸上進(jìn)行分析。各基因密碼子在前兩軸的分布見圖1,擬南芥以G和C結(jié)尾的密碼子大多位于第二軸的上側(cè),表明G+C含量是影響同義密碼子使用偏性的主要因子。對(duì)應(yīng)分析中的第一軸與氨基酸數(shù)(L_aa)的相關(guān)系數(shù)為-0.68,呈顯著負(fù)相關(guān)(P<0.05),與同義氨基酸數(shù)(L_sym)的相關(guān)系數(shù)為-0.689,呈極顯著負(fù)相關(guān)(P<0.01),表明基因長(zhǎng)度對(duì)密碼子偏性有明顯影響。
2.4 擬南芥POT基因密碼子偏好性
密碼子使用的相對(duì)概率(RSCU)作為衡量密碼子偏好性的標(biāo)準(zhǔn)被該領(lǐng)域研究者普遍接受,并廣泛應(yīng)用。當(dāng)某一密碼子的RSCU值等于1時(shí),表明它在編碼使用時(shí)出現(xiàn)的次數(shù)與期望值相等;當(dāng)其值大于1時(shí),表明它的出現(xiàn)次數(shù)大于期望值,表現(xiàn)為使用偏好;反之則使用偏少。利用CodonW計(jì)算擬南芥POT基因的RSCU值(表3)。RSCU值大于1的密碼子多以U(T)或A結(jié)尾,說(shuō)明密碼子以U(T)或A結(jié)尾的出現(xiàn)頻率較高,這些是基因組偏愛的密碼子。以G或C結(jié)尾的密碼子RSCU值多小于1,說(shuō)明以G或C結(jié)尾的密碼子出現(xiàn)的頻率較低,這些是基因組非偏愛的密碼子。
3 小結(jié)與討論
密碼子是核酸攜帶信息和蛋白質(zhì)攜帶信息間對(duì)應(yīng)的基本規(guī)則,是生物體內(nèi)信息傳遞的基本環(huán)節(jié)。對(duì)于不同的物種來(lái)說(shuō),不同密碼子在基因中出現(xiàn)的頻率有很大不同,同義密碼子使用偏性的現(xiàn)象廣泛存在于動(dòng)物、植物和微生物中[11]。
本研究對(duì)擬南芥POT基因的氨基酸數(shù)(L_aa)、同義氨基酸數(shù)(L_sym)、氨基酸組分指數(shù)(平均親水性值和芳香性值)、A3s、T3s、G3s、C3s、GC3s、ENC、CAI、CBI、GC含量等密碼子使用特性進(jìn)行了分析,綜合分析表明擬南芥POT基因的RSCU值大于1的密碼子多以U(T)或A結(jié)尾,說(shuō)明密碼子以U(T)或A結(jié)尾的出現(xiàn)頻率較高,這些是基因組偏愛的密碼子。高表達(dá)的基因相對(duì)于其他低表達(dá)或中等表達(dá)的基因具有更為強(qiáng)烈的密碼子使用上的偏好,擬南芥POT基因密碼子使用上的偏向性還受GC3s、C3s的影響,GC3s、C3s含量越小,密碼子發(fā)生偏向使用的趨勢(shì)越明顯。
不同物種的不同基因?qū)γ艽a子的偏好特性各有不同,劉慶坡等[12]通過(guò)單、雙子葉植物基因組密碼子偏好特性的比較研究證明雙子葉植物偏向使用以A或T結(jié)尾的密碼子,而單子葉植物則偏向使用以C或G結(jié)尾的密碼子。本研究結(jié)果與其一致,擬南芥POT基因偏向使用以U(T)或A結(jié)尾的密碼子。本研究確定的擬南芥POT基因密碼子偏向性可為今后研究該基因的進(jìn)化、克隆、表達(dá)調(diào)控等提供重要的理論依據(jù)。
參考文獻(xiàn):
[1] QUINTERO F J, BLATT M R. A new family of K+ transporters from Arabidopsis that are conserved across phyla[J]. FEBS letters,1997,415(2):206-211.
[2] KIM E J, KWAK J M, UOZUMI N, et al. AtKup1: an Arabidopsis gene encoding high-affinity potassium transport activity[J]. The Plant Cell Online,1998,10(1):51-62.
[3] FU H H,LUAN S. AtKUP1:A dual-affinity K+ transporter from Arabidopsis[J]. The Plant Cell Online,1998,10(1):63-73.
[4] 范三紅,郭藹光,單麗偉,等. 擬南芥基因密碼子偏愛性分析[J]. 生物化學(xué)與生物物理進(jìn)展,2003,30(2):221-225.
[5] 續(xù) 晨,蔡小寧,錢保俐,等.葡萄基因組密碼子使用偏好模式研究[J]. 西北植物學(xué)報(bào),2012,32(2):409-415.
[6] ZHOU T, GU W, MA J, et al. Analysis of synonymous codon usage in H5N1 virus and other influenza A viruses[J]. Biosystems,2005,81(1):77-86.
[7] 張曉峰,薛慶中. 水稻和擬南芥NBS-LRR基因家族同義密碼子使用偏好的比較[J].作物學(xué)報(bào),2005,31(5):596-620.
[8] 楊 平.擬南芥NHX基因密碼子使用特性分析[J]. 南京曉莊學(xué)院學(xué)報(bào),2011(6):80-84.
[9] Codon usage database[EB/OL].http://www.kazusa.or.jp/codon/.
[10] JIANG Y, DENG F, WANG H L, et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology,2008,153(12):2273-2282.
[11] 劉漢梅,何 瑞,張懷渝,等. 擬南芥和水稻轉(zhuǎn)錄因子WRKY同義密碼子的偏好性分析[J]. 四川農(nóng)業(yè)大學(xué)學(xué)報(bào),2010,28(1):20-27.
[12] 劉慶坡,馮 英,董 輝. 20個(gè)物種同義密碼子偏性的比較分析[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,32(7):67-71.