鄭曉寧,李麗莎,李祥龍,2
(1.河北農(nóng)業(yè)大學,河北保定071000;2.河北科技師范學院,河北秦皇島066004)
毛色是影響狐貍毛皮品質(zhì)的重要質(zhì)量性狀,毛色形成主要受黑色素細胞內(nèi)產(chǎn)生的黑色素種類及其分布情況的影響[1]。研究表明,黑色素的合成和分泌是一項復雜的調(diào)控過程,有多種信號分子參與并相互關(guān)聯(lián)[2]。前黑素小體蛋白(PMEL)作為重要的信號分子,通過黑素小體纖維的合成來參與其調(diào)控過程[3]。作為黑素小體形成過程中的關(guān)鍵蛋白[4],前黑素小體蛋白(PMEL)是哺乳動物黑色素合成和沉積重要的前提條件,因此分析PMEL基因的表達機制對動物黑色素機制的研究有重要意義[5]。
從基因到蛋白質(zhì)的合成,密碼子是聯(lián)系mRNA和氨基酸的橋梁。已知編碼氨基酸的共有61種密碼子,共編碼20種氨基酸,即每種氨基酸可由1個至多個密碼子編碼,而這種對應同一氨基酸的密碼子稱為同義密碼子[6](synonymous codon)。研究表明,同義密碼子使用概率是不同的,將基因優(yōu)先使用的密碼子稱為最優(yōu)密碼子(optimal codon),此現(xiàn)象稱為密碼子偏性[7-8]。產(chǎn)生的這種密碼子偏性可能與該基因的表達水平、蛋白質(zhì)結(jié)構(gòu)等相關(guān)[9]。因此對PMEL基因進行密碼子偏好性分析,不僅能夠揭示該基因的表達機制,同時也可為其選擇合適的表達系統(tǒng)提供科學依據(jù)[10]。本研究通過Usage Codon在線程序和CodonW軟件對狐貍PMEL基因的密碼子進行偏好性分析,并與不同物種PMEL基因密碼子偏好性進行比較,利用SPSS 19.0系統(tǒng)對其同義密碼子的相對使用度進行系統(tǒng)聚類分析,為進一步研究該基因的蛋白質(zhì)表達機制提供理論依據(jù)。
本研究所用的狐貍PMEL基因核苷酸序列由筆者所在實驗室自主克隆所得,全長1 977 bp,編碼659個氨基酸。其余14個物種PMEL基因的完整mRNA序列數(shù)據(jù)均來自NCBI上的GenBank數(shù)據(jù)庫(表1)。
表1 PMEL基因的完整編碼區(qū)來源
篩選目的基因mRNA序列原則如下:不同物種與狐貍之間親緣距離不同;不同物種目的基因mRNA序列完整;該物種還有目的基因完整的基因序列可尋;對于多拷貝基因僅統(tǒng)計1次。
本研究首先利用Usage Codon在線程序?qū)P者所在實驗室自主克隆的狐貍PMEL基因mRNA序列進行相關(guān)分析,包括氨基酸使用的各個三聯(lián)體密碼子的數(shù)量(number)、頻率(frequency)、比例(fraction)。然后運用 CodonW軟件計算各個物種CDS區(qū)的GC含量(即GC值)、GC3s值(指G+C在第3位堿基的總量)、相對同義密碼子使用度(relative synonymous codon usage,簡稱 RSCU)、CBI值(指密碼子偏愛指數(shù))、FOP值(指最優(yōu)密碼子使用頻率)、ENc值(指有效密碼子數(shù))。最后用SPSS 19.0系統(tǒng)對所得的15條PMEL基因的RSCU值進行歐式平方距離系數(shù)的計算并聚類[11]。在聚類的過程中不考慮色氨酸(Trp)、甲硫氨酸(Met)和3個終止密碼子,不同物種基因間的距離規(guī)定為同義密碼子相對使用度的歐式平方距離[12]。計算2個基因a、b間密碼子使用偏性的歐式距離系數(shù)公式如下:
本研究利用Codon Usage在線程序和CodonW軟件計算出狐貍PMEL基因密碼子偏好性,見表2。其中比例(Fraction值)表示各個密碼子在編碼該氨基酸的密碼子中所占的比例;頻率(Frequency值)表示密碼子在編碼基因的總密碼子中出現(xiàn)的頻率,即在1 000個密碼子中出現(xiàn)的次數(shù)[13]。RSCU值是指某一特定的密碼子在編碼對應氨基酸的同義密碼子中的相對概率。當RSCU值>1時,表明該密碼子的使用頻率較高[14]。
由表2可知,狐貍PMEL基因密碼子中有34個RSCU值大于1的密碼子,其中共有14個以A或T結(jié)尾的密碼子,包括 GCA、GCT、GAT、GGT、CAT、ATT、AAT、CCA、CCT、AGA、TCT、ACA、ACT、TGA,其余20個均以 G、C結(jié)尾,且其密碼子頻率和數(shù)量均有高于以A、T結(jié)尾的密碼子的趨勢。
最明顯的特性是狐貍PMEL基因的密碼子中RSCU值>2的有3個密碼子,分別是CTG、GTG、TGA。除了TGA終止密碼子外,另外2個密碼子所占的頻率均>45%,數(shù)量也均在30個以上,充分證明了狐貍PMEL基因尤其偏好以G、C結(jié)尾的密碼子。同時也說明狐貍PMEL基因的亮氨酸、纈氨酸、終止密碼子偏好使用的密碼子分別是CTG、GTG、TGA。
表2 狐貍PMEL基因密碼子偏好性分析
續(xù)表2
本研究利用CodonW軟件計算出狐貍PMEL基因的ENc值、CG3s值、GC值、FOP值和 CBI值分別為 51.64、0.564、0.571、0.451和 0.075(表 3)。
其中ENc值又稱為有效密碼子數(shù),其范圍是20~61之間,越是趨近61意味著密碼子偏好性越弱[15-16]。狐貍PMEL基因的ENc值為51.64,表明狐貍PMEL基因在編碼氨基酸時出現(xiàn)的頻率較為一致。GC3s則表示三聯(lián)體密碼子第3位中的G、C堿基含量在第3位堿基總量中所占的比率[17]。狐貍PMEL基因編碼區(qū)GC值>0.5,表明基因在整個編碼區(qū)序列中G+C含量>A+T含量;GC3s>0.5,表明PMEL基因偏好使用以G、C結(jié)尾的密碼子,這與表2結(jié)論一致。FOP反映了該基因最優(yōu)密碼子使用頻率;狐貍PMEL基因的FOP值達到了0.451(<0.5);CBI密碼子偏愛指數(shù)達到了 0.075,表明其中個別的密碼子是優(yōu)越使用的,與表2結(jié)論一致(當CBI=1,表明所有密碼子均為偏向使用,當CBI=0時,表明其完全隨機使用[18])。
由表3可知,熊貓ENc值>55,說明熊貓PMEL基因是低表達基因。從數(shù)據(jù)可知,除了熊貓外其余14個物種ENc值均在40~55之間,表明狐貍、家犬等的PMEL基因表達水平一般(ENc值<30可確定為高表達水平)[15]。
所有物種除家牛和小鼠外,GC含量和GC3s值均高于0.5,表明這幾個物種 PMEL基因?qū)?G、C均有一定的偏好性。其中,狐貍和家貓的GC含量和GC3s值最為接近,這與系統(tǒng)聚類結(jié)果相符。所有物種的FOP值均<0.5,CBI指數(shù)均>0,表明其中個別的密碼子被優(yōu)越使用,但最佳密碼子數(shù)較低。
利用Codon Usage在線程序和CodonW軟件計算出各物種PMEL基因的密碼子偏好性(表4),通過SPSS系統(tǒng)計算出各物種之間的歐式距離系數(shù)(表5),從而對各物種PMEL基因的密碼子偏好性進行聚類分析得到圖1,并與系統(tǒng)發(fā)育樹建立的動物學分類(圖2)進行比較。
表3 不同物種 PMEL基因的 CBI、FOP、ENc、GC3s、GC值
表4 不同物種PMEL基因的RSCU值
續(xù)表4
表5 不同物種PMEL基因間密碼子使用偏性的歐式平方距離系數(shù)
由表5可知,狐貍、獵豹和家貓之間的距離較小;其中狐貍和家貓之間距離較為接近,僅為1.826。狐貍和與其序列同源性最高的家犬的距離系數(shù)>15。人和黑猩猩的距離差異比人和山羊的距離差異大,提示基于密碼子偏性的聚類分析結(jié)果與動物學分類不一致[19]。
由圖1可知,物種聚為3大類,黑猩猩、獼猴、家馬、雪貂、家犬聚為一類;家牛、熊貓、家兔和小鼠聚為一類;人、山羊、刺猬與家貓、狐貍、獵豹聚為一大類。其中,家貓、獵豹和狐貍距離最為接近,聚為一類,該結(jié)果與表5結(jié)果一致。圖1聚類結(jié)果同樣反映了基于各物種之間的歐式距離系數(shù)建立起來的聚類分析與動物學分類不一致。這也反映基于動物密碼子偏性的系統(tǒng)聚類法與親緣關(guān)系不一致,例如原本和狐貍同源性很高的家犬[20],卻與狐貍的距離較遠,達到了15.110。
通過對狐貍PMEL基因的密碼子使用特征的分析,發(fā)現(xiàn)狐貍PMEL基因偏好使用以G/C結(jié)尾的密碼子,存在34個RSCU值>1的密碼子,其中20個為以G、C結(jié)尾的密碼子,且其密碼子數(shù)和頻率均較高。最顯著的特征是存在RSCU值>2的3個密碼子CTG、GTG、TGA,前2者分別是亮氨酸、纈氨酸偏性使用的密碼子,兩者數(shù)量和頻率均較高,TGA為狐貍PMEL基因的終止密碼子,這與Sun等研究的TGA主要出現(xiàn)于較復雜的真核生物中,尤其是脊柱動物的結(jié)果[21]一致。在對比不同物種PMEL基因密碼子使用情況后發(fā)現(xiàn),15個物種除了熊貓基因表達水平較低外,狐貍、家貓、家犬和獵豹等14個物種的PMEL基因表達水平為中等。其中,家貓和狐貍各項值最為接近。
基于PMEL基因同義密碼子相對使用度的聚類分析結(jié)果也顯示,狐貍和家貓聚為一類,與同源性較高的家犬未分到一類,即基于密碼子偏性的系統(tǒng)聚類分析結(jié)果和基于各物種PMEL基因的編碼區(qū)形成的系統(tǒng)發(fā)育樹結(jié)果不一致。
研究表明,由于影響密碼子使用的因素眾多,引起各物種同一基因密碼子使用偏性的原因也各不相同,導致傳統(tǒng)分類相近的物種在密碼子使用偏性方面也仍存在一定差異[27]。這也說明對物種的分類不應僅限于對堿基序列組成的分析。Ning等研究發(fā)現(xiàn),核苷酸成分、GC3s、基因密碼子長度、表達水平、突變壓力和自然選擇等均對密碼子使用偏性的形成具有重要作用[22]。Zhao等研究發(fā)現(xiàn),突變壓力和自然選擇是影響密碼子使用偏性形成的最主要原因[23]。所謂突變壓力是指突變對于密碼子使用產(chǎn)生影響[24],主要表現(xiàn)為如果細胞內(nèi)GC的突變增多,則基因組傾向于使用更多的GC,這時由于密碼子的簡并性也將傾向于使用更多的GC。劉靜也認為,基因組內(nèi)非編碼區(qū)GC含量也是表示突變壓力方向的一個指標[25]。除此之外,Singh等在研究腦炎病毒的試驗中也發(fā)現(xiàn),突變壓力是影響核糖核酸病毒密碼子使用偏性的一個主要因素[26]。這與Bulmer提出的“選擇—突變—漂變”學說中描述的密碼子的使用偏性特征與基因組中的突變壓力有關(guān)的觀點一致。因此,造成狐貍和同源性較高的家犬在PMEL基因密碼子使用上的結(jié)果不同,除了可能與剪接體不同有關(guān)外,與自然選擇和突變壓力也具有較大的關(guān)系。同樣,狐貍和家貓聚為一類,兩者的GC3s和GC含量也最為接近,也說明兩者所受到的突變壓力幾乎是相同的。相較于傳統(tǒng)的系統(tǒng)發(fā)育分析,本研究中基于PMEL基因同義密碼子相對使用度的聚類分析結(jié)果更能反映前黑素小體蛋白(PMEL)翻譯的遺傳信息[27]。
綜上所述,通過對比狐貍及其他14個物種PMEL基因密碼子使用偏性發(fā)現(xiàn),狐貍PMEL基因偏好使用以G/C結(jié)尾的密碼子,在密碼子偏好的使用上與家貓最相似,聚為一類。該聚類結(jié)果不僅明確了不同物種PMEL基因密碼子使用特性,在基因工程方面也可用來更準確、更有針對性地指導或提高外源基因在細胞內(nèi)的表達,為進一步研究PMEL基因的表達機制奠定了一定的基礎(chǔ)。
參考文獻:
[1]杜站宇,趙家平,宋興超,等.黑素小體在黑色素生成過程中的關(guān)鍵作用[J].畜牧獸醫(yī)學報,2016,47(8):1531-1538.
[2]劉 杰,劉 毅,胡彥競科,等.動物黑色素沉著基因 KIT和MLPH的研究進展[J].蠶學通訊,2015,35(3):16-21.
[3]高 莉,李琴琴,趙英虎,等.生物資源黑色素的研究進展[J].畜牧與飼料科學,2015,36(9):37-41.
[4]崔 嘉,孫守榮,苗魯旭,等.TYRP1基因控制動物色素形成的研究進展[J].中國畜牧獸醫(yī),2009,36(9):94-96.
[5]Kwon B S,Kim K K,Halaban R,et al.Characterization of mouse Pmel17 gene and silver locus[J].Pigment Cell Research,1994,7(6):394-397.
[6]Christianson M L.Codon usage patterns distort phylogenies from or of DNA sequences[J].American Journalof Botany,2005,92(8):1221-1233.
[7]顧萬君,馬建民,周 童,等.不同結(jié)構(gòu)的蛋白編碼基因的密碼子偏性研究[J].生物物理學報,2002,18(1):81-86.
[8]Satiou N,Nei M.The neighbor-joining method:a new method for reconstructing phylogenetic tree[J]. Molecular Biology and Evolution,1987,4(4):406-425.
[9]吳憲明,吳松鋒,任大明,等.密碼子偏性的分析方法及相關(guān)研究進展[J].遺傳,2007,29(4):420-426.
[10]周 童,馬建民,顧萬君,等.哺乳動物MHC密碼子使用概率的聚類分析[J].東南大學學報(自然科學版),2001,31(2):1-5.
[11]劉漢梅,趙 耀,顧 勇,等.幾種植物waxy基因的密碼子用法特性分析[J].核農(nóng)學報,2010,24(3):476-481.
[12]李 平,白云鳳,馮瑞云,等.籽粒莧蘋果酸酶(NAD-ME)基因密碼子偏好性分析[J].應用與環(huán)境生物學報,2011,17(1):012-017.
[13]高 莉,趙英虎,劉朝亮,等.酪氨酸酶相關(guān)蛋白1調(diào)控黑色素形成的研究進展[J].畜牧與飼料科學,2010,31(10):114-116,119.
[14]Tamura K,Dudley J,Nei M,et al.MEGA4:molecular evolutionary genetics analysis(MEGA)software version 4.0[J].Molecular Biology and Evolution,2007,24(8):1596-1599.
[15]張 樂,金龍國,羅 玲,等.大豆基因組和轉(zhuǎn)錄組的核基因密碼子使用偏好性分析[J].作物學報,2011,37(6):965-974.
[16]郭秀麗,王 玉,楊路成,等.茶樹CBF1基因密碼子使用特性分析[J].遺傳,2012,34(12):1614-1623.
[17]林 濤,倪志華,沈明山,等.高頻密碼子分析法及其在煙草密碼子分析中的應用[J].廈門大學學報(自然科學版),2002,41(5):551-554.
[18]Sharp PM,Tuohy TM,Mosurski K R.Codon usage in yeast:cluster analysis clearly differentiates highly and lowly expressed genes[J].Nucleic Acids Research,1986,14(13):5125-5143.
[19]Schmutz SM,Dreger D L.Interaction ofMC1R and PMEL alleleson solid coat colors in highland cattle[J].Animal Genetics,2013,44(1):9-13.
[20]李麗莎,李祥龍,毛艷朋,等.山羊TYRP1基因編碼蛋白結(jié)構(gòu)及功能的生物信息學分析[J].貴州農(nóng)業(yè)科學,2015,43(10):147-152.
[21]Sun J,Ming C,Xu JL,et al.Relationships among stop codon usage bias,its context,isochores,and gene expression level in various eukaryotes[J].Journal of Molecular Evolution,2005,61(4):437-444.
[22]Ning L I,Sun M H,Jiang Z S,et al.Genome-wide analysis of the synonymous codon usage patterns in apple[J].Journal of Integrative Agriculture,2016,15(5):983-991.
[23]Zhao Y C,Hao Z,Xu A Y,et al.Analysis of codon usage bias of envelope glycoprotein genes in nuclear polyhedo sisvirus(NPV)and its relation to evolutional[J].BMC Genomics,2016,17(1):677.
[24]Subramanian A,Sarkar R R.Comparison of codon usage bias across Leishmania and Trypanosomatids to understand mRNA secondary structure,relative protein abundance and pathway functions[J].Genomics,2015,106(4):232-241.
[25]劉 靜.植物線粒體基因組密碼子偏性的特征和形成原因的研究[D].南京:南京大學,2011:2-8.
[26]Singh N K,Tyagi A,Kaur R,et al.Characterization of codon usage pattern and influencing factors in Japanese encephalitis virus[J].Virus Research,2016,221:58-65.
[27]Landais I,Ogliastro M,Mita K,et al.Annotation pattern of ESTs from Spodoptera frugiperda Sf9 cells and analysis of the ribosomal protein genes reveal insect-specific features and unexpectedly low codon usage bias[J].Bioinformatics,2003,19(18):2343-2350.