亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人類組成型和可變外顯子的密碼子偏性及聚類分析

        2014-09-10 18:06:07張占軍邢永強(qiáng)王成愛
        湖北農(nóng)業(yè)科學(xué) 2014年11期
        關(guān)鍵詞:偏性內(nèi)含子密碼子

        張占軍+邢永強(qiáng)+王成愛

        摘要:通過計(jì)算人類組成型外顯子和可變外顯子的RSCU值,對(duì)兩種外顯子的RSCU值進(jìn)行了比較?結(jié)果表明,除了UAG?UGA?UAA 3個(gè)終止密碼子外,兩種外顯子的密碼子偏性都是相同的?對(duì)30條可變外顯子和30條組成型外顯子序列的RSCU值進(jìn)行聚類分析,聚類結(jié)果不能把兩種外顯子區(qū)別開,證明兩種外顯子之間的密碼子偏性是相同的?對(duì)這60條序列的HI進(jìn)行了聚類分析,聚類結(jié)果沒有把兩種外顯子分開?所以外顯子序列中沒有組成型剪接和可變剪接的信息?

        關(guān)鍵字:人類;組成型外顯子;可變外顯子;密碼子偏性;聚類

        中圖分類號(hào):Q52文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):0439-8114(2014)11-2675-04

        Codon Bias and Cluster Analysis of the Constitutive Exons and

        the Alternative Exons of Human

        ZHANG Zhan-jun,XING Yong-qiang,WANG Cheng-ai

        (School of Mathematics, Physics and Biological Engineering,Inner Mogolia University of Science &

        Technology,Baotou 014010, Inner Mogolia,China)

        Abstract: RSCU of the constitutive exons and alternative exons of human were calculated. Two kinds of exons RSCU values were compared. The results showed that every codon bias was the same in two kinds of exons, except three stop codons(UAG,UGA,UAA). 30 constitutive exon sequences and 30 alternative exon sequences were selected to calculate RSCU values of them. The cluster analysis did not distinguish two kinds of exons, proving that the codon biases were the same between the two kinds of exons. HI of the 60 sequences were calculated and used to cluster analysis. It was not able to separate the two kinds of exons. It is indicated that there is no constitutive splicing and alternative splicing information in the exon sequences.

        Key words: human;constitutive exons;alternative exons;codon bias;clustering

        基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(61271448)

        可變剪接是多細(xì)胞真核生物蛋白質(zhì)多樣性的主要來源,且由于可變剪接的存在使得剪接機(jī)制變得異常復(fù)雜[1]?基于深度測(cè)序技術(shù),估計(jì)超過95%的人類多外顯子基因存在可變剪接現(xiàn)象?可變剪接主要包括5種類型:可變5剪接(Alternative 5 splicing)?可變3剪接(Alternative 3 splicing)?外顯子跳躍(Exon skipping)?內(nèi)含子保留(Intron retention)?互斥外顯子(Mutually exclusive exons)?如果把外顯子分為兩類,可以分為組成型外顯子(Constitution exons)和可變外顯子(Variable exons)?上述5種外顯子均屬于可變外顯子?

        密碼子具有簡(jiǎn)并性,即組成蛋白質(zhì)的每個(gè)氨基酸可能由一個(gè)到多個(gè)密碼子編碼?在基因中, 同義密碼子的使用并不是完全均勻的?在不同物種?不同生物體中,密碼子的使用存在很大的差異[2]?在一些單細(xì)胞生物中,如在大腸桿菌和酵母中,高表達(dá)的基因密碼子使用的偏性一般比較大,主要是由于基因的堿基組成和mRNA翻譯時(shí)tRNA的選擇造成的?

        目前,對(duì)于組成型和可變外顯子的研究主要集中在用IDQD?SVM以及自由能等進(jìn)行分類?有些研究認(rèn)為密碼子偏性與諸多因素有關(guān), 如氨基酸組分[3]?mRNA的二級(jí)結(jié)構(gòu)[4]?翻譯起始效應(yīng)?G+C含量?基因長(zhǎng)度[5,6]?tRNA的豐度[7]?蛋白質(zhì)的結(jié)構(gòu)[8]等?

        鑒于此,筆者研究了組成型外顯子和可變外顯子的密碼子偏向性?非均勻性及其聚類?研究組成型外顯子和可變外顯子的密碼子偏向性,以及通過RSCU值和HI值聚類檢驗(yàn)其是否可以聚成兩類,有助于分析發(fā)生可變剪接的序列信息是在外顯子中還是在內(nèi)含子中,以及分析剪接的具體機(jī)制?

        1材料與方法

        所用的可變剪接的數(shù)據(jù)來源于ASTD數(shù)據(jù)庫(Release3)(ftp://ftp.ebi.edu.au/pub/databases/astd/altsplice /human/release3_36.35i/)[9,10],人類基因CDS序列數(shù)據(jù)來源于Ensembl(http://asia.ensembl.org/biomart/martview/04fb71801495bc0713760267933b

        b8c3)?

        1.1組成型外顯子和可變外顯子的來源

        由ASTD庫的AltSplice-rel3.exon.txt庫?AltSplice-rel3.events.txt庫以及AltSplice-rel3.genes.txt庫得到4 624條人類的組成型外顯子序列;由Ensembl下載得到人類基因的CDS序列211 776條?對(duì)以上兩組序列進(jìn)行比對(duì),確定出具有三周期讀碼框的人類組成型外顯子3 847條?

        由ASTD庫的AltSplice-rel3.events.txt庫和AltSplice-rel3.genes.txt庫分別得到盒式外顯子序列8 049條?內(nèi)含子保留序列5 926條?互斥外顯子序列1 509對(duì)?可變3′外顯子序列6 320對(duì)?可變5′外顯子序列3 391對(duì)?這5種序列都是可變外顯子序列?由上述5種可變外顯子序列庫和人類基因的CDS庫比對(duì)得到具有三周期讀碼框的可變外顯子9 738條?在組成型和可變外顯子密碼子偏向性分析時(shí),確定了兩類外顯子的三周期讀碼框?

        1.2密碼子偏向性計(jì)算

        1.2.1密碼子使用的相對(duì)概率計(jì)算密碼子偏性常用的指標(biāo)有密碼子使用的相對(duì)概率?密碼子有效數(shù)?密碼子偏好參數(shù)?GC3s值等?其中密碼子使用的相對(duì)概率(Relative synonymous codon usage,RSCU) 是指對(duì)于某一特定的密碼子在編碼對(duì)應(yīng)氨基酸的同義密碼子間的相對(duì)概率[11]?密碼子使用的相對(duì)概率RSCUij的計(jì)算公式為:

        RSCUij=(1)

        式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對(duì)使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

        RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

        1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

        1.3用RSCU值進(jìn)行聚類分析

        1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長(zhǎng)度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號(hào)為1-30,可變外顯子序列編號(hào)為31-60?

        1.3.2聚類方法對(duì)外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對(duì)象,將密碼子的相對(duì)使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

        這里外顯子間的距離規(guī)定為密碼子使用相對(duì)概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

        dij=(RSCUik-RSCUjk)2 (2)

        式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

        1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

        1.4用非均勻指數(shù)(HI)進(jìn)行聚類

        1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

        HI=(3)

        式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長(zhǎng)度;N(l)(l=1?2?3)為3個(gè)子序列的長(zhǎng)度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

        1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

        dij=HIi-HIj(4)

        式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

        1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

        2結(jié)果與分析

        2.1組成型和可變外顯子密碼子偏性結(jié)果

        將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

        2.2用RSCU值對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        1-30號(hào)序列為組成型外顯子,31-60號(hào)序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

        2.3用HI指數(shù)對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        計(jì)算了1-30號(hào)組成型外顯子和31-60號(hào)可變外顯子序列的HI指數(shù),并用HI指數(shù)對(duì)它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

        3結(jié)論與討論

        本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

        組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

        結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測(cè),有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長(zhǎng)度來說,內(nèi)含子比外顯子長(zhǎng)得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

        參考文獻(xiàn):

        [1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

        [2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

        [3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

        [4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

        [5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

        [6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

        [7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

        [8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

        [9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

        [10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

        [11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

        [12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

        RSCUij=(1)

        式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對(duì)使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

        RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

        1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

        1.3用RSCU值進(jìn)行聚類分析

        1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長(zhǎng)度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號(hào)為1-30,可變外顯子序列編號(hào)為31-60?

        1.3.2聚類方法對(duì)外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對(duì)象,將密碼子的相對(duì)使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

        這里外顯子間的距離規(guī)定為密碼子使用相對(duì)概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

        dij=(RSCUik-RSCUjk)2 (2)

        式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

        1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

        1.4用非均勻指數(shù)(HI)進(jìn)行聚類

        1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

        HI=(3)

        式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長(zhǎng)度;N(l)(l=1?2?3)為3個(gè)子序列的長(zhǎng)度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

        1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

        dij=HIi-HIj(4)

        式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

        1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

        2結(jié)果與分析

        2.1組成型和可變外顯子密碼子偏性結(jié)果

        將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

        2.2用RSCU值對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        1-30號(hào)序列為組成型外顯子,31-60號(hào)序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

        2.3用HI指數(shù)對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        計(jì)算了1-30號(hào)組成型外顯子和31-60號(hào)可變外顯子序列的HI指數(shù),并用HI指數(shù)對(duì)它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

        3結(jié)論與討論

        本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

        組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

        結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測(cè),有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長(zhǎng)度來說,內(nèi)含子比外顯子長(zhǎng)得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

        參考文獻(xiàn):

        [1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

        [2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

        [3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

        [4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

        [5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

        [6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

        [7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

        [8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

        [9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

        [10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

        [11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

        [12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

        RSCUij=(1)

        式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對(duì)使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

        RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

        1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

        1.3用RSCU值進(jìn)行聚類分析

        1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長(zhǎng)度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號(hào)為1-30,可變外顯子序列編號(hào)為31-60?

        1.3.2聚類方法對(duì)外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對(duì)象,將密碼子的相對(duì)使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

        這里外顯子間的距離規(guī)定為密碼子使用相對(duì)概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

        dij=(RSCUik-RSCUjk)2 (2)

        式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

        1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

        1.4用非均勻指數(shù)(HI)進(jìn)行聚類

        1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

        HI=(3)

        式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長(zhǎng)度;N(l)(l=1?2?3)為3個(gè)子序列的長(zhǎng)度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

        1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

        dij=HIi-HIj(4)

        式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

        1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

        2結(jié)果與分析

        2.1組成型和可變外顯子密碼子偏性結(jié)果

        將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

        2.2用RSCU值對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        1-30號(hào)序列為組成型外顯子,31-60號(hào)序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

        2.3用HI指數(shù)對(duì)組成型外顯子和可變外顯子聚類的結(jié)果

        計(jì)算了1-30號(hào)組成型外顯子和31-60號(hào)可變外顯子序列的HI指數(shù),并用HI指數(shù)對(duì)它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

        3結(jié)論與討論

        本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

        組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

        結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測(cè),有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長(zhǎng)度來說,內(nèi)含子比外顯子長(zhǎng)得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

        參考文獻(xiàn):

        [1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

        [2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

        [3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

        [4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

        [5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

        [6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

        [7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

        [8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

        [9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

        [10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

        [11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

        [12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

        猜你喜歡
        偏性內(nèi)含子密碼子
        線粒體核糖體蛋白基因中內(nèi)含子序列間匹配特性分析
        密碼子與反密碼子的本質(zhì)與拓展
        不同方向內(nèi)含子對(duì)重組CHO細(xì)胞中神經(jīng)生長(zhǎng)因子表達(dá)的影響
        更 正
        內(nèi)含子的特異性識(shí)別與選擇性剪切*
        10種藏藥材ccmFN基因片段密碼子偏好性分析
        中成藥(2018年7期)2018-08-04 06:04:10
        看待中藥毒性 厘清三大誤區(qū)
        中老年健康(2018年2期)2018-04-10 03:00:18
        密碼子偏性分析方法及茶樹中密碼子偏性研究進(jìn)展
        茶葉通訊(2016年2期)2016-03-24 12:30:00
        嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對(duì)dUTPase外源表達(dá)的影響
        茶樹CsActin1基因密碼子偏性分析
        茶葉通訊(2014年4期)2014-02-27 07:55:49
        国产精品电影久久久久电影网| 久热re这里精品视频在线6| 国产伦精品免编号公布| 国产在线不卡一区二区三区| 亚洲国产精品500在线观看| 亚洲av影片一区二区三区| 蜜乳一区二区三区亚洲国产| 国产 一二三四五六| 色吊丝中文字幕| 中文乱码人妻系列一区二区| 亚洲一级无码AV毛片久久| 国产一区精品二区三区四区| 极品人妻少妇av免费久久| 大地资源中文第3页| 在线观看国产成人av片| 国产成人精品aaaa视频一区| 亚洲av本道一本二本三区| 日本中文字幕一区二区有码在线| 精品欧洲av无码一区二区| 国产成人综合久久久久久| 熟女人妻一区二区在线观看 | 久久青草国产免费观看| 国产黄色三级三级三级看三级| 国产黄色av一区二区三区| 无码aⅴ免费中文字幕久久| 同性男男黄g片免费网站| 成人特黄特色毛片免费看| av网站免费观看入口| 丰满熟妇人妻av无码区 | www插插插无码视频网站| 中文字幕无码人妻丝袜| 日韩成精品视频在线观看| 日本一二三四高清在线| 国产精品泄火熟女| 少妇极品熟妇人妻无码| 久久伊人网久久伊人网| 蜜桃免费一区二区三区| 亚洲av成人噜噜无码网站| 亚洲欧洲日产国码无码久久99| 国产亚洲精品综合99久久 | av中文字幕一区不卡|