亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于一種新的偽氨酸組成預(yù)測(cè)蛋白質(zhì)折疊速率

        2015-04-20 03:26:50單萌萌白鳳蘭
        關(guān)鍵詞:二肽氨酸多肽

        單萌萌,白鳳蘭

        (大連交通大學(xué) 理學(xué)院,遼寧 大連 116052)

        ?

        基于一種新的偽氨酸組成預(yù)測(cè)蛋白質(zhì)折疊速率

        單萌萌,白鳳蘭

        (大連交通大學(xué) 理學(xué)院,遼寧 大連 116052)

        以chou等人提出的偽氨酸組成方法為基礎(chǔ),從蛋白質(zhì)序列的氨基酸組成信息和順序信息著手,提出一種新的偽氨酸組成方法,即利用新偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸和氨基酸頻率構(gòu)造了23維向量來(lái)描述蛋白質(zhì)序列,進(jìn)而建立多元線性回歸函數(shù)對(duì)蛋白質(zhì)折疊速率進(jìn)行預(yù)測(cè),經(jīng)jackknife檢驗(yàn)相關(guān)系數(shù)達(dá)到了0.84.并與其他兩種方法進(jìn)行比較使本文的結(jié)論得到較好的驗(yàn)證. 同時(shí)驗(yàn)證了本文提取的特征參數(shù)對(duì)蛋白質(zhì)折疊速率有一定的影響.

        蛋白質(zhì)折疊;偽氨酸;線性回歸函數(shù)

        0 引言

        蛋白質(zhì)折疊問(wèn)題的研究是計(jì)算分子生物學(xué)和生物信息學(xué)中的重要內(nèi)容,對(duì)于理解蛋白質(zhì)的折疊機(jī)理和分析蛋白質(zhì)折疊的決定性因素來(lái)說(shuō),能夠精確的預(yù)測(cè)出蛋白質(zhì)的折疊速率就顯得非常重要,只有當(dāng)?shù)鞍踪|(zhì)折疊成正確的具有三維結(jié)構(gòu)的天然構(gòu)象時(shí)才能發(fā)揮其正確的物理屬性.盡管蛋白質(zhì)的總體結(jié)構(gòu)非常復(fù)雜,但是在化學(xué)上它們都是由20種天然氨基酸按照特定的順序并且通過(guò)肽鍵連接而成的具有有限長(zhǎng)度的多肽鏈.蛋白質(zhì)之間最根本的差別就在于其組成多肽鏈的氨基酸序列和長(zhǎng)度有所不同.從不同生物體中發(fā)現(xiàn)的氨基酸已有180多種,但是參與蛋白質(zhì)組成的常見(jiàn)的氨基酸只有 20 種,即常見(jiàn)的天然氨基酸.近年來(lái),許多科學(xué)家開(kāi)始從蛋白質(zhì)氨基酸序列著手預(yù)測(cè)蛋白質(zhì)折疊速率,chou等人提出了經(jīng)典的偽氨酸組成方法[1]來(lái)描述蛋白質(zhì)序列的順序信息.本文在chou等人工作的基礎(chǔ)上,從氨基酸的順序信息和組成信息著手,提出一種新的偽氨酸組成方法,即利用偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸等特征參數(shù)構(gòu)造空間向量來(lái)描述蛋白質(zhì)序列,進(jìn)而建立多元線性回歸函數(shù)對(duì)蛋白質(zhì)折疊速率進(jìn)行預(yù)測(cè).

        1 材料

        從Guo[3-4]、Xing[5]、Cheng[6]等大量文章中選取已知實(shí)驗(yàn)折疊速率的89個(gè)蛋白質(zhì),去掉重復(fù)蛋白和文章標(biāo)識(shí)長(zhǎng)度與蛋白質(zhì)數(shù)據(jù)庫(kù)長(zhǎng)度不符的蛋白質(zhì),最終得到65個(gè)蛋白質(zhì),其中36個(gè)二肽蛋白,29個(gè)多肽蛋白,氨基酸序列信息均從數(shù)據(jù)庫(kù)(http://www.rcsb.org/pdb/home/home.do)中獲得.

        2 原理和方法

        2.1 偽氨酸組成

        對(duì)于蛋白質(zhì)序列S=s1s2…sL

        其中氨基酸si∈ψ(i=1,2,…,20),ψ={A,W,C,D,E,F,G,H,I,Y,K,L,M,N,V,P,Q,R,S,T},考慮其在序列S中的位置,

        其中,l代表氨基酸殘基在序列Sw中所在的位置,l∈[1,L].

        這樣,我們把蛋白質(zhì)序列S轉(zhuǎn)換成20維的特征向量,表示為:

        V(S)=(V1,V2,…,V20)

        新的偽氨酸組成定義如下:

        其中:

        其中,spi(i=1,2,3,…,L)表示氨基酸極性值,氨基酸極性索引值如表1.

        2.2 蛋白質(zhì)的平均屬性

        對(duì)于蛋白質(zhì)序列S=s1s2…sL

        其平均屬性定義如下:

        其中,qi為第i氨基酸的某個(gè)物理化學(xué)性質(zhì),N為氨基酸殘基的個(gè)數(shù).

        本文取氨基酸的平均中程接觸Nm,其索引值見(jiàn)表1.

        2.3 實(shí)驗(yàn)結(jié)果分析

        為確定λ的取值,我們分別取λ從1~30從而得到30個(gè)向量φ1=(R1),φ2=(R1,R2),……,φ30=(R1,R2,…,R30),依次加入到特征向量V(S)中,得到向量(V(S),φ1), (V(S),φ2),……,(V(S),φ30),進(jìn)行30次試驗(yàn),結(jié)果見(jiàn)圖1.

        圖1 階數(shù)λ對(duì)預(yù)測(cè)結(jié)果的影響

        由圖1可以看出,當(dāng)λ取2時(shí)相關(guān)系數(shù)達(dá)到0.82,固選取λ值為2.

        由以上偽氨酸的組成方法使原來(lái)的蛋白質(zhì)序列S=s1s2…sL變成新序列F=F1F2…F22.

        在建序列F的基礎(chǔ)上添加向量Veve,得到23維向量Vlast=(F,Veve),建立關(guān)于折疊速率與Vlast的多遠(yuǎn)線性回歸函數(shù):

        利用式(6)計(jì)算了36個(gè)二肽蛋白和29個(gè)多肽蛋白的折疊速率預(yù)測(cè)值,并對(duì)預(yù)測(cè)值進(jìn)行jackknife檢驗(yàn).回歸分析及jackknife檢驗(yàn)結(jié)果見(jiàn)表2,預(yù)測(cè)值與實(shí)驗(yàn)值散點(diǎn)圖見(jiàn)圖2.

        表2 相關(guān)系數(shù)r和p值

        由表2結(jié)果可知對(duì)于二肽蛋白,jackknife檢驗(yàn)相關(guān)系數(shù)為0.48,p≤0.05,對(duì)于多肽蛋白,jackknife檢驗(yàn)相關(guān)系數(shù)僅為0.30,且p≥0.05,由圖2也可以看出二肽蛋白質(zhì)的實(shí)驗(yàn)值與預(yù)測(cè)值具有較顯著的線性關(guān)系,多肽蛋白質(zhì)的實(shí)驗(yàn)值與預(yù)測(cè)值的線性關(guān)系不顯著,但是二肽和多肽混合蛋白質(zhì)的實(shí)驗(yàn)值與預(yù)測(cè)值的線性關(guān)系顯著,jackknife檢驗(yàn)相關(guān)系數(shù)達(dá)到0.84,p≤0.05.

        圖2 預(yù)測(cè)值與實(shí)驗(yàn)值散點(diǎn)圖注:□為二肽蛋白○為多肽蛋白

        本文所提出的偽氨酸構(gòu)造方法預(yù)測(cè)蛋白質(zhì)折疊速率具有一定的可行性,由對(duì)多肽蛋白質(zhì)檢驗(yàn)結(jié)果的p值可以推測(cè)更試用于二肽蛋白.

        3 與其他方法對(duì)比

        本文方法和其他兩種方法進(jìn)行比較結(jié)果見(jiàn)表3(由jackknife檢驗(yàn)得到).

        表3 相關(guān)系數(shù)、p值、F值、標(biāo)準(zhǔn)誤差

        注:方法Fold-rate來(lái)源于網(wǎng)站http://www.csbio.sjtu.edu.dn/bioinf/FoldingRate/;方法CI來(lái)源于網(wǎng)站http://sdbi.sdut.edu.cn/FDserver.

        觀察表3可得,本文方法通過(guò)jackknife得到的相關(guān)系數(shù)r和F均大于其他兩種方法,而P值和標(biāo)準(zhǔn)誤差σ均小于其他兩種方法,這說(shuō)明本文的方法優(yōu)于其他兩種方法,由此可以推測(cè)蛋白質(zhì)序列中氨基酸的物化屬性及位置信息對(duì)蛋白折疊有一定的影響.

        4 結(jié)論

        本文主要從蛋白質(zhì)的一級(jí)結(jié)構(gòu)出發(fā),以chou等人提出的偽氨酸組成方法為基礎(chǔ),從蛋白質(zhì)序列中氨基酸的順序信息和組成信息著手,提出一種新的偽氨酸組成方法,即利用新偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸構(gòu)造了23維向量來(lái)描述蛋白質(zhì)序列,進(jìn)而建立多元線性回歸函數(shù)對(duì)蛋白質(zhì)折疊速率進(jìn)行預(yù)測(cè),通過(guò)散點(diǎn)圖的描述可以直觀看出通過(guò)預(yù)測(cè)方程所得預(yù)測(cè)值與實(shí)驗(yàn)值具有顯著的線性關(guān)系.本文選擇應(yīng)用jackknife檢驗(yàn)方法對(duì)預(yù)測(cè)模型的可行性進(jìn)行檢驗(yàn),結(jié)果顯示二肽蛋白相關(guān)系數(shù)為0.48,多肽蛋白相關(guān)系數(shù)為0.30,全部蛋白相關(guān)系數(shù)達(dá)到0.84,并與其他兩種方法進(jìn)行比較使本文的結(jié)論得到較好的驗(yàn)證.但是本文方法的不足之處在于對(duì)于多肽蛋白沒(méi)有通過(guò)jackknife檢驗(yàn)(p≥0.05),說(shuō)明本文所選取的特征參數(shù)對(duì)于多肽蛋白質(zhì)折疊速率影響不大.尋找對(duì)多肽蛋白質(zhì)折疊速率有影響的特征參數(shù)值得進(jìn)一步去研究.

        [1]CHOUK.Predictionofproteincellularattributesusingpesudo-aminoacidcomposition[J].Proteins,2001,43: 246-255.

        [2]GROMIHAMM,THANGAKANIAM,SELVARAJS.FOLD-RATE:predictionofproteinfoldingratesfromaminoacidsequence[J].NucleicAcidsResearch,2006,34(suppl2):70-74.

        [3]GUOJianxiu,RAONini,XUShanglei,etal.Predictingproteinfoldingratesusingpseudoaminoacidcomposition[J].BioinformaticsandBiomedicalEngineering,2010(1):1-4.

        [4]GUOJIANIU,ZHANGHY.Directcorrelationbetweenprotein’foldingratesandtheiraminoacidcompositions:anabinitiofoldingratepredition[J].Proteins,2006,65(2):362-372.

        [5]邢達(dá)杰,褚綺,林廣周,等.從序列預(yù)測(cè)蛋白質(zhì)折疊速率[J].天津理工大學(xué)學(xué)報(bào),2008,24(6):18-21.

        [6]CHENGXIANG,XIAOXUAN,WUZHICHENG,etal.SWFoldRate:Predictingfoldingratesfromaminoacidsequnencewithsliding[J].Proteins,2012,81(1):140-148.

        Prediction of Protein Folding Rates based on new Pseudo-Acid Composition

        SHAN Mengmeng,BAI Fenglan

        (School of Mathematics and Physics,Dalian Jiaotong University,Dalian 116028,China)

        Based on Pseudo-acid composition,by chou a new pseudo-acid composition is proposed from the amino acid composition information and the order of the protein sequence.Combining the autocorrelation function with the Nm and frequency of amino acids,23-dimensional vector is constructed,and a protein sequence can be described by the 23-dimensional vector and to create multiple linear regression function to predicte protein folding rate.By jackknife test,the correlation coefficient is 0.84.Comparison proves that the new method is batter than the other two methods.

        predicte protein folding rate;Pseudo-acid;linear regression function

        1673-9590(2015)03-0113-03

        2014-05-20

        單萌萌(1989-),女,碩士研究生;白鳳蘭(1963-),女,教授,博士,主要從事蛋白質(zhì)折疊速率預(yù)測(cè)方面的研究E-mail:liaimeng214@126.com.

        A

        猜你喜歡
        二肽氨酸多肽
        大型海藻中環(huán)二肽類抑藻活性化合物的分離純化
        蒜氨酸抗菌機(jī)制研究
        左旋多巴與脯氨酸或谷氨酸構(gòu)成的環(huán)二肽的合成及其DPPH自由基清除活性測(cè)試
        高多肽含量苦瓜新品種“多肽3號(hào)”的選育
        電化學(xué)發(fā)光分析法測(cè)定糖尿病相關(guān)二肽
        二肽的生物合成及應(yīng)用研究進(jìn)展
        高羊毛氨酸硒提高豬肌肉中硒沉積
        廣東飼料(2016年7期)2016-12-01 03:43:36
        抗HPV18 E6多肽單克隆抗體的制備及鑒定
        胎盤多肽超劑量應(yīng)用致嚴(yán)重不良事件1例
        徐寒梅:創(chuàng)新多肽藥物研究與開(kāi)發(fā)
        亚洲国产成人极品综合| 中文字幕日韩精品美一区二区三区| 国产精品亚洲在钱视频| 国产在线一区二区三区乱码| 少妇下面好紧好多水真爽播放| 免费人成又黄又爽的视频在线 | 成人毛片一区二区| 夜夜春精品视频| 中文字幕一区二区三区喷水| av剧情演绎福利对白| 日产无人区一线二线三线乱码蘑菇| 97超在线视频免费| 国产一级一厂片内射视频播放 | 深夜福利国产| 精品亚洲国产日韩av一二三四区| 国产亚洲精品久久久闺蜜| 红杏亚洲影院一区二区三区| 日日噜噜夜夜狠狠久久av| 日本黄色3级一区二区| 亚洲av无码久久精品狠狠爱浪潮 | 亚洲熟伦在线视频| 久久日韩精品一区二区| 亚欧免费无码aⅴ在线观看| 欧美在线区| 日本伦理美乳中文字幕| 欲香欲色天天天综合和网| 亚洲av第一页国产精品| 国产美女裸身网站免费观看视频| 丝袜av乱码字幕三级人妻| 欧美日韩亚洲中文字幕二区| 日韩精品中文字幕无码专区| 亚洲国产成人av第一二三区| 男人天堂网2017| 久久人人爽人人爽人人片av麻烦 | 免费一区二区三区久久| 亚洲av人片在线观看调教| 国内精品免费一区二区三区| 老师翘臀高潮流白浆| 无码国产日韩精品一区二区| 亚洲国产系列一区二区| 一夲道无码人妻精品一区二区 |