亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用預(yù)測(cè)的蛋白質(zhì)序列裂解位點(diǎn)來(lái)定位凋亡蛋白

        2012-12-31 00:00:00鄭利秦玉芳黃繼風(fēng)

        摘要:凋亡蛋白對(duì)于物種發(fā)育和生物體內(nèi)平衡的維持發(fā)揮著非常重要的作用。對(duì)凋亡蛋白的亞細(xì)胞位點(diǎn)的準(zhǔn)確預(yù)測(cè)有利于理解細(xì)胞程序性死亡的機(jī)理和其生物學(xué)功能。本文利用SignalP得到的裂解位點(diǎn)將肽鏈分成N-端信號(hào)序列和成熟端序列。通過(guò)提取兩端序列的氨基酸組分(ACC)、偽氨基酸組分(Pse-AAC)和整個(gè)鏈的立體化學(xué)特性來(lái)描述一條蛋白質(zhì)序列。最后將得到的特征向量輸入到支持向量機(jī)(SVM)中來(lái)預(yù)測(cè)其亞細(xì)胞位置。對(duì)三個(gè)凋亡蛋白基準(zhǔn)數(shù)據(jù)集進(jìn)行Jackknife驗(yàn)證,得到的總體精度分別為93.9%,87.6%,91.5%。此外我們還利用了由Reinhardt和Hubbard構(gòu)建的非凋亡蛋白基準(zhǔn)測(cè)試數(shù)據(jù)集(NNPSL數(shù)據(jù)集)來(lái)驗(yàn)證本文的方法,對(duì)于真核和原核蛋白的預(yù)測(cè)準(zhǔn)確度分別達(dá)到87.7%和94.8%。

        關(guān)鍵詞:凋亡蛋白;SingalP;偽氨基酸組分;立體化學(xué)特性;Jackknife檢驗(yàn)

        中圖分類(lèi)號(hào):Q26 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 17-0000-02

        1 介紹

        細(xì)胞凋亡,或者稱(chēng)為細(xì)胞程序性死亡,在控制細(xì)胞增殖和死亡的平衡中起著非?;A(chǔ)的作用。在一些重要的生物過(guò)程中,比如形態(tài)發(fā)生,組織內(nèi)平衡,死亡或病毒感染細(xì)胞清除,自身反應(yīng)性細(xì)胞系的免疫去除,凋亡蛋白都起了核心的作用。凋亡蛋白對(duì)多細(xì)胞生物的健康和正常發(fā)育很重要。它的異常激活會(huì)導(dǎo)致獲得性免疫缺陷綜合癥(艾滋?。?,中樞神經(jīng)系統(tǒng)退行性疾病,缺血性損傷等等。因此,理解細(xì)胞的凋亡機(jī)制對(duì)于這些疾病的臨床治療和藥物研究都有很重要的意義。為了理解蛋白質(zhì)的結(jié)構(gòu)和功能,一個(gè)重要的方法是確定其所處的亞細(xì)胞位置。確定蛋白質(zhì)亞細(xì)胞位置的方法可以分兩類(lèi),一種是基于蛋白質(zhì)信號(hào)肽的方法。Nakai和Kanehisa最早發(fā)展了一個(gè)專(zhuān)家系統(tǒng)和知識(shí)庫(kù)用N-末端分選信號(hào)來(lái)預(yù)測(cè)蛋白質(zhì)亞細(xì)胞的位置。第二種方法是Nakashima和Nishikawa提出的基于蛋白質(zhì)序列和結(jié)構(gòu)特征的方法,即利用蛋白質(zhì)氨基酸組分來(lái)區(qū)分細(xì)胞內(nèi)和細(xì)胞外蛋白質(zhì)。這些方法都取得了不錯(cuò)的效果,但是忽視了蛋白質(zhì)中各種分選信號(hào)生物信息。實(shí)際上新生蛋白質(zhì)上都存在著信號(hào)肽,決定了蛋白質(zhì)分子在細(xì)胞內(nèi)的去向。如果合理利用蛋白質(zhì)信號(hào)肽就能預(yù)測(cè)蛋白質(zhì)亞細(xì)胞的定位。鑒于此,本文根據(jù)蛋白質(zhì)信號(hào)肽和蛋白質(zhì)序列特征提出了一種新的方法。首先使用SingalP將每一個(gè)序列分成N-末端信號(hào)和成熟端序列,然后提取出每一個(gè)序列的特征。引入偽氨基酸組分的目的是避免丟掉一些序列順序信息。而氨基酸的立體化學(xué)特性(SP)則是子序列特性,引入這個(gè)特性的目的是提高預(yù)測(cè)質(zhì)量。將Pse-AAC和SP通過(guò)SignalP算法得出一個(gè)公式(表示為PSSP)?;跀?shù)據(jù)集ZD98、ZW225、CL317,用jackknife檢驗(yàn)總體預(yù)測(cè)精度分別達(dá)到了93.9%、87.6%、91.5% ,為了使結(jié)果更具有普遍性,基于NNPSL數(shù)據(jù)集,用PSSP測(cè)驗(yàn)得到的總體預(yù)測(cè)精度分別是94.8%、87.7%。

        2 方法和工具

        本文研究采用三種使用廣泛的基準(zhǔn)測(cè)試數(shù)據(jù)集:ZD98、ZW225、CL317數(shù)據(jù)集。ZD98數(shù)據(jù)集包括了43個(gè)細(xì)胞質(zhì)蛋白,13個(gè)線粒體蛋白,12種 其他的蛋白和30個(gè)等離子體的膜結(jié)合蛋白。ZW225數(shù)據(jù)集包括了70種細(xì)胞質(zhì)蛋白,89種質(zhì)膜蛋白質(zhì),25種線粒體蛋白和41種核酸蛋白質(zhì)。CL317數(shù)據(jù)集包括了6個(gè)亞細(xì)胞的定位,112種細(xì)胞質(zhì)蛋白,55種質(zhì)膜蛋白質(zhì),34種線粒體蛋白質(zhì),17種分泌蛋白和52種核酸蛋白和47種面內(nèi)質(zhì)網(wǎng)蛋白質(zhì)。這三個(gè)數(shù)據(jù)集的序列分布是由PISCES軟件計(jì)算出來(lái)的。

        蛋白質(zhì)序列包含的基本信息包括氨基酸組分。氨基酸組分是20個(gè)氨基酸在序列中的出現(xiàn)頻率,通常用一個(gè)20維的特征向量表示。

        這里的 、 表示信號(hào)肽區(qū)域和成熟蛋白區(qū)域的氨基酸組分特性, 是兩種序列中的氨基酸 的出現(xiàn)頻率??紤]到N-末端信號(hào)肽區(qū)域和成熟蛋白質(zhì)區(qū)域做出的不同貢獻(xiàn),這里引入一個(gè)參數(shù) 作為這兩個(gè)區(qū)域的加權(quán)值,其中的 的最優(yōu)值就是以0.1為間隔在0 ~10之內(nèi)搜索得到。偽氨基酸組分(PseAAC)特征提取方法是由Chou提出的,假設(shè)有一個(gè)含有L個(gè)氨基酸殘基的蛋白質(zhì)鏈L: ,根據(jù)Chou的PseAAC(偽氨基酸組分)離散模型,這里的蛋白質(zhì)樣本S可以表示成一個(gè)(20+ )維的空間向量:

        前20個(gè)組分是20種氨基酸在序列中出現(xiàn)的頻率,也就是傳統(tǒng)的氨基酸組分。后λ維表示序列的附加特征,這里選擇蛋白質(zhì)序列的近似熵作為附加特征。

        這里的 是蛋白質(zhì)出現(xiàn) 的20個(gè)氨基酸的標(biāo)準(zhǔn)化出現(xiàn)頻率。 是第j層序列相關(guān)因子。 為 的權(quán)重因子,用于調(diào)節(jié)氨基酸序列次序信息對(duì)分類(lèi)系統(tǒng)的影響程度,本文設(shè)定為0.05。

        本文最后一個(gè)特征采用的是泰勒提出的氨基酸的立體化學(xué)特性。將20種氨基酸的立體化學(xué)性質(zhì)特征用10維向量來(lái)表示: ,其中 (i=1,2,…,10是20種氨基酸中特性是i的氨基酸出現(xiàn)的頻率)。

        將以上提出的特征組合成一個(gè)向量來(lái)表示整個(gè)蛋白質(zhì)鏈特征, 維向量:

        這里的 是N-末端的信號(hào)肽和成熟蛋白序列的權(quán)重。 是PseAAC(偽氨基酸組分)的 層相關(guān)因子。本文中檢驗(yàn)了在不同的加權(quán)值 (0~10)和相關(guān)因子 中,測(cè)試結(jié)果的不同,對(duì)于不同的數(shù)據(jù)集ZD98、ZW225、CL317分別得到了最佳的 值1.3、6.8和3.9,最佳的 值8、6和2。

        3 結(jié)果和討論

        在支持向量機(jī)處理過(guò)程中,分別對(duì)于數(shù)據(jù)集ZD98、ZW225和CL317選定參數(shù)c=8.0、g=8.0,c=8.0、g=2.0和c=8.0、g=8.0。為了評(píng)價(jià)PSSP模型的效果,對(duì)相同的數(shù)據(jù)集用現(xiàn)有的方法進(jìn)行比較,選取定位精度和總體精度作為比較項(xiàng)。根據(jù)測(cè)驗(yàn)結(jié)果,對(duì)于數(shù)據(jù)集ZD98,本文方法的精度達(dá)到93.9%,這跟DF_SVM方法的精度一樣,比Covariant方法的精度提高了20%。而且,本文對(duì)Mito(線粒體)蛋白質(zhì)的精度達(dá)到了100%,這比Covariant方法的精度提高了70%。使用提供方法的ZW225的總預(yù)測(cè)精度達(dá)到了87.6%。這是上述方法中的最高值。Mito(線粒體)蛋白和Nucl(核蛋白)的定位精度是95.5%、80.5%,這明顯比其他方法的精度要高。CL317數(shù)據(jù)集的分泌蛋白并沒(méi)有達(dá)到令人滿(mǎn)意的精度,本文的方法仍然比其他的方法要好,總體精度達(dá)到了91. 5%。特別是Cyto(細(xì)胞色素氧化酶)和Mito(線粒體)蛋白,本文的工作相對(duì)來(lái)說(shuō)達(dá)到了很高的精度。

        4 總結(jié)和討論

        根據(jù)信號(hào)肽的理論,本文用SignalP將每個(gè)序列分成N-末端信號(hào)肽部分和成熟蛋白部分。然后從每個(gè)序列中提取出包含序列信息的PseAAC特征作為特征描述。通過(guò)Jackknife 檢驗(yàn),在三種凋亡蛋白數(shù)據(jù)集和NNPSL 數(shù)據(jù)集都得到了令人滿(mǎn)意的結(jié)果。蛋白質(zhì)內(nèi)含有的固有的信號(hào)控制它們?cè)诩?xì)胞內(nèi)的運(yùn)輸和定位。本文研究遵照了現(xiàn)實(shí)中的生物現(xiàn)象,但是,盡管研究得到了更好的精度,本文的目的仍然是融合分選信號(hào)和蛋白質(zhì)結(jié)構(gòu)的特征來(lái)得到關(guān)于凋亡蛋白亞細(xì)胞定位的更多信息。為了更好地了解不同的裂解部分對(duì)亞細(xì)胞定位的貢獻(xiàn),需要研究更多的序列特征和更大的數(shù)據(jù)集。

        參考文獻(xiàn):

        [1]Zhou,G.P. and K. Doctor,Subcellular location prediction of apoptosis proteins. Proteins,2003. 50(1):p.44-8.

        [2]Steller,H.,Mechanisms and genes of cellular suicide.Science,1995. 267(5203): p.1445-9.

        视频精品亚洲一区二区| 亚洲欧美日韩精品久久亚洲区| 久青草国产视频| 又爽又黄禁片视频1000免费| 亚洲成Av人片不卡无码观看| 亚洲国产精品第一区二区三区| 亚洲中文字幕精品久久a| 无码人妻aⅴ一区二区三区| 亚洲免费人成在线视频观看| 无码中文字幕av免费放| av在线不卡一区二区| 欧美丰满熟妇bbb久久久| 尤物视频在线观看| 白浆出来无码视频在线| 亚洲日本无码一区二区在线观看| 国产蜜臀精品一区二区三区| 麻豆最新国产av原创| 午夜福利啪啪片| 无码日韩人妻AV一区免费 | 亚洲av综合色区无码另类小说| 影视av久久久噜噜噜噜噜三级| 99精品免费久久久久久久久日本 | 国产大片在线观看91| 国产性虐视频在线观看| 中文精品久久久久人妻不卡| 日本老熟欧美老熟妇| 亚洲两性视频一三区| 国产av三级精品车模| 波多野结衣中文字幕一区二区三区| 一本一道久久综合久久| 亚洲毛片网| 精品人妻中文字幕一区二区三区| 国产日韩精品中文字幕| 精品淑女少妇av久久免费| 午夜a福利| 色噜噜精品一区二区三区| 精品国产午夜肉伦伦影院| 久久久精品人妻一区二区三区四| 国产精品日日摸夜夜添夜夜添| 羞羞色院99精品全部免| 特级a欧美做爰片第一次|