亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于空間約束的蛋白質(zhì)結(jié)構(gòu)預測方法概述

        2016-10-14 19:39:40沈佳李娟方慧生
        醫(yī)學信息 2016年7期

        沈佳 李娟 方慧生

        摘要:基于空間約束的蛋白質(zhì)結(jié)構(gòu)預測方法是一種以已知結(jié)構(gòu)為模板預測蛋白質(zhì)結(jié)構(gòu)的方法。其中,它提取了模板結(jié)構(gòu)中的同源約束,結(jié)合力場中的立體化學約束,作為優(yōu)化初始結(jié)構(gòu)的條件,從而對初始結(jié)構(gòu)進行調(diào)整,最終得到模型。本文主要綜述了基于空間約束的蛋白質(zhì)結(jié)構(gòu)預測方法的原理,所涉及的空間約束,以及應(yīng)用與軟件。

        關(guān)鍵詞:蛋白質(zhì)結(jié)構(gòu)預測;空間約束;同源模建

        Abstract:Comparative modeling based on spare restraints is one of protein structure prediction methods which predict the three-dimensional structure of a given protein sequence based primarily on its alignment to one or more protein of known structure. This method uses homology-derived restraints from template protein and stereochemical restraints from force field as constraints to optimize initial structure, and finally constructs the model. This article reviews the theory of comparative modeling based on spare restraints, the spare restraints and relevant applications and softwares.

        Key words:Protein structure prediction; Spare restraints; Comparative modeling

        近些年來,基因組計劃為我們提供了大量的蛋白質(zhì)序列。我們只有理解了新蛋白質(zhì)的功能,基因組計劃才能真正實現(xiàn)它的意義。為了描述,理解和操控蛋白質(zhì)的功能,就必須首先確定蛋白質(zhì)的結(jié)構(gòu)。然而,實驗方法測定蛋白質(zhì)結(jié)構(gòu)代價很高且費時費力。由于實驗方法確定蛋白質(zhì)結(jié)構(gòu)存在缺陷和不足,蛋白質(zhì)結(jié)構(gòu)確定的速度跟不上序列測定的速度,且差距在不斷擴大。因此,完全依靠實驗方法確定蛋白質(zhì)結(jié)構(gòu)已經(jīng)不能滿足現(xiàn)實的需求[1]。上世紀70年代,人們發(fā)現(xiàn)蛋白質(zhì)三級結(jié)構(gòu)是由其一級序列決定的,這也就意味著可以從蛋白質(zhì)序列中獲取蛋白質(zhì)三級結(jié)構(gòu)的信息。這一發(fā)現(xiàn)為計算機預測蛋白質(zhì)結(jié)構(gòu)提供了理論依據(jù)。經(jīng)過了40余年的發(fā)展,計算機預測蛋白質(zhì)結(jié)構(gòu)的技術(shù)日趨成熟。其中,同源模建方法是一種以已知結(jié)構(gòu)的蛋白質(zhì)為模板預測目標蛋白質(zhì)結(jié)構(gòu)的方法。因為一級序列的相似性越高,兩個蛋白質(zhì)的三級結(jié)構(gòu)的相似性也越高。

        同源模建方法是從模板序列和目標序列的比對開始的。合適的模板是同源模建得到好模型的基礎(chǔ)。同源模建方法一般分為四個步驟:序列比對,模建結(jié)構(gòu),結(jié)構(gòu)優(yōu)化和結(jié)構(gòu)評估[2]。

        不同的同源模建方法的區(qū)別主要體現(xiàn)在第二步模建目標模型上。最傳統(tǒng)的也是使用最廣泛的模建方法是剛體裝配法。此方法使用從已知結(jié)構(gòu)中獲得的剛體結(jié)構(gòu)信息組裝模型?;谶@類同源模建方法的程序有COMPOSER。另一類方法就是片段匹配法。片段匹配法,又稱坐標重建法,是基于發(fā)現(xiàn)大部分的蛋白質(zhì)結(jié)構(gòu)片段都是聚類到大約100個結(jié)構(gòu)分組中。搜索并確定其余原子坐標的方法一般是搜索所有已知結(jié)構(gòu)或者是基于能量函數(shù)的構(gòu)象搜索。第三類同源模建方法是基于空間約束的同源模建方法。由于這種基于約束的模建方法可以使用關(guān)于目標序列的各種不同的信息,所以它是所有同源模建方法中最有前途的[3]。

        1 基于空間約束的同源模建方法

        基于空間約束的同源模建方法通過目標序列與模板序列的比對結(jié)果,得到目標序列結(jié)構(gòu)上的許多約束或者限制。這些約束通常是通過假設(shè)目標序列和模板序列上的相對應(yīng)的距離和角度是相似的得到的??臻g約束除了這些同源約束還包括:立體化學約束。然后使用空間約束來優(yōu)化模型的初始結(jié)構(gòu),使模型結(jié)構(gòu)對這些空間約束的違背最小,從而得到最終的模型結(jié)構(gòu)。模型的初始結(jié)構(gòu)可以通過距離幾何法或真實空間優(yōu)化法來實現(xiàn)。然后空間約束和力場數(shù)據(jù)項都被整合到一個客觀函數(shù)中去。最后,在笛卡爾坐標系中當客觀函數(shù)的函數(shù)值最小時,得到模型的最終結(jié)構(gòu)。基于空間約束的同源模建方法的優(yōu)勢之一是不同來源的約束和限制都很容易被添加到同源約束中去。同樣,基于空間約束的同源模建方法的進一步的發(fā)展也是因為各種約束的加入,使得這種方法更加完善。當然,好的優(yōu)化算法的選擇也是改善這種方法的途徑[4]。

        1.1距離約束和距離幾何法 最早的基于約束的蛋白質(zhì)結(jié)構(gòu)預測方法使用的約束一般都是距離約束,這些距離約束數(shù)據(jù)都是來自實驗檢測結(jié)果。PerJ Kraulis等人[5]提出了一種使用核磁共振數(shù)據(jù)確定蛋白質(zhì)結(jié)構(gòu)的方法,其中使用了蛋白質(zhì)原子間的距離數(shù)據(jù)。Hiroshi Wako等人[6]應(yīng)用距離約束法預測了牛胰蛋白酶抑制劑的三級結(jié)構(gòu)。其中,他們考慮了氨基酸殘基的親疏水性,并且設(shè)定了螺旋與延伸結(jié)構(gòu)和片層結(jié)構(gòu)中的平均距離,合并了特定的半胱氨酸殘基之間的二硫鍵的位置信息和五個特殊的殘基對之間的確切距離信息。他們定義了一個客觀函數(shù),通過使用這一系列的距離約束數(shù)據(jù),使客觀函數(shù)最小化,從而確定目標蛋白質(zhì)的最終結(jié)構(gòu)。其中使用的距離約束數(shù)據(jù)都是通過對14個已知結(jié)構(gòu)的蛋白質(zhì)的距離數(shù)據(jù)的統(tǒng)計分析總結(jié)得到的。

        距離約束數(shù)據(jù)方便使用分子內(nèi)部坐標表示,分子內(nèi)部坐標僅僅體現(xiàn)保守結(jié)構(gòu)特征的相對位置,而忽略分子的位置和方向。其他模建研究表明使用距離坐標系統(tǒng)處理分子內(nèi)部結(jié)構(gòu)約束問題非常有用。因為歐幾里得變換群中的每一個幾何特征不變量都可以用距離來表示,所以距離坐標系統(tǒng)可以替代笛卡爾坐標。笛卡爾坐標可以通過程序重新恢復。Havel TF等人[7]結(jié)合使用核磁共振數(shù)據(jù)和距離幾何法確定了胰蛋白酶抑制劑的結(jié)構(gòu),并證明了使用該方法計算蛋白質(zhì)的完整結(jié)構(gòu)是可行的。使用距離幾何法解決同源模建問題,就是一個確定具有同源性的蛋白質(zhì)中結(jié)構(gòu)相似的原子的分子內(nèi)距離的過程。Andras Aszodi等人[8]設(shè)計了一種基于距離幾何法的同源模建方法,這種方法能在相對較短的時間內(nèi)得到大量的低分辨率的片段,它是通過一系列的嵌入折疊整個簡化的模型,也就是把結(jié)構(gòu)投射到逐漸減小的維度的歐幾里德空間中去。

        1.2空間約束和真實空間優(yōu)化法 基于空間約束的同源模建方法逐漸被人們認可,越來越多的其他類型的約束信息被添加到方法中來。這也使得這種方法越來越完善。Andrej Sali等人[9]開發(fā)了一種整合了多種空間約束的同源模建方法,其中包含的空間約束有Cα原子之間的距離約束,NO原子之間的距離約束,立體化學約束,主鏈二面角約束以及側(cè)鏈二面角約束。這種方法的基本步驟是,首先,根據(jù)模板序列與目標序列的比對結(jié)果,從模板結(jié)構(gòu)中提取相對應(yīng)的同源約束,這些約束的展現(xiàn)形式都是概率密度函數(shù),也就是每一個同源約束就產(chǎn)生一個概率密度函數(shù);然后通過多目標函數(shù)法和共軛梯度算法來對得到的概率密度函數(shù)進行優(yōu)化,得到最優(yōu)解,即模型結(jié)構(gòu)信息。

        Cα原子之間的距離約束,也就是約束目標蛋白質(zhì)中兩個不同氨基酸殘基的Cα原子之間的距離的概率密度函數(shù)。這個概率密度函數(shù)也就是一個高斯分布,其中高斯分布的平均值是模板結(jié)構(gòu)中對應(yīng)殘基的Cα原子之間的距離,標準差是通過已知結(jié)構(gòu)中Cα原子之間的距離;兩個比對序列的部分同源性;已知結(jié)構(gòu)中這段距離兩端的殘基的部分溶劑親和性;距離兩端的殘基離空位的平均距離四個參數(shù)根據(jù)相應(yīng)的計算公式得到的。立體化學約束是根據(jù)標準力場數(shù)據(jù)對目標蛋白質(zhì)中的原子位置的約束。其中涉及了原子距離,角度,二面角,所以立體化學約束函數(shù)也有很多種,比如高斯函數(shù),余弦函數(shù)等等。構(gòu)建這些約束函數(shù)所需要的參數(shù)也是來源于力場數(shù)據(jù)。蛋白質(zhì)中主鏈骨架原子之間的鍵形成的二面角稱為主鏈二面角。根據(jù)組成二面角的原子類別的不同,可以將主鏈二面角分為三類。其中,由于二面角位置的特殊性,第三類主鏈二面角的變化比較單一。正是這樣,前兩類二面角的變化就成了討論主鏈二面角的關(guān)鍵。根據(jù)前兩類主鏈二面角的變化,主鏈構(gòu)象分為A,B,P,G,L和E六個類別。并且,每個主鏈二面角構(gòu)象類別中的二面角分布都是一個高斯分布,這樣每一個分布都可以用一個概率密度函數(shù)表示出來。在考慮目標序列中固定部位的主鏈構(gòu)象的約束時,就使用六個類別的概率密度函數(shù)的一個加權(quán)和來表示。其中,每一個類別高斯函數(shù)的平均值,標準差和權(quán)重都是通過統(tǒng)計分析得到的。Andrej Sali等人[10]使用了一個含有1000個蛋白質(zhì)的數(shù)據(jù)集,統(tǒng)計分析了不同殘基類型情況下的主鏈二面角的類別分布,得到了每一個主鏈構(gòu)象類別的高斯函數(shù)的平均值,標準差和權(quán)重三個參數(shù)的數(shù)據(jù)。

        1.3其他約束 同源模建方法得到的模型的可靠性很大程度上依賴于目標序列與模板序列的序列一致性。蛋白質(zhì)超家族成員之間存在的結(jié)構(gòu)差異不僅體現(xiàn)在空位區(qū)域上而且還體現(xiàn)在二級結(jié)構(gòu)位置的移位。這就造成了同源模建方法的一個內(nèi)在局限性。Saikat Chakrabarti等人[11]添加遠距離模板中的保守片段作為額外的空間約束,在一定程度上改善了基于空間約束的同源模建方法的這一問題。他們使用主流的結(jié)構(gòu)化片段的數(shù)據(jù)庫SMoS,這個數(shù)據(jù)庫整個了許多高保守結(jié)構(gòu)的殘基片段。他們利用了數(shù)據(jù)庫中的殘基片段的結(jié)構(gòu)信息,將這些結(jié)構(gòu)信息作為額外約束信息添加到同源模建方法中去。BooJALA V B Reddy等人[12]將二級結(jié)構(gòu)信息和氨基酸長距離接觸圖添加到基于空間約束的蛋白質(zhì)結(jié)構(gòu)預測的方法中,改善了含有高比例螺旋或折疊結(jié)構(gòu)的蛋白質(zhì)的預測精度。

        2 軟件與應(yīng)用

        MODELLER是一款同源模建軟件[13]。其中,使用的原理就是基于空間約束的蛋白質(zhì)結(jié)構(gòu)預測。簡而言之,軟件的輸入項是模板序列與目標序列的比對結(jié)果,模板序列的結(jié)構(gòu)文件和腳本文件。然后,MODELLER就能自動計算出目標序列中所有非氫原子的坐標。MODELLER軟件中涉及到的空間約束包括:同源約束,立體化學約束,統(tǒng)計約束和其他額外添加的約束。軟件沒有界面交互系統(tǒng),只能通過腳本進行使用。

        MODWEB是一種自動同源模建的網(wǎng)上服務(wù)器[14]。它接收一條以上的FASTA序列,然后在PDB數(shù)據(jù)庫中搜索最可行的模板,并計算出提交的目標序列的模型。MODWEB使用的原理與MODELLER類似,只是在兩個步驟進行了改進。它使用的模板搜索方法是序列結(jié)構(gòu)比對,搜索使用的模板也不止一個。對于單個提交序列,MODWEB是通過郵件的形式返回結(jié)果。如果提交的序列不止一條或者包含結(jié)構(gòu)時,返回的結(jié)果將被作為一個單獨的數(shù)據(jù)集添加到蛋白質(zhì)模型的相關(guān)數(shù)據(jù)集中。

        3 展望

        隨著越來越多的蛋白質(zhì)序列的三級結(jié)構(gòu)被測定,同源模建的使用范圍也不斷擴大。其中,基于空間約束的同源模建方法是在所有同源模建方法中表現(xiàn)最好的方法。目前,對基于空間約束的同源模建方法的研究也越來越深入。許多額外的實驗數(shù)據(jù)約束被添加到方法中來,比如,核磁共振數(shù)據(jù),交聯(lián)試驗數(shù)據(jù),熒光光譜實驗數(shù)據(jù),微電子圖像重建實驗數(shù)據(jù)和定點突變實驗數(shù)據(jù)。實驗數(shù)據(jù)約束的添加使基于空間約束的同源模建方法的預測結(jié)果更加的合理。

        總之,基于空間約束的同源模建方法具有能添加多種來源的數(shù)據(jù)約束的特點,是同源模建方法中與實驗數(shù)據(jù)聯(lián)系最深的方法,也意味著是最有潛力的方法。

        參考文獻:

        [1] Yang Z, Jeffrey S. The protein structure prediction problem could be solved using the current PDB library[J].Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(4):1029-1034.

        [2] Bino, John, Andrej, Sali. Comparative protein structure modeling by iterative alignment, model building and model assessment[J].Nucleic Acids Research, 2003, 31(14):3982-3992.

        [3] Martí-Renom M A, Stuart A C, Fiser A, et al. Comparative protein structure modeling of genes and genomes[J].Annual Review of Biophysics & Biomolecular Structure, 2000, 29(29):27-30.

        [4] Sánchez R, 07ali A. Comparative protein structure modeling as an optimization problem[J]. Journal of Molecular Structure Theochem, 1997:489-496.

        [5] Krauli P J, Jones T A. Determination of three-dimensional protein structures from nuclear magnetic resonance data using fragments of known structures[J]. Proteins Structure Function & Bioinformatics, 1987, 2(3):188-201.

        [6] Wako H, Scheraga H A. Distance-constraint approach to protein folding. I. Statistical analysis of protein conformations in terms of distances between residues[J]. Journal of Protein Chemistry, 1982, 1(1):5-45.

        [7] Havel T F, Wüthrich K. An evaluation of the combined use of nuclear magnetic resonance and distance geometry for the determination of protein conformations in solution[J]. Journal of Molecular Biology, 1985, 182(2):281-294.

        [8] András Aszódi, Robin EJ Munro, William R Taylor. Distance geometry based comparative modelling[J]. Fold Des, 1997, 2(3):S3-S6.

        [9] Andrej Sali, Blundell T L. Comparative protein modelling by satisfaction of spatial restraints[J]. Journal of Molecular Biology, 1993, 234(3):779-815.

        [10] ?Ali, Andrej, Overington J P. Derivation of rules for comparative protein modeling from a database of protein structure alignments[J]. Protein Science A Publication of the Protein Society, 1994, 3(9):1582-1596.

        [11] Chakrabarti S, John J, Sowdhamini R. Improvement of comparative modeling by the application of conserved motifs amongst distantly related proteins as additional restraints[J]. Journal of Molecular Modeling, 2004, 10(1):69-75.

        [12] Reddy B V B, Kaznessis Y N. Use of secondary structural information and C α -C α distance restraints to model protein structures with MODELLER[J]. Journal of Biosciences, 2007, 32(1 Supplement):929-936.

        [13] Eswar N, Eramian D, Webb B, et al. Protein Structure Modeling with MODELLER[M].Structural ProteomicsHumana Press, 2008:145-159.

        [14] Eswar N. Tools for comparative protein structure modeling and analysis[J]. Nucleic Acids Research, 2003, 31(13):3375-3380.

        編輯/倪冰冰

        欧美大成色www永久网站婷| 国产精品半夜| 国内精品伊人久久久久av| ZZIJZZIJ亚洲日本少妇| 国产91九色视频在线播放| 阴唇两边有点白是怎么回事| 亚洲人成影院在线无码按摩店| 日本乱人伦在线观看| 国产成人av在线影院无毒| 亚洲女人天堂成人av在线| 亚洲av免费手机在线观看| 久久亚洲国产成人精品性色| 免费看国产成年无码av| 加勒比特在线视频播放| 亚洲精品成人无百码中文毛片| 日本三级片在线观看| 一本色综合久久| 国精品无码一区二区三区在线看| 日本女优中文字幕四季视频网站| 变态另类人妖一区二区三区| 精品成人av一区二区三区| 国产精品亚洲一区二区杨幂| 国产精品亚洲av无人区一区蜜桃| 国产在线视频一区二区天美蜜桃| 亚洲av蜜桃永久无码精品| 女人体免费一区二区| 亚洲无av码一区二区三区| 日韩在线永久免费播放| 欧美老熟妇欲乱高清视频| 欧美丝袜激情办公室在线观看| 人妻少妇被粗大爽视频| 国产综合在线观看| 亚洲天堂手机在线| 中文字幕人妻少妇精品| 国产精品成人观看视频国产奇米 | 日日噜噜噜夜夜狠狠久久蜜桃| 日本在线 | 中文| 国产一区日韩二区欧美三区| 视频网站在线观看不卡| 后入丝袜美腿在线观看| 三级特黄60分钟在线观看|