亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種表征蛋白質(zhì)可分泌性的結(jié)構(gòu)融合度特征

        2010-10-11 02:11:12高翠芳吳小俊田豐偉夏雨陳衛(wèi)
        生物工程學(xué)報(bào) 2010年5期
        關(guān)鍵詞:融合度信號(hào)肽特征向量

        高翠芳,吳小俊,田豐偉,夏雨,陳衛(wèi)

        1 江南大學(xué)信息工程學(xué)院,無錫 214122

        2 江南大學(xué)食品學(xué)院 食品科學(xué)與技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,無錫 214122

        生物技術(shù)與方法

        一種表征蛋白質(zhì)可分泌性的結(jié)構(gòu)融合度特征

        高翠芳1,吳小俊1,田豐偉2,夏雨2,陳衛(wèi)2

        1 江南大學(xué)信息工程學(xué)院,無錫 214122

        2 江南大學(xué)食品學(xué)院 食品科學(xué)與技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,無錫 214122

        選擇適宜的信號(hào)肽是實(shí)現(xiàn)外源蛋白高效分泌表達(dá)的一個(gè)重要因素。本研究利用生物信息學(xué)方法分析信號(hào)肽與外源蛋白之間的相容程度,將其定義為結(jié)構(gòu)融合度,并從數(shù)學(xué)角度分析拼接信號(hào)肽與目的蛋白鄰近殘基之間的相互作用,提出了信號(hào)肽拼接區(qū)域與目標(biāo)蛋白之間的數(shù)學(xué)模型,利用該模型進(jìn)行結(jié)構(gòu)融合度特征提取,以此來表征外源蛋白質(zhì)的可分泌性。模擬結(jié)果顯示結(jié)構(gòu)融合度特征能有效區(qū)分枯草芽胞桿菌宿主的可分泌和不可分泌蛋白。研究結(jié)果有助于信號(hào)肽的選擇,對目的蛋白分泌表達(dá)的優(yōu)化具有一定的指導(dǎo)意義。

        信號(hào)肽,蛋白質(zhì)分泌,結(jié)構(gòu)融合度,特征提取

        Abstract:Selection of suitable signal peptides is an important factor for efficient secretion of heterologous proteins. We defined structural fusion degree (SFD) as the compatibility degree of target proteins and signal peptides by a bioinformatics approach. We mathematically analyzed the interaction of fused signal peptides and adjacent residues of proteins, and proposed a mathematical model of extended signal region and the protein. SFD Features was extracted from this model to characterize the secretability of heterologous proteins. Simulation tests showed that SFD features can effectively discriminate high secretory proteins from poor ones in the hostBacillus subtilis. Results from this research will be useful in signal peptide selection and have a better guiding significance for the optimization of heterologous protein secretion.

        Keywords:signal peptide, secretion of protein, structural fusion degree, feature extraction

        能穿過合成所在的細(xì)胞位置轉(zhuǎn)移到其他細(xì)胞組織中去的蛋白質(zhì),統(tǒng)稱為分泌性蛋白質(zhì)。分泌性蛋白的分泌依賴于信號(hào)肽的存在 (一般位于蛋白質(zhì)鏈的 N-端),新合成的蛋白質(zhì)在信號(hào)肽的引導(dǎo)下實(shí)現(xiàn)轉(zhuǎn)移以后,信號(hào)肽序列則在信號(hào)肽酶的作用下被切除[1-2],釋放出成熟蛋白質(zhì)。采用分泌方式將目標(biāo)蛋白質(zhì)直接輸出到發(fā)酵液可大大提高工業(yè)生產(chǎn)率[3-4]。生物工程中采用基因技術(shù)分泌表達(dá)外源蛋白時(shí),主要策略是推測目標(biāo)蛋白質(zhì)可能具有的分泌途徑,將該途徑可識(shí)別的信號(hào)肽融合到目標(biāo)蛋白質(zhì),嘗試其分泌表達(dá)水平。但是該方法通常帶有較大程度的盲目性[5],因?yàn)橥庠吹鞍踪|(zhì)的來源菌種與宿主菌在進(jìn)化關(guān)系上可能差別很大,不能預(yù)知蛋白質(zhì)本身與它所融合的信號(hào)肽之間的相容程度。通過不斷更換信號(hào)肽反復(fù)嘗試或者對信號(hào)肽進(jìn)行優(yōu)化雖然方法可行,但試驗(yàn)費(fèi)用較高且研究所包涵的共性結(jié)果較少,對其他外源蛋白質(zhì)分泌表達(dá)的指導(dǎo)意義不大。生物信息學(xué)中常用的模式識(shí)別方法是分析和處理生物數(shù)據(jù)的重要手段[6-7],如果采用該智能預(yù)測技術(shù)對外源蛋白質(zhì)的可分泌性進(jìn)行預(yù)分析,可大大減少不必要的生物試驗(yàn)。

        模式識(shí)別方法用于分泌性蛋白的研究,目前主要集中在識(shí)別給定蛋白中信號(hào)肽的存在以及識(shí)別信號(hào)肽的切割位點(diǎn)[8-12]。其中滑動(dòng)窗體 (以切割位點(diǎn)為基準(zhǔn),包括上下游部分氨基酸) 的方法較適用于識(shí)別信號(hào)肽的切割位點(diǎn)[8-9],序列中相鄰氨基酸的環(huán)境信息也有助于提高信號(hào)肽切割位點(diǎn)的預(yù)測精度[9-10]。SignalP3.0是目前準(zhǔn)確率較高的信號(hào)肽預(yù)測軟件[11],它采用固定長度滑動(dòng)窗體與氨基酸組分特征相結(jié)合的方法可有效提高信號(hào)肽識(shí)別率。這些研究都是以獨(dú)立的蛋白序列作為識(shí)別對象,沒有替換和拼接新的信號(hào)肽,因此不必考慮蛋白質(zhì)本身與信號(hào)肽之間的相容問題。而外源蛋白拼接了新的信號(hào)肽以后,蛋白主鏈仍與原蛋白質(zhì)相同,拼接前后序列的相似程度很高,但分泌水平可能變化很大。目前已開發(fā)的蛋白序列特征提取方法,如:氨基酸組分[13]、序列順序關(guān)系[14]、序列小波能量[9,15]等,直接用來識(shí)別外源蛋白質(zhì)的分泌性難度很大,而且也不能揭示人工信號(hào)肽與目標(biāo)蛋白質(zhì)之間的相容程度。為了提取有效的特征向量來表征蛋白質(zhì)的分泌特性,本研究建立了信號(hào)肽擴(kuò)展序列與目標(biāo)蛋白之間的數(shù)學(xué)關(guān)系模型,從該模型提取了結(jié)構(gòu)融合度特征 (SFD),并利用這些特征來識(shí)別可分泌和不可分泌外源蛋白質(zhì)。

        1 材料:構(gòu)建蛋白質(zhì)樣本數(shù)據(jù)集

        枯草芽胞桿菌Bacillus subtilis屬于革蘭氏陽性真細(xì)菌,是食品安全菌種,能夠?qū)⒋罅康鞍踪|(zhì)以分泌的方式輸出到細(xì)胞外,可作為分泌表達(dá)外源蛋白的良好受體菌[16-17]。本研究中采用的高分泌量天然樣本來自枯草芽胞桿菌N-端融合了Sec途徑信號(hào)肽的目標(biāo)蛋白質(zhì),共有 4種:AmyE、AprE、NprB、SacB。外源蛋白質(zhì)所融合的可識(shí)別信號(hào)肽來源于這些天然樣本。另外根據(jù)研究要求,從已報(bào)道的在枯草芽胞桿菌中進(jìn)行過分泌嘗試的樣本中,選擇可分泌蛋白質(zhì)和不可分泌 (極低分泌量) 蛋白質(zhì)作為外源蛋白樣本 (表1~2)。蛋白原始序列 (氨基酸序列)可在UniProtKB/Swiss-Prot數(shù)據(jù)庫(http://www.uniprot.org/uniprot/) 中查詢獲得。信號(hào)肽序列位于蛋白質(zhì)主鏈的前面 (也就是N端),數(shù)據(jù)庫中用signal記錄說明。

        表1 高分泌外源蛋白樣本信息Table 1 Information of high secretory heterologous protein samples

        用枯草芽胞桿菌中可識(shí)別的高分泌蛋白質(zhì)AmyE、AprE、NprB、SacB的信號(hào)肽作為人工信號(hào)肽 (表3),根據(jù)表 1~2中信號(hào)肽與各外源蛋白質(zhì)的對應(yīng)關(guān)系,若外源蛋白質(zhì)是不可分泌蛋白質(zhì),直接將外源蛋白質(zhì)與相應(yīng)人工信號(hào)肽進(jìn)行融合。若外源蛋白質(zhì)是可分泌蛋白質(zhì)且有自己的信號(hào)肽,則切除其原始信號(hào)肽,再與相應(yīng)人工信號(hào)肽進(jìn)行融合,過程如圖1所示,其中 (a) 為從天然樣本中獲得可識(shí)別的信號(hào)肽序列,(b) 為切除外源樣本的原始信號(hào)肽序列,(c) 為將天然可識(shí)別信號(hào)肽融合到外源蛋白質(zhì)的N-端。生物方法即為采用基因技術(shù)將可識(shí)別的天然信號(hào)肽融合到外源蛋白質(zhì)的N-端。

        對表 1~2中的所有外源蛋白樣本,利用計(jì)算機(jī)技術(shù)切除原始信號(hào)肽序列,然后再拼接人工信號(hào)肽序列,得到各個(gè)外源蛋白質(zhì)的新序列樣本,從而構(gòu)建人工研究樣本集。

        圖1 將可識(shí)別的天然信號(hào)肽融合到外源蛋白質(zhì)的N-端Fig.1 Model for recognized natural signal peptide in-frame fuse to N-terminal of heterologous protein chain.

        2 方法:特征提取

        2.1 氨基酸組分特征

        提取蛋白質(zhì)特征的典型方法是根據(jù)序列中氨基酸的組成成分。蛋白質(zhì)鏈通常用一條氨基酸序列來描述,鏈上的元素就是氨基酸的名稱。按照字母排列順序,構(gòu)成蛋白質(zhì)序列的20種氨基酸的基本字符集為:

        表2 低分泌外源蛋白樣本信息Table 2 Information of poor secretory heterologous protein samples

        表3 信號(hào)肽序列信息Table 3 Information of signal peptides

        Θ中每個(gè)字符代表一種氨基酸,給定一個(gè)包含n個(gè)氨基酸殘基的蛋白質(zhì)序列Q:

        其中 Ri(i=1,2,3…n) 為集合 Θ中的字符。為了能用計(jì)算機(jī)處理蛋白質(zhì)樣本,需要把字符序列表示成向量數(shù)據(jù),傳統(tǒng)的離散化方法是用20維向量來表示蛋白質(zhì)的20種氨基酸組成[13]:

        與集合Θ中的字符排列順序?qū)?yīng),其中f1表示丙氨酸(A) 在整條蛋白質(zhì)序列中出現(xiàn)的頻率,f2表示半胱氨酸(C) 在整條蛋白質(zhì)序列中出現(xiàn)的頻率,以此類推。這樣可以提取蛋白質(zhì)基本組成的20維特征向量。

        2.2 結(jié)構(gòu)融合度特征 (SFD)

        上述向量是對整個(gè)蛋白質(zhì)序列的特征提取,無法直接用來區(qū)分外源蛋白質(zhì)的可分泌性。希望提取的特征向量能揭示人工信號(hào)肽與目標(biāo)蛋白之間所蘊(yùn)藏的內(nèi)在關(guān)系,因此提出在信號(hào)肽拼接區(qū)與目標(biāo)蛋白質(zhì)之間建立數(shù)學(xué)關(guān)系模型,從模型得到的特征向量能客觀地反映人工信號(hào)肽和目標(biāo)蛋白質(zhì)之間的融合程度,進(jìn)而反映拼接后目標(biāo)蛋白質(zhì)的可分泌性。

        2.2.1信號(hào)肽擴(kuò)展序列信息集

        為了研究信號(hào)肽拼接以后與鄰近殘基之間的相互作用,也就是拼接區(qū)域的局部融合程度,對信號(hào)肽序列進(jìn)行了擴(kuò)展,使其延伸到包括部分外源蛋白序列,稱為信號(hào)肽擴(kuò)展序列。例如信號(hào)肽序列的長度為l,延伸長度為15(與信號(hào)肽相鄰的15個(gè)氨基酸殘基),則擴(kuò)展序列的長度為l+15,如圖2。

        設(shè)S是信號(hào)肽擴(kuò)展序列,則有:

        其中Ri(i=1,2,3…l+15) 為集合Θ中表示氨基酸名稱的字符。根據(jù)子序列分布集合的描述方法[18],構(gòu)建了信號(hào)肽擴(kuò)展序列 S的子序列分布集合,集合中是序列 S的所有包含信號(hào)肽片段的子序列。由于信號(hào)肽序列一般包括3個(gè)功能區(qū)域[19],分別由不同極性的氨基酸組成,考慮到3個(gè)功能區(qū)域的相互作用,子序列應(yīng)包含完整的信號(hào)肽序列。例如:第k(k≤16)條子序列是Uk={R1R2... RlRl+1... Rl+k-1}。按此規(guī)則,可以得到唯一的子序列分布集合:?=(U1U2... U15U16)。其中:

        圖 3的例子顯示了信號(hào)肽擴(kuò)展序列通過窗體拉伸得到的子序列分布集合 (即框中的子序列)。其中原信號(hào)肽長度為l=23 (即灰色區(qū)域內(nèi)的序列)。顯然,序列集合?中共有16條子序列,其中U1就是信號(hào)肽序列,U16就是信號(hào)肽擴(kuò)展序列。每條序列都比前一條序列多一個(gè)氨基酸殘基。子序列長度的延伸包含了信號(hào)肽與蛋白主鏈鄰近殘基之間的相互作用,因此擴(kuò)展序列信息集一定程度上蘊(yùn)含了拼接區(qū)域的局部特征,也蘊(yùn)含了局部結(jié)構(gòu)的融合信息。

        圖2 信號(hào)肽擴(kuò)展序列Fig.2 Extended signal peptide sequence.

        圖3 信號(hào)肽擴(kuò)展序列的子序列分布集合Fig.3 Distribution of sub sequence set of extended signal peptide sequence.

        2.2.2提取結(jié)構(gòu)融合度特征的數(shù)學(xué)模型

        對于集合?中的每個(gè)子序列,均提取20維的氨基酸組分特征向量,共得到16個(gè)特征向量,組成信號(hào)肽拼接區(qū)域的特征矩陣A:

        其中V1=[v1,1v1,2…v1,20]’ 是子序列U1的特征向量,V2=[v2,1v2,2…v2,20]’ 是子序列 U2的特征向量,以此類推。按照同樣方法提取整個(gè)蛋白質(zhì)鏈的特征向量B=[b1b2…b20]’。

        集合?中各子序列之間存在部分重疊,因此矩陣A中各向量之間存在一定的相關(guān)信息。協(xié)方差是用來描述兩個(gè)變量之間相互關(guān)系的數(shù)字特征,利用多個(gè)不同變量的協(xié)方差組成的協(xié)方差矩陣,可進(jìn)行相應(yīng)的總體相關(guān)性分析。設(shè)C是矩陣A中各維分量的協(xié)方差矩陣:

        矩陣C是對稱陣,其中第(i,j) 個(gè)元素是矩陣A中第i維分量與第j維分量 (第i行與第j行) 的協(xié)方差。設(shè)D是由C的特征向量組成的矩陣,由于矩陣的特征向量既能描述矩陣本身的特征又不損失矩陣信息,還能方便數(shù)學(xué)上的處理,因此在矩陣D與向量B之間建立數(shù)學(xué)關(guān)系:

        矩陣D蘊(yùn)含了信號(hào)肽拼接區(qū)域的特征,向量B則蘊(yùn)含了整個(gè)蛋白質(zhì)鏈的特征,因此未知向量X=[x1x2…x20]’可以體現(xiàn)信號(hào)肽拼接區(qū)與目標(biāo)蛋白質(zhì)之間的內(nèi)在關(guān)系,這里稱為結(jié)構(gòu)融合度特征 (SFD),這種特征向量可用來描述外源蛋白質(zhì)的分泌特征。

        若D是滿秩矩陣,則D?1存在,方程組(1)的解向量為X=D?1B。當(dāng)矩陣D是奇異矩陣時(shí),D?1不存在,可用最小二乘法得到方程組(1) 的解向量。這種基于融合程度的方法只依賴于序列本身,不涉及任何主觀因素,可以快速對人工信號(hào)肽與蛋白主鏈建立內(nèi)在關(guān)系分析,避免了不斷更換信號(hào)肽進(jìn)行反復(fù)嘗試的盲目性。

        3 模擬實(shí)驗(yàn)與結(jié)果分析

        在第 1部分構(gòu)建的人工蛋白序列集上,分別取信號(hào)肽擴(kuò)展序列的延伸長度為 5、10、15、20,對不同的延伸長度,每個(gè)蛋白序列均提取20維的結(jié)構(gòu)融合度特征,加上氨基酸組分的基礎(chǔ)特征,這樣共得到 5個(gè)分別用不同特征向量表示的數(shù)據(jù)集。為了直觀觀察各數(shù)據(jù)集中的樣本分布情況,同時(shí)盡量保持原樣本間的相互距離關(guān)系,用線性映射的方法[20]將特征向量投影到二維平面,結(jié)果如圖4。

        對于以上 5種特征,用下面的指標(biāo)來檢驗(yàn)其有效性:即類內(nèi)距離tr(Sw) 盡量小,類間距離tr(Sb) 盡量大的準(zhǔn)則。因此類間距與類內(nèi)距的比值tr(Sb)/tr(Sw) 越大,聚類效果越好。

        其中C是分類數(shù),Nk是第k類的樣本數(shù),mk是第k類樣本的均值向量,m是所有樣本的均值向量。

        表4 不同特征的有效性指標(biāo)Table 4 Validity indexes of different features

        在表4顯示的5種特征中,當(dāng)信號(hào)肽延長10或15個(gè)氨基酸殘基時(shí),結(jié)構(gòu)融合度特征的類間距與類內(nèi)距比值較大。圖4中的二維特征分布圖也顯示,此時(shí)特征的類內(nèi)緊致性和類間可分性較好。這說明信號(hào)肽拼接以后與蛋白主鏈中較鄰近的15個(gè)氨基酸殘基之間的相互作用較大,因此根據(jù)局部相互作用提取的融合度特征可以用來描述蛋白質(zhì)的分泌性能。

        采用FCM模糊聚類算法,分別用上述5種特征向量對表 1~2中的各蛋白樣本進(jìn)行聚類分析,劃分為可分泌和不可分泌兩類 (其中天然可分泌樣本和人工可分泌樣本屬于同一類),聚類結(jié)果如表5。

        圖4 不同特征集的二維分布效果Fig.4 2-D mapped distribution of different features. (a) Features of amino acid composition. (b) Features of SFD (prolongation is 5)(c) Features of SFD (prolongation is 10). (d) Features of SFD (prolongation is 15). (e) Features of SFD (prolongation is 20).

        通過模擬實(shí)驗(yàn)發(fā)現(xiàn),信號(hào)肽延長的氨基酸個(gè)數(shù)較少 (<5) 時(shí),信號(hào)肽本身的特征信息影響較大,聚類結(jié)果基本上按照信號(hào)肽的種類劃分,也就是同一種信號(hào)肽會(huì)劃分為一類,不能區(qū)分可分泌和不可分泌蛋白質(zhì)。相反,當(dāng)信號(hào)肽延長的氨基酸個(gè)數(shù)較多 (>30) 時(shí),信號(hào)肽本身的特征信息被淡化,結(jié)構(gòu)融合度特征與整個(gè)蛋白質(zhì)鏈的特征向量很接近。

        為進(jìn)一步測試?yán)肧FD特征對外源蛋白分泌性的識(shí)別效果,與目前常用的信號(hào)肽預(yù)測軟件進(jìn)行了實(shí)驗(yàn)比較,分別是 SignalP3.0 (http://www.cbs.dtu.dk/services/SignalP/),TargetP(http://www.cbs.dtu.dk/services/TargetP/),PrediSi (http://www.predisi.de/),Phobius(http://www.ebi.ac.uk/Tools/phobius/)。其中 SignalP3.0包括神經(jīng)網(wǎng)絡(luò)(SignalP3-NN)和隱馬爾科夫模型(SignalP3-HMM)兩種預(yù)測結(jié)果,SignalP3-NN中用3種分值:max S、mean S、D-score預(yù)測給定蛋白中是否存在信號(hào)肽,其中max S是預(yù)測信號(hào)肽存在的粗測值; mean S可預(yù)測信號(hào)肽長度,也是SignalP2.0中識(shí)別信號(hào)肽的標(biāo)準(zhǔn); D-score是識(shí)別信號(hào)肽的高級標(biāo)準(zhǔn)。對于 4種信號(hào)肽來源的天然樣本,實(shí)驗(yàn)所涉及的幾種算法均能給出正確預(yù)測結(jié)果,無需再做比較,故這里只列出各算法對人工樣本的預(yù)測結(jié)果(表 6~7)。

        目前的預(yù)測軟件僅局限于識(shí)別蛋白序列中是否存在信號(hào)肽,無法判斷給定蛋白屬于天然樣本還是人工拼接樣本。對于拼接后的人工樣本,信號(hào)肽序列的存在并不能表示分泌水平高,只有兩者真正相容才能實(shí)現(xiàn)高分泌。表中結(jié)果顯示,預(yù)測軟件雖然能識(shí)別信號(hào)肽的存在,卻幾乎把所有拼接天然信號(hào)肽的外源蛋白預(yù)測為可分泌蛋白,只有少數(shù)幾種不可分泌蛋白被識(shí)別出。本研究的特征提取方法與以前的研究不同,是從兩者的融合程度出發(fā),揭示人工信號(hào)肽與目標(biāo)蛋白之間蘊(yùn)藏的內(nèi)在關(guān)系,因此能較好地區(qū)分拼接樣本中的可分泌和不可分泌外源蛋白。

        表5 采用不同特征得到的聚類精度Table 5 Clustering accuracy obtained by different features

        表6 高分泌外源蛋白樣本的預(yù)測結(jié)果Table 6 Prediction results of high secretory heterologous protein samples

        表7 低分泌外源蛋白樣本的預(yù)測結(jié)果Table 7 Prediction results of poor secretory heterologous protein samples

        4 結(jié)論

        實(shí)現(xiàn)外源蛋白高效分泌的一個(gè)重要因素是選用適宜的信號(hào)肽。本研究根據(jù)人工信號(hào)肽與目標(biāo)蛋白質(zhì)的融合程度進(jìn)行前期分析預(yù)測,能為外源蛋白質(zhì)的信號(hào)肽選擇提供理論參考,減少目標(biāo)蛋白質(zhì)進(jìn)行生物試驗(yàn)的分泌嘗試次數(shù)。文章中是基于氨基酸組分的結(jié)構(gòu)融合度特征提取,對于其他不同角度的蛋白序列特征,如序列相關(guān)系數(shù)特征和序列小波能量特征等,也可用文中的數(shù)學(xué)模型得到結(jié)構(gòu)融合度特征,但具體特征的有效性如何,有待繼續(xù)研究。模型中對信號(hào)肽拼接區(qū)的特征矩陣A的相關(guān)信息分析可以有多種方法,除了文章中所利用的協(xié)方差矩陣以外,還有矩陣的自相關(guān)分析、矢量間的信息增量等方法。另外,信號(hào)肽擴(kuò)展序列的延伸長度不同,所提取的特征效果也不同,文章對此作了實(shí)驗(yàn)對比和初步分析,但是拼接后信號(hào)肽與鄰近殘基之間的更密切的相互作用,有待于更深入的研究。對于文章中的理論研究結(jié)果,將來需采用生物試驗(yàn)做進(jìn)一步驗(yàn)證,結(jié)合生物驗(yàn)證結(jié)果,對文章中所提出的理論進(jìn)行調(diào)整和完善。

        REFERENCES

        [1] Tjalsma H, Antelmann H, Jongbloed JDH,et al.Proteomics of protein secretion byBacillus subtilis:separating the “Secrets” of the secretome.Microbiol Mol Biol Rev, 2004, 68(2): 207–233.

        [2] Wei XF, Wang DM, Liu S,et al. Signal sequence and its application to protein expression.Biotechnol Bull, 2006,6: 38–42.

        韋雪芳, 王冬梅, 劉思, 等. 信號(hào)肽及其在蛋白質(zhì)表達(dá)中的應(yīng)用. 生物技術(shù)通報(bào), 2006, 6: 38–42.

        [3] Schallmey M, Singh A, Ward OP. Developments in the use ofBacillusspecies for industrial production.Can JMicrobiol, 2004, 50(1): 1–17.

        [4] Zhang XZ, Cui ZL, Hong Q,et al. High-level expression and secretion of methyl parathion hydrolase inBacillus subtilisWB800.Appl Environ Microbiol, 2005, 71(7):4101–4103.

        [5] Fu LL, Xu ZR, Li WF,et al. Protein secretion pathways inBacillus subtilis: implication for optimization of heterologous protein secretion.Biotechnol Adv, 2007,25(1): 1–12.

        [6] Liew AWC, Yan H, Yang M. Pattern recognition techniques for the emerging field of bioinformatics: a review.Pattern Recognition,2005, 38(11): 2055–2073.

        [7] Keedwell E, Narayanan A. Intelligent Bioinformatics: the Application of Artificial Intelligence Techniques to Bioinformatics Problems. Chichester, West Sussex,England: John Wiley & Sons Ltd, 2005: 101–218.

        [8] Chou KC. Prediction of protein signal sequences.Curr Protein Pept Sci, 2002, 3(6): 615–622.

        [9] Li YZ, Wen ZN, Zhou CS,et al. Effects of neighboring sequence environment in predicting cleavage sites of signal peptides.Peptides, 2008, 29(9): 1498–1504.

        [10] K?ll L, Krogh A, Sonnhammer ELL. A combined transmembrane topology and signal peptide prediction method.J Mol Biol, 2004, 338(5): 1027–1036.

        [11] Bendtsen JD, Nielsen H, Heijne G,et al. Improved prediction of signal peptides: SignalP 3.0.J Mol Biol,2004, 340(4): 783–795.

        [12] Liu H, Yang J, Liu DQ,et al. Using a new alignment kernel function to identify secretory proteins.Protein Pept Lett, 2007, 14(2): 203–208.

        [13] Shen HB, Chou KC. Ensemble classifier for protein fold pattern recognition.Bioinformatics, 2006, 22(14): 1717–1722.

        [14] Chou KC. Prediction of protein cellular attributes using pseudo amino acid composition.Proteins: Struct, Funct,Genet, 2001, 43(3): 246–255.

        [15] Liò P. Wavelets in bioinformatics and computational biology: state of art and perspectives.Bioinformatics,2003, 19(1): 2–9.

        [16] Sonenshein AL, Hoch JA, Losick R.Bacillus subtilisand Its Closest Relatives. Washington DC: ASM Press, 2001.

        [17] Xia Y, Chen W, Zhao JX,et al. Construction of a new food-grade expression system forBacillus subtilisbased on theta replication plasmids and auxotrophic complementation.Appl Microbiol Biotechnol, 2007, 76(3):643–650.

        [18] Zhang M, Fang WW, Zhang JH,et al. MSAID: multiple sequence alignment based on a measure of information discrepancy.Comput Biol Chem, 2005, 29(2): 175–181.

        [19] Tjalsma H, Bolhuis A, Jongbloed JDH,et al. Signal peptide-dependent protein transport inBacillus subtilis: agenome-based survey of the secretome.Microbiol Mol Biol Rev, 2000, 64(3): 515–547.

        [20] Bian ZQ, Zhang XG. Pattern Recognition. 2nd ed. Beijing:Tsinghua University Press, 2000: 185–198.

        邊肇祺, 張學(xué)工. 模式識(shí)別. 2版. 北京: 清華大學(xué)出版社, 2000: 185–198.

        [21] Hemila H, Pakkanen R, Heikinheimo R,et al. Expression of theErwinia carotovorapolygalacturonase-encoding gene inBacillus subtilis: role of signal peptide fusions on production of a heterologous protein.Gene, 1992, 116(1):27–33.

        [22] Tsukagoshi N, Iritani S, Sasaki T,et al. Efficient synthesis and secretion of a thermophilic alpha-amylase by protein-producingBacillus brevis47 carrying theBacillus stearothermophilusamylase gene.J Bacteriol, 1985,164(3): 1182–1187.

        [23] Palva I, Sarvas M, Lehtovaara P,et al. Secretion ofEscherichia colibeta-lactamase fromBacillus subtilisby the aid of alpha-amylase signal sequence.Proc Natl Acad Sci USA, 1982, 79(18): 5582–5586.

        [24] Palva I, Sarvas M, Lehtovaara P,et al. Secretion ofEscherichia colibeta-lactamase fromBacillus subtilisby the aid of alpha-amylase signal sequence.Biotechnology,1992, 24: 344–348.

        [25] Sloma A, Pawlyk D, Pero J. Development of an Expression and Secretion System inBacillus subtilisUtilizing sacQ//Ganesan AT, Hoch JA, ed. Genetics and Biotechnolog ofBacilli. San Diego: Academic Press,1988: 23–26.

        [26] Vasantha N, Thompson LD. Fusion of pro region of subtilisin to staphylococcal protein A and its secretion byBacillus subtilis.Gene, 1986, 49(1): 23–28.

        [27] Fahnestock SR, Fisher KE. Expression of the staphylococcal protein A gene inBacillus subtilisby gene fusions utilizing the promoter from aBacillus amyloliquefaciensalpha-amylase gene.J Bacteriol, 1986,165(3): 796–804.

        [28] Payne MS, Jackson EN. Use of alkaline phosphatase fusions to study protein secretion inBacillus subtilis.J Bacteriol, 1991, 173(7): 2278–2282.

        [29] Nakayama A, Shimada H, Furutani Y,et al. Processing of the prepropeptide portions of theBacillus amyloliquefaciensneutral protease fused toBacillus subtilisalpha-amylase and human growth hormone during secretion inBacillus subtilis.J Bacteriol, 1992, 23(1): 55–69.

        [30] Franchi E, Maisano F, Testori SA,et al. A new human growth hormone production process using a recombinantBacillus subtilisstrain.J Bacteriol, 1991, 18(1/2): 41–54.

        [31] Edelman A, Joliff G, Klier A,et al. A system for the inducible secretion of proteins fromBacillus subtilisduring logarithmic growth.FEMS Microbiol Lett, 1988,52(1/2): 117–120.

        [32] Petit MA, Joliff G, Mesas JM,et al. Hypersecretion of a cellulase fromClostridium thermocelluminBacillus subtilisby induction of chromosomal DNA amplification.Biotechnology, 1990, 8(6): 559–563.

        [33] Zhang M, Zhao C, Du LX,et al. Expression, purification,and characterization of a thermophilic neutral protease fromBacillus stearothermophilusinBacillus subtilis.Sci China Series C: Life Sci, 2008, 51(1): 52–59.

        [34] Simonen M, Tarkkaa E, Puohiniemia R,et al.Incompatibility of outer membrane proteins OmpA and OmpF ofEscherichia coliwith secretion inBacillus subtilis: fusions with secretable peptides.FEMS Microbiol Lett, 1992, 79(1/3): 233–241.

        [35] Imanaka T, Tanaka T, Tsunekawa H,et al. Cloning of the genes for penicillinase, penP and penI, ofBacillus licheniformisin some vector plasmids and their expression inEscherichia coli,Bacillus subtilis, andBacillus licheniformis.J Bacteriol, 1981, 147(3): 776–86.

        [36] Soutschek-Bauer E, Staudenbauer WL. Synthesis and secretion of a heat-stable carboxymethylcellulose fromClostridium thermocelluminBacillus subtilisandBacillus stearothermophilus.Mol Gen Genet, 1987, 208(3):537–541.

        [37] Vasantha N, Filpula D. Expression of bovine pancreatic ribonuclease A coded by a synthetic gene inBacillus subtilis.Gene, 1989, 76(1): 53–60.

        [38] Wang LF, Wong SL, Lee SG,et al. Expression and secretion of human atrial natriuretic alpha-factor inBacillus subtilisusing the subtilisin signal peptide.Gene,1988, 69(1): 39–47.

        [39] Takagi M, Imanaka T. Role of the pre-pro-region of neutral protease in secretion inBacillus subtilis.J Ferment Bioeng, 1989, 67(2): 71–76.

        [40] Palva I. Construction of aBacillussecretion vector.University of Helsinki, 1983.

        [41] Yoshimura K, Toibana A, Kikuchi K,et al. Differences betweenSaccharomyces cerevisiaeandBacillus subtilisin secretion of human lysozyme.Biochem Biophys Res Commun, 1987, 145(2): 712–718.

        [42] Ganesan AT, Hoch JA.BacillusMolecular Genetics and Biotechnology Applications. San Diego: Academic Press,1986: 479–491.

        [43] Dion M, Rapoport G, Doly J. Expression of the MuIFN alpha 7 gene inBacillus subtilisusing the levansucrase system.Biochimie, 1989, 71(6): 747–755.

        Characterization of protein secretion based on structural fusion degree

        Cuifang Gao1, Xiaojun Wu1, Fengwei Tian2, Yu Xia2, and Wei Chen2

        1School of Information Engineering,Jiangnan University,Wuxi214122,China
        2State Key Laboratory of Food Science and Technology,School of Food Science and Technology,Jiangnan University,Wuxi214122,China

        Received:November 19, 2009;Accepted:February 2, 2010

        Supported by:Program for New Century Excellent Talents in University of China (No. NCET-06-0487), National Natural Science Foundation of China (Nos. 60572034, 60973094, 30670065), Natural Science Foundation of Jiangsu Province (No. BK2006081), Program for Innovative Research Team of Jiangnan University (No. JNIRT0702).

        Corresponding author:Xiaojun Wu. Tel: +86-510-85912139; Fax: +86-510-85912136; E-mail: wu_xiaojun@yahoo.com.cn

        教育部新世紀(jì)優(yōu)秀人才計(jì)劃項(xiàng)目 (No. NCET-06-0487),國家自然科學(xué)基金 (Nos. 60572034, 60973094, 30670065),江蘇省自然科學(xué)基金 (No.BK2006081),江南大學(xué)創(chuàng)新團(tuán)隊(duì)計(jì)劃項(xiàng)目 (No. JNIRT0702) 資助。

        猜你喜歡
        融合度信號(hào)肽特征向量
        嵌合信號(hào)肽提高α-淀粉酶在枯草芽孢桿菌中的分泌
        二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
        克羅內(nèi)克積的特征向量
        一線城市流動(dòng)人口社會(huì)融合度及影響因素的研究
        湖南省品牌農(nóng)產(chǎn)品與電商平臺(tái)融合度測評研究
        重慶市產(chǎn)業(yè)融合度分析
        財(cái)訊(2018年28期)2018-05-14 08:56:00
        一類特殊矩陣特征向量的求法
        EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
        運(yùn)用計(jì)算機(jī)軟件預(yù)測木質(zhì)部寄生屬信號(hào)肽
        京津地區(qū)現(xiàn)代服務(wù)業(yè)協(xié)同創(chuàng)新融合度評價(jià):灰色關(guān)聯(lián)分析
        水蜜桃网站视频在线观看| 99福利网| 国产在线高清无码不卡| 一个人午夜观看在线中文字幕| 少妇被猛烈进入到喷白浆| 区二区三区玖玖玖| 91视频88av| 国产人成在线免费视频| 一本色道久久88—综合亚洲精品 | 美女被插到高潮嗷嗷叫| 国产伦一区二区三区色一情| 国产后入又长又硬| 在线精品国产一区二区| 国产高跟丝袜在线诱惑| 亚洲中文av中文字幕艳妇| 少妇高潮惨叫久久久久久电影| 亚洲视频在线看| 亚洲av偷拍一区二区三区| 美女丝袜美腿玉足视频| 爆乳熟妇一区二区三区霸乳| 在线一区不卡网址观看| 在线观看黄片在线播放视频| 久久一本日韩精品中文字幕屁孩| 亚洲国产成人片在线观看无码| 亚洲欧美日韩综合在线观看| 狼人综合干伊人网在线观看| 国产精品一区二区性色| 久久久久亚洲精品无码网址色欲| 久久一区二区三区四区| 中文字幕中文字幕三区| 色综合久久久无码中文字幕| 久久精品国产自清天天线 | 日本高清一区二区三区在线| 老熟妇乱子交视频一区| 国外亚洲成av人片在线观看| 亚洲电影久久久久久久9999| 91久久精品一区二区| 99久久人妻无码精品系列| 色老头一区二区三区| 熟女人妻一区二区中文字幕| 国产精品美女久久久网av|