亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代雜合酶的設(shè)計及其新趨勢

        2018-07-30 09:45:46張群吳秀蕓蔣緒愷趙越王祿山
        生物工程學(xué)報 2018年7期
        關(guān)鍵詞:生物功能

        張群,吳秀蕓,蔣緒愷,趙越,王祿山

        ?

        大數(shù)據(jù)時代雜合酶的設(shè)計及其新趨勢

        張群,吳秀蕓,蔣緒愷,趙越,王祿山

        山東大學(xué) 生命科學(xué)學(xué)院 微生物技術(shù)國家重點實驗室,山東 濟(jì)南 250100

        金城. 2018酶工程??蜓? 生物工程學(xué)報, 2018, 34(7): 1021?1023.Jin C. Preface for special issue on enzyme engineering (2018). Chin J Biotech, 2018, 34(7): 1021?1023.

        酶分子的高效性和穩(wěn)定性是工業(yè)廣泛應(yīng)用的物質(zhì)基礎(chǔ)。利用分子生物學(xué)技術(shù)可以將不同酶分子通過串聯(lián)、插入、翻譯后融合等方式構(gòu)建成符合工業(yè)需求的雜合酶,但應(yīng)用中多結(jié)構(gòu)域雜合酶在表達(dá)量與酶活等方面仍存在弊端,而基于特定蛋白質(zhì)結(jié)構(gòu)域的多功能設(shè)計成為新趨勢。高通量測序技術(shù)的發(fā)展,使得生物學(xué)家正面臨著爆炸式增長的大數(shù)據(jù)集。近年來“蛋白質(zhì)功能區(qū)”概念的提出,拓寬了人們對蛋白質(zhì)結(jié)構(gòu)與功能組織層次的認(rèn)知,功能區(qū)殘基聚簇的協(xié)同演化可導(dǎo)致同一家族不同蛋白質(zhì)功能的差異?;诤A看髷?shù)據(jù)分析可以快速定位特定功能區(qū)以及協(xié)同進(jìn)化的關(guān)鍵位點,再利用合成生物學(xué)技術(shù)就可實現(xiàn)多種功能殘基在同一蛋白質(zhì)中的精準(zhǔn)嫁接,完成天然酶分子的再設(shè)計。這將是雜合酶技術(shù)發(fā)展的新階段,也會成為生物大數(shù)據(jù)時代下蛋白質(zhì)設(shè)計的新趨勢。

        雜合酶,功能區(qū),生物大數(shù)據(jù),合成生物學(xué)技術(shù),蛋白質(zhì)工程

        酶制劑是工業(yè)生物技術(shù)快速發(fā)展的基石,早在20世紀(jì)初期,生物催化在工業(yè)生物技術(shù)中的應(yīng)用已初見端倪[1]。由于工業(yè)應(yīng)用過程中酶分子的分離純化、穩(wěn)定性等因素影響,行業(yè)應(yīng)用成本較高,因而推廣應(yīng)用范圍有限。直至20世紀(jì)90年代隨著分子生物學(xué)技術(shù)的快速發(fā)展,以生物催化為核心的工業(yè)生物技術(shù)才取得了革命性的飛躍。然而酶制劑高效性與穩(wěn)定性仍是行業(yè)應(yīng)用的限制瓶頸,因而設(shè)計或改造形成高效穩(wěn)定的酶制劑仍是工業(yè)生物技術(shù)時代需要攻克的關(guān)鍵科學(xué)問題[2–3]。

        1 功能酶分子的篩選與蛋白質(zhì)工程

        工業(yè)生物技術(shù)作為21世紀(jì)新技術(shù)之一,對解決人類所面臨的食品、資源和環(huán)境等問題起到越來越重要的作用。獲得耐高溫、高鹽、酸堿的優(yōu)良酶制劑是工業(yè)生物技術(shù)的關(guān)鍵,人們常通過極端微生物或宏基因組學(xué)篩選獲得相關(guān)酶類 (圖1A)。盡管目前從自然界篩選了大量新型酶分子,但仍不能滿足工業(yè)生產(chǎn)與應(yīng)用中的迫切需求[4]。為了克服天然酶分子在工業(yè)應(yīng)用中的固有缺陷,1983年Ulmer提出了蛋白質(zhì)工程 (Protein engineering) 的概念,即利用分子生物學(xué)技術(shù)進(jìn)行蛋白質(zhì)的工程化改造[5]。蛋白質(zhì)工程可設(shè)計出符合工業(yè)應(yīng)用的酶分子,在一定程度上加速酶分子的進(jìn)化歷程[6]。自提出以來,該技術(shù)先后經(jīng)過了定向進(jìn)化、半理性設(shè)計以及理性設(shè)計3個發(fā)展階段 (圖1B–D)。

        定向進(jìn)化模擬自然進(jìn)化過程,無需了解蛋白質(zhì)的三維結(jié)構(gòu)信息和作用機(jī)制,通過隨機(jī)突變和定向篩選可獲得功能改善的酶分子。由于蛋白質(zhì)序列空間 (Sequence space) 巨大,因而建立靈敏的高通 量篩選方法是決定該策略成功與否的前提[7-8]。半理性設(shè)計可將功能變化定位至一個或幾個“熱點”殘基的突變,進(jìn)而改變酶分子的相應(yīng)功能[9]。然而從功能保守的蛋白質(zhì)家族 (一般序列一致性大于30%就可以歸為一個蛋白質(zhì)家族) 來看,長期的演化過程導(dǎo)致序列間相似性相對較低,但酶分子功能并沒有發(fā)生明顯改變,這說明半理性設(shè)計在實際應(yīng)用中存在低效性問題[10-11]。伴隨新一代測序技術(shù),生物大分子序列和結(jié)構(gòu)信息的快速增長,相關(guān)數(shù)據(jù)庫也愈發(fā)豐富和完善,建立全新的大數(shù)據(jù)分析與挖掘技術(shù),可指導(dǎo)蛋白質(zhì)工程走向更加理性的新階段[12]。

        2 雜合酶及其構(gòu)建的分子生物學(xué)技術(shù)

        根據(jù)Nixon所述,雜合酶 (Hybrid enzyme) 是指將兩個或多個不同酶分子的結(jié)構(gòu)元件或者功能結(jié)構(gòu)域整合到同一個分子中的新技術(shù),其可以基于工業(yè)的需求而設(shè)計相應(yīng)酶類,因而得到工業(yè)生物技術(shù)行業(yè)的高度關(guān)注[14]。隨著早期分子生物學(xué)技術(shù)的發(fā)展,人們可以利用重組DNA技術(shù)或者翻譯后修飾方法構(gòu)建具有應(yīng)用價值的雜合酶分子,這包括基因水平的雜合與蛋白水平的直接融合等 (圖2),早期構(gòu)建方式主要分為功能結(jié)構(gòu)域的串聯(lián)融合、插入融合和翻譯后融合等形式[15]。

        由于結(jié)構(gòu)域是蛋白質(zhì)進(jìn)化的功能單元,多結(jié)構(gòu)域的雜合酶往往比單結(jié)構(gòu)域的酶分子具有更穩(wěn)定的性質(zhì)和更多樣的功能,因而有利于降低酶制劑的生產(chǎn)成本,簡化生產(chǎn)工藝。例如Ye 等構(gòu)建了肝素酶、麥芽糖結(jié)合蛋白 (MBP) 以及熒光蛋白的三重雜合體,基于熒光蛋白的快速追蹤以及MBP易于分離的性質(zhì),實現(xiàn)了肝素酶的生產(chǎn)、分離以及催化等過程的集成,從而降低了酶制劑的應(yīng)用成本和低分子量肝素的生產(chǎn)成本[16]。此外,雜合酶可應(yīng)用于代謝過程中的順序反應(yīng),將不同功能結(jié)構(gòu)域的酶分子雜合在一起,形成臨近效應(yīng),從而明顯提升酶分子的催化效率[17]。

        圖1 酶分子的篩選和改造策略[13]

        圖2 構(gòu)建雜合酶的傳統(tǒng)方法[15]

        2.1 功能結(jié)構(gòu)域的串聯(lián)融合

        雜合酶的串聯(lián)融合是指將兩個或多個不同酶分子連接在一起的融合方式,選擇理化性質(zhì) (最適溫度、pH等) 兼容的功能結(jié)構(gòu)域可以明顯提升雜合酶構(gòu)建的成功率,而結(jié)構(gòu)域的融合次序也是雜合酶可否構(gòu)建成功的關(guān)鍵因素[18]。串聯(lián)融合技術(shù)通??梢灾苯哟?lián)融合,即一個酶的N端與另一酶的C端直接融合。Lu等將一個來自解淀粉芽孢桿菌的葡聚糖酶與來自枯草芽孢桿菌的木聚糖酶直接融合,所得雜合酶的葡聚糖酶活提高了 3倍,而木聚糖酶活降低了31%[19]。當(dāng)所融合的N端或C端具有重要功能,或者各結(jié)構(gòu)域距離太近而不能避免空間位阻時,會導(dǎo)致新的雜合酶分子發(fā)生錯誤折疊、表達(dá)量偏低或者活性受損等問題[20-21]。解決此類難題的有效方式是引入連接肽(Linker),其可以維持單個結(jié)構(gòu)域的構(gòu)象延伸性和結(jié)構(gòu)穩(wěn)定性,改善蛋白質(zhì)表達(dá)水平和生物活性[22]。

        如何選擇或設(shè)計連接肽是一個值得深入研究的領(lǐng)域。研究者已經(jīng)設(shè)計出多種人工連接肽用于雜合酶分子的構(gòu)建,現(xiàn)將其分成3種類型:柔性型、剛性型和可斷裂型,表1總結(jié)了各種類型連接肽的特征與功能。目前已經(jīng)有很多連接肽實現(xiàn)了應(yīng)用,如Kim等利用柔性型連接肽 (GGGGS)2實現(xiàn)了纖維素酶Cel5B和木聚糖酶Xyl10g的融合,所得雜合酶可更有效地降解稻草、秸稈等生物質(zhì) (圖3A)[23]。Chen等利用二硫蘇糖醇 (DTT) 可對二硫鍵的還原斷裂能力,從而設(shè)計了一種可斷裂連接肽,實現(xiàn)了粒細(xì)胞集落刺激因子 (G-CSF) 與轉(zhuǎn)鐵蛋白 (Tf) 的體內(nèi)激活(圖3B)[24]。

        2.2 功能結(jié)構(gòu)域的插入融合

        多功能酶分子常將不同功能的結(jié)構(gòu)域按一定次序排列在同一多肽鏈上,然而自然界中仍有9%的多功能酶分子存在插入結(jié)構(gòu)域現(xiàn)象,即一個結(jié)構(gòu)域插入另一個結(jié)構(gòu)域之中[32]。因此,將一個功能結(jié)構(gòu)域插入到宿主結(jié)構(gòu)域來構(gòu)建雜合酶也是一種可行策略,它通常可形成抗蛋白酶水解的剛性結(jié)構(gòu)[33-34]。

        插入融合技術(shù)需要兩個先決條件。首先,為了降低插入融合對插入結(jié)構(gòu)域柔性構(gòu)象的破壞,插入結(jié)構(gòu)域最末端兩殘基的Cα原子距離要在5 ?左右,且大小要小于宿主結(jié)構(gòu)域[35];其次,該類宿主結(jié)構(gòu)域可適應(yīng)新結(jié)構(gòu)域的插入,即兩結(jié)構(gòu)域可互相兼容[36]。PDB數(shù)據(jù)庫中約50%的蛋白質(zhì)含有臨近的末端,滿足插入結(jié)構(gòu)域的條件[37]。然而宿主結(jié)構(gòu)域不易尋找到插入位點,這使得該策略要比串聯(lián)融合操作過程繁瑣。人們常選擇宿主結(jié)構(gòu)域表面的loop或轉(zhuǎn)角位置作為結(jié)構(gòu)域插入位點,這可消除結(jié)構(gòu)域間位阻沖突,但可能會破壞宿主結(jié)構(gòu)域原有的相互作用網(wǎng)絡(luò),使得雜合酶結(jié)構(gòu)穩(wěn)定性降低[15,38]。目前,插入融合技術(shù)已經(jīng)有多個成功案例,如Ribeiro等將木聚糖酶XynA插入到大腸桿菌木糖結(jié)合蛋白XBP中,篩選到兩種活性都提高20%的雜合酶 (圖3C)[39]。

        表1 各種類型連接肽的匯總

        This table is redrawn from Chen et al[22].

        2.3 功能結(jié)構(gòu)域的翻譯后融合

        多結(jié)構(gòu)域的雜合酶在異源表達(dá)過程中常形成包涵體,導(dǎo)致雜合酶表達(dá)量偏低或不能正確折疊,這限制了雜合酶技術(shù)的廣泛應(yīng)用。因此人們又開發(fā)了翻譯后蛋白質(zhì)水平上的結(jié)構(gòu)域融合技術(shù)[40]。翻譯后蛋白質(zhì)水平的融合技術(shù)主要包括化學(xué)交聯(lián)法和酶聯(lián)法?;瘜W(xué)交聯(lián)法可高效構(gòu)建雜合酶分子,但化學(xué)試劑不具有特異性,常常會導(dǎo)致雜合酶分子發(fā)生不正確聚集[41]。酶聯(lián)法是構(gòu)建雜合酶更溫和更常用的方法,該技術(shù)主要用轉(zhuǎn)肽酶、谷氨酰胺轉(zhuǎn)胺酶 (TGase)以及過氧化物酶等完成相關(guān)蛋白質(zhì)結(jié)構(gòu)域的雜合[42]。Hirakawa等利用TGase構(gòu)建了一個單加氧酶細(xì)胞色素P450cam、假單孢氧還蛋白Pdx以及Pdx還原酶Pdr的三元雜合酶,實現(xiàn)了分子內(nèi)電子的快速轉(zhuǎn)移,使得電子傳遞效率與催化效率較3種游離蛋白質(zhì)混合物有了明顯提升 (圖3D)[43]。

        圖3 構(gòu)建雜合酶的成功案例[15,23,39,43]

        3 生物大數(shù)據(jù)時代雜合酶的分子設(shè)計

        3.1 高通量測序技術(shù)與生物大數(shù)據(jù)時代

        進(jìn)入新世紀(jì),新一代高通量測序技術(shù)快速發(fā)展,測序成本急劇降低,使得高通量測序成為通用技術(shù);而Miseq等測序技術(shù)測序通量可高達(dá) 1 Gb/run,這就使得生物序列數(shù)據(jù)爆炸式增長;截止到2017年9月,NCBI數(shù)據(jù)庫中核酸序列已有約2.45億條[46-47]。蛋白質(zhì)序列由基因序列數(shù)據(jù)翻譯而來,去除冗余序列后,Uniprot數(shù)據(jù)庫中蛋白質(zhì)序列至2017年9月已有9 000萬余條,但轉(zhuǎn)錄水平證實的只占1.22%,蛋白質(zhì)水平證實更低,僅有0.15%[48]。同時,近幾年冷凍電鏡等結(jié)構(gòu)測定技術(shù)的快速發(fā)展也使得生物大分子的結(jié)構(gòu)信息不斷增多,2016年 2月23日PDB數(shù)據(jù)庫就已實現(xiàn)10億原子的存檔[49]。因此現(xiàn)代生物學(xué)已經(jīng)進(jìn)入到大數(shù)據(jù)時代[50],現(xiàn)在生物工作者所面臨的主要科學(xué)問題可能不再是序列、結(jié)構(gòu)數(shù)據(jù)太少,而是如何對生物大數(shù)據(jù)進(jìn)行深入分析與挖掘、促進(jìn)蛋白質(zhì)功能的準(zhǔn)確預(yù)測與分析、以及應(yīng)用于酶分子理性設(shè)計與改造等方面[51]。

        不同來源的生物大數(shù)據(jù)已按一定格式與要求存儲于相關(guān)生物信息學(xué)數(shù)據(jù)庫中,由于實驗通量限制人們不可能逐條分析驗證其生物學(xué)功能,因此必須建立相關(guān)算法及不同數(shù)據(jù)間的關(guān)聯(lián),完成其功能準(zhǔn)確有效的注釋[52]。早在人類基因組草圖完成時,有人就利用同源性方法來預(yù)測基因及其功能,提出以蛋白序列一致性30%為標(biāo)準(zhǔn)構(gòu)建蛋白質(zhì)家族 (Protein family),利用同源模建方法來構(gòu)建結(jié)構(gòu)并分析預(yù)測功能[53]。至2017年3月蛋白質(zhì)家族的個數(shù)為1.6萬左右 (http://pfam.xfam. org/help)[54-55],PDB數(shù)據(jù)庫中生物大分子結(jié)構(gòu)的數(shù)目也已經(jīng)超過13萬個[56],現(xiàn)在每一蛋白質(zhì)家族基本都含有一個已測定結(jié)構(gòu)的蛋白質(zhì)。由于同一家族具有相似的空間拓?fù)浣Y(jié)構(gòu),而不同蛋白質(zhì)處于不同的選擇壓力之下,因而具有不同的進(jìn)化速率[57-58],所以分析同一家族內(nèi)特定結(jié)構(gòu)空間的約束與局部功能區(qū)的快速演化就可完成其功能的有效預(yù)測與分析,這就是“結(jié)構(gòu)生物信息學(xué)(Structrual bioinformatics)”的研究策略[59]。

        3.2 結(jié)構(gòu)生物信息學(xué)大數(shù)據(jù)的聚類分析與雜合酶的設(shè)計

        由于海量生物大數(shù)據(jù)的持續(xù)增長,人們提出要根據(jù)序列相似性程度對蛋白質(zhì)家族進(jìn)行進(jìn)一步分析與更深層次的聚類,以對應(yīng)酶分子功能分類的不同層次,從而提高序列功能預(yù)測的準(zhǔn)確度[60]?,F(xiàn)在CATH等蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫已經(jīng)根據(jù)不同的序列一致性細(xì)化出不同的層次聚類 (序列一致性<35%為S層,<60%為O層,<95%為L層,100%為I層)[61];CAZy數(shù)據(jù)庫也基于序列一致性>75%的標(biāo)準(zhǔn)提出了GH5家族新的“亞家族 (Subfamily)”分類系統(tǒng),這為糖苷水解酶等進(jìn)一步功能分析預(yù)測以及功能基元 (Motif) 的確定奠定了基礎(chǔ)[62]。生物大數(shù)據(jù)的細(xì)化分類進(jìn)一步提升了序列結(jié)構(gòu)分析的效率與準(zhǔn)確率[63],特別是基于亞家族等近源序列、結(jié)構(gòu)與功能的分析與其分子動力學(xué)模擬,可明顯降低序列空間的搜索范圍與搜索強度[64-65]。

        通過對同一聚類的蛋白質(zhì)家族或亞家族等成員進(jìn)行多結(jié)構(gòu)比對分析等,快速定位催化活性中心的活性架構(gòu) (Active archtechture)[64];再對其進(jìn)行比較分子動力學(xué)模擬 (MDs) 分析,認(rèn)識酶分子特定功能簇的分子動態(tài)行為,定位功能簇內(nèi)殘基的相互作用網(wǎng)絡(luò)及其動態(tài)學(xué)變化,分析如酶蛋白熱敏感區(qū)等的分子動態(tài)性質(zhì),從而可確定熱穩(wěn)定性等相關(guān)基元并進(jìn)行精準(zhǔn)嫁接[66-67](圖4A)。如Jiang等利用比較分子動力學(xué)模擬方法對糖苷水解酶GH12家族5種酶分子的分子動態(tài)行為進(jìn)行系統(tǒng)研究,發(fā)現(xiàn)該家族的熱敏感區(qū)主要位于蛋白質(zhì)結(jié)構(gòu)的N末端,并且同一家族不同熱穩(wěn)定性的酶分子間存在明顯規(guī)律性變化,這也使得在GH12家族內(nèi)不同酶分子之間進(jìn)行熱敏感區(qū)的嫁接成為可能[66]。GH12家族結(jié)構(gòu)除N端區(qū)域?qū)崦舾型猓浯呋钚约軜?gòu)的多個loop也是熱敏感區(qū),且不同成員對熱擾動的抵抗能力也是不同的,嗜熱酶的活性架構(gòu)loop與周圍殘基傾向于形成更多的相互作用網(wǎng)絡(luò)[68]。而基于同一蛋白質(zhì)家族或亞家族成員的比較分析,可以針對特定蛋白質(zhì)進(jìn)行蛋白質(zhì)表面嫁接 (Protein surface grafting) 等改造,從而完成生物大分子的理性設(shè)計。如Kapoor等將里氏木霉的中溫纖維素酶 (Cel12A) 的活性架構(gòu)殘基嫁接到海洋紅嗜熱鹽菌的嗜熱纖維素酶(Cel12A) 的活性架構(gòu)中,成功地獲得了一個適中溫活性的熱穩(wěn)定性雜合酶[69]。

        除熱穩(wěn)定性外,耐鹽性和pH耐受性也是限制酶制劑應(yīng)用的重要因素。通過對蛋白質(zhì)家族內(nèi)不同酶分子表面帶電殘基的系統(tǒng)分析,發(fā)現(xiàn)其與耐鹽性和pH耐受性密切相關(guān),這不僅涉及分子內(nèi)殘基的相互作用,而且與溶劑分子也存在重要作用[70-71]。已有研究發(fā)現(xiàn)耐鹽酶結(jié)構(gòu)中α螺旋較少,無規(guī)卷曲偏多,而且分子表面分布有較多的負(fù)電殘基 (D/E) 和小側(cè)鏈的疏水殘基 (如G/A)[72-73]。由于分子表面較多D/E的存在,耐鹽酶分子對酸的耐受性明顯增強[74]。耐堿酶與耐酸酶明顯不同,其分子表面的D/E含量在進(jìn)化中逐漸降低,取而代之的是較多的正電殘基 (如R) 和中性親水殘基 (如N/Q)[75]。人們通過在GH11家族木聚糖酶XynJ的表面引入多個R殘基,成功提高了其耐堿性[76]。目前,通過結(jié)構(gòu)生物信息學(xué)分析功能殘基突變前后的分子表面電勢 (VEs) 變化,可以指導(dǎo)表面帶電氨基酸殘基的精準(zhǔn)嫁接,這已成為構(gòu)建穩(wěn)定型雜合酶的全新策略[77](圖4B)。最近研究已有改造成功的案例,如Kiss等利用結(jié)構(gòu)生物信息學(xué)方法,將牛碳酸酐酶Ⅱ表面的K、L、R、N、Q、V等殘基突變?yōu)镈、E,通過DNA合成技術(shù)構(gòu)建了4個雜合酶,并成功將其改造為耐鹽酶[78]。Woodiey等將植酸酶表面的R、K、Q等殘基突變?yōu)镈,使其在pH 2.8下的穩(wěn)定性提高了3.8倍[77]。

        3.3 蛋白質(zhì)功能區(qū)的精準(zhǔn)嫁接與酶分子的再設(shè)計

        蛋白質(zhì)功能的執(zhí)行常常是其空間結(jié)構(gòu)的一部分,由功能殘基聚簇 (Clusters of residues) 形成特定的局部結(jié)構(gòu)來行使特定功能。然而蛋白質(zhì)序列空間巨大,功能殘基聚簇的尋找無疑是大海撈針。由于功能基因在天然環(huán)境中經(jīng)億萬年進(jìn)化篩選,形成了具有功能的天然多樣性 (Natural diversity) 文庫,這是經(jīng)自然選擇后的文庫,較定向進(jìn)化產(chǎn)生的文庫要小的多[79]。因此基于高通量測序產(chǎn)生的天然多樣性文庫,研究特定功能殘基聚簇的形成途徑與策略將會找出“馴化突變 (Educated mutations)”,并利用這些突變再賦予天然活性位點以新功能[80]。特別是對多功能的蛋白質(zhì)家族,就可作為酶分子再設(shè)計 (Enzyme redesign) 的重要起點。通過蛋白質(zhì)家族序列大數(shù)據(jù)的深入挖掘與分析,可快速定位相關(guān)殘基的功能聚簇并認(rèn)識其演化規(guī)律。如Reyndds等2009年提出蛋白質(zhì)功能區(qū) (Sectors) 的相關(guān)算法[81],該算法通過蛋白質(zhì)家族內(nèi)上千條序列的統(tǒng)計分析,定位局部空間聚簇的多個功能區(qū)[82-84]。此外,研究發(fā)現(xiàn)功能區(qū)在整個蛋白質(zhì)家族中呈現(xiàn)明顯分化現(xiàn)象,可導(dǎo)致同一家族成員功能上的顯著差異[81]。

        在序列大數(shù)據(jù)快速增長的背景下,Hopf于2012年提出了一種可全面分析單基因突變的統(tǒng)計耦合分析(Statistical coupling analysis,SCA)方法。通過該方法可在同源序列分析相關(guān)聚簇氨基酸殘基間的協(xié)同進(jìn)化,從而探究功能區(qū)內(nèi)氨基酸之間的關(guān)聯(lián)與其功能的關(guān)系。已有研究表明蛋白質(zhì)中大部分殘基幾乎都是獨立演化的,而約有20%的氨基酸可與協(xié)同進(jìn)化的氨基酸殘基形成連續(xù)相互作用的功能區(qū)[85]。由于序列大數(shù)據(jù)中包含豐富的蛋白質(zhì)功能約束及其進(jìn)化信息,因而可有效分析蛋白質(zhì)功能區(qū)殘基間的協(xié)同進(jìn)化,可以幫助確定參與配體結(jié)合的功能區(qū)、蛋白質(zhì)復(fù)合體形成功能區(qū)以及參與構(gòu)象調(diào)控的相關(guān)功能殘基及其組合,這對蛋白質(zhì)結(jié)構(gòu)、分子相互作用以及進(jìn)化動力學(xué)等研究都具有重要意義[86-87]。目前已研究證實,以序列/結(jié)構(gòu)大數(shù)據(jù)為研究驅(qū)動,不僅可估計三維結(jié)構(gòu)中聯(lián)系緊密的殘基及其組合[88-90],還可將蛋白質(zhì)折疊預(yù)測提高至合理精確度[91-93]。此外,蛋白質(zhì)功能區(qū)氨基酸協(xié)同進(jìn)化的相關(guān)分析平臺與網(wǎng)站現(xiàn)已建立并可提供在線服務(wù),如Evfold (http:// evfold.org/) 等,該網(wǎng)站采用最大熵法在線計算蛋白質(zhì)家族中協(xié)同進(jìn)化的相關(guān)氨基酸殘基與組合[94]。

        伴隨大數(shù)據(jù)時代序列數(shù)據(jù)挖掘新技術(shù)的不斷出現(xiàn),功能區(qū)以及協(xié)同進(jìn)化的相關(guān)分析算法將進(jìn)一步簡化,對家族內(nèi)序列數(shù)目的要求也進(jìn)一步降低,這將使得功能區(qū)的設(shè)計與其嫁接更加快捷與便利[95]。如SCHEMA等針對蛋白質(zhì)空間結(jié)構(gòu)優(yōu)化算法的推出,已成功應(yīng)用于雜合酶穩(wěn)定性的設(shè)計?;谠撍惴ㄈ藗兛稍诓挥绊懙鞍踪|(zhì)三維結(jié)構(gòu)穩(wěn)定的前提下,定位雜合體中可能被破壞的相互作用區(qū)域,從而篩選出受穩(wěn)定性影響最小的雜合酶[96]。這種以結(jié)構(gòu)為基礎(chǔ)的重組方案要比基于序列的DNA改組 (DNA shuffling) 更加高效,可有效避免基因重組過程中的結(jié)構(gòu)域坍塌[97]。此外,DNA合成技術(shù)迅速崛起,合成速度、精度、長度的提高以及合成成本的大幅度降低,使其逐漸取代了基因組DNA的提取與克隆等分子生物學(xué)技術(shù),這促使蛋白質(zhì)工程發(fā)展到了全新的階段[7,98]。

        因此,基于序列結(jié)構(gòu)等生物大數(shù)據(jù)的挖掘與分析,結(jié)合動力學(xué)模擬分析蛋白質(zhì)整體與局域分子動態(tài)學(xué)行為,通過進(jìn)化分析準(zhǔn)確定位家族或亞家族內(nèi)協(xié)同進(jìn)化的功能殘基聚簇及組合,構(gòu)建“小而精 (Small but smart) ”的雜合體文庫完成酶分子功能的精準(zhǔn)嫁接,這將會明顯提高雜合酶分子設(shè)計與改造的成功概率 (圖4C),從而促進(jìn)酶分子功能再設(shè)計的快速發(fā)展[7]。

        圖4 生物大數(shù)據(jù)時代雜合酶的設(shè)計策略[86]

        4 展望

        工業(yè)生物技術(shù)的迅猛發(fā)展為人類解決能源和環(huán)境等問題提供了前所未有的機(jī)遇,然而現(xiàn)代化工業(yè)生物技術(shù)是一個全新的應(yīng)用環(huán)境,所要求的條件明顯不同于自然環(huán)境,因此對酶制劑提出了更加嚴(yán)苛的要求。盡管近年來人們在構(gòu)建多結(jié)構(gòu)域的雜合酶中取得了顯著成效,但實際應(yīng)用中多結(jié)構(gòu)域雜合酶常得不到理想的表達(dá)量及相關(guān)活性,這一定程度上阻礙了雜合酶的工業(yè)應(yīng)用[99-100]。所 以為了滿足工業(yè)生物技術(shù)快速發(fā)展的迫切需求,就需要對所篩選的酶分子進(jìn)行系統(tǒng)的再設(shè)計與改造。伴隨后基因組時代的到來,測序通量迅速增加,結(jié)構(gòu)數(shù)據(jù)急劇膨脹,如何對生物大數(shù)據(jù)進(jìn)行深入挖掘與分析,為酶分子理性設(shè)計提供全新 思路與平臺技術(shù)是當(dāng)下生命科學(xué)亟待解決的關(guān)鍵問題。

        生物大數(shù)據(jù)是連接人、機(jī)、物的三元紐帶,為生命科學(xué)在基因和蛋白質(zhì)層面的研究起到了關(guān)鍵的推進(jìn)作用[101]。其在為生命科學(xué)研究提供新方法論的同時,也不可避免地將我們置身于新的挑戰(zhàn)中。如:如何提高生物大數(shù)據(jù)分析的速度與準(zhǔn)確度[102];如何確保軟件分析界面的可視化、易用性與普適性,如何有效建立不同大數(shù)據(jù)之間的關(guān)聯(lián)等[103]。不過,現(xiàn)在生物大數(shù)據(jù)挖掘的新方法新技術(shù)已經(jīng)開始沖擊傳統(tǒng)的思維模式,其不斷的發(fā)展與提升將會促進(jìn)人們思維模式由“假設(shè)驅(qū)動”向“數(shù)據(jù)驅(qū)動”轉(zhuǎn)變,因此將會給蛋白質(zhì)工程帶來新技術(shù)與新模式。

        基于海量生物大數(shù)據(jù)的系統(tǒng)分析,提出全新的算法與分析平臺,提升大數(shù)據(jù)挖掘的速率、效率,構(gòu)建友好的人機(jī)對話界面,簡便快捷地進(jìn)行生物大分子的序列、結(jié)構(gòu)、動態(tài)及功能的系統(tǒng)分析,快速定位結(jié)構(gòu)空間中的相關(guān)功能區(qū)及其協(xié)同進(jìn)化的功能殘基聚簇,指導(dǎo)酶分子的精準(zhǔn)嫁接,完成大數(shù)據(jù)驅(qū)動下酶分子的再設(shè)計,這將是雜合酶設(shè)計的新階段,也將是蛋白質(zhì)工程的新趨勢。

        [1] Griengl H, Schwab H, Fechter M. The synthesis of chiral cyanohydrins by oxynitrilases. Trends Biotechnol, 2000, 18(6): 252–256.

        [2] Finkelstein JM. Enzyme engineering: Just a jump to the left. Nat Chem Biol, 2012, 8(2): 134.

        [3] Lorenz P, Eck J. Metagenomics and industrial applications. Nat Rev Microbiol, 2005, 3(6): 510–516.

        [4] Lutz S. Reengineering enzymes. Science, 2010, 329(5989): 285–287.

        [5] Ulmer KM. Protein engineering. Science, 1983, 219(4585): 666–671.

        [6] Poglitsch A, Waelkens C, Geis N, et al. The photodetector array camera and spectrometer (PACS) on the Herschel space observatory. Astr Astrophys, 2010, 518: 662–673.

        [7] Bornscheuer UT, Huisman GW, Kazlauskas RJ, et al. Engineering the thirdwave of biocatalysis. Nature, 2012, 485(7397): 185–194.

        [8] Qu G, Zhao J, Zheng P, et al. Recent advances in directed evolution. Chin J Biotech, 2018, 34(1): 1–11 (in Chinese).曲戈, 趙晶, 鄭平, 等. 定向進(jìn)化技術(shù)的最新進(jìn)展. 生物工程學(xué)報, 2018, 34(1): 1–11.

        [9] Lutz S. Beyond directed evolution—semi-rational protein engineering and design. Curr Opin Biotechnol, 2010, 21(6): 734–743.

        [10] Gerlt JA, Babbitt PC. Enzyme (re)design: lessons from natural evolution and computation. Curr Opin Chem Biol, 2009, 13(1): 10–18.

        [11] Chen RD. Enzyme engineering: rational redesign versus directed evolution. Trends Biotechnol, 2001, 19(1): 13–14.

        [12] Lichtarge O, Wilkins A. Evolution: a guide to perturb protein function and networks. Curr Opin Struct Biol, 2010, 20(3): 351–359.

        [13] Davids T, Schmidt M, B?ttcher D, et al. Strategies for the discovery and engineering of enzymes for biocatalysis. Curr Opin Chem Biol, 2013, 17(2): 215–220.

        [14] Nixon AE, Ostermeier M, Benkovic SJ. Hybrid enzymes: manipulating enzyme design. Trends Biotechnol, 1998, 16(6): 258–264.

        [15] Yu K, Liu CC, Kim BG, et al. Synthetic fusion protein design and applications. Biotechnol Adv, 2015, 33(1): 155–164.

        [16] Ye FC, Zhang C, Togo M, et al. Design of intelligent heparinase by fusion with maltose binding protein and fluorescent proteins. J Biosci Bioeng, 2009, 108(S1): S104.

        [17] Good MC, Zalatan JG, Lim WA. Scaffold proteins: hubs for controlling the flow of cellular information. Science, 2011, 332(6030): 680–686.

        [18] Rizk M, Antranikian G, Elleuche S. End-to-end gene fusions and their impact on the production of multifunctional biomass degrading enzymes. Biochem Biophys Res Commun, 2012, 428(1): 1–5.

        [19] Lu P, Feng MG, Li WF, et al. Construction and characterization of a bifunctional fusion enzyme of Bacillus-sourced β-glucanase and xylanase expressed in. FEMS Microbiol Lett, 2006, 261(2): 224–230.

        [20] Shamriz S, Ofoghi H, Moazami N. Effect of linker length and residues on the structure and stability of a fusion protein with malaria vaccine application. Computers Biol Med, 2016, 76: 24–29.

        [21] Klein JS, Jiang SD, Galimidi RP, et al. Design and characterization of structured protein linkers with differing flexibilities. Prot Eng Des Select, 2014, 27(10): 325–330.

        [22] Chen XY, Zaro JL, Shen WC. Fusion protein linkers: property, design and functionality. Adv Drug Del Rev, 2013, 65(10): 1357–1369.

        [23] Kim HM, Jung S, Lee KH, et al. Improving lignocellulose degradation using xylanase-cellulase fusion protein with a glycine-serine linker. Int J Biol Macromol, 2015, 73: 215–221.

        [24] Chen XY, Bai Y, Zaro JL, et al. Design of ancleavable disulfide linker in recombinant fusion proteins. BioTechniques, 2010, 49(1): 513–518.

        [25] De Bold MK, Sheffield WP, Martinuk A, et al. Characterization of a long-acting recombinant human serum albumin-atrial natriuretic factor (ANF) expressed in. Regul Pept, 2012, 175(1/3): 7–10.

        [26] Rosenblum MG, Cheung LH, Liu Y, et al. Design, expression, purification, and characterization,and, of an antimelanoma single-chain Fv antibody fused to the toxin gelonin. Cancer Res, 2003, 63(14): 3995–4002.

        [27] Huang ZL, Li G, Zhang C, et al. A study on the effects of linker flexibility on acid phosphatase PhoC-GFP fusion protein using a novel linker library. Enzyme Microb Technol, 2016, 83: 1–6.

        [28] McCormick AL, Thomas MS, Heath AW. Immunization with an interferon-γ–gp120 fusion protein induces enhanced immune responses to human immunodeficiency virus gp120. J Infect Dis, 2001, 184(11): 1423–1430.

        [29] Huang ZL, Ye FC, Zhang C, et al. Rational design of a tripartite fusion protein of heparinase I enables one-step affinity purification and real-time activity detection. J Biotechnol, 2013, 163(1): 30–37.

        [30] Gramlich PA, Westbroek W, Feldman RA, et al. A peptide-linked recombinant glucocerebrosidase for targeted neuronal delivery: design, production, and assessment. J Biotechnol, 2016, 221: 1–12.

        [31] Zhao HL, Xue C, Du JL, et al. Balancing the pharmacokinetics and pharmacodynamics of interferon-α2b and human serum albumin fusion protein by proteolytic or reductive cleavage increases itstherapeutic efficacy. Mol Pharmaceutics, 2012, 9(3): 664–670.

        [32] Pandya C, Brown S, Pieper U, et al. Consequences of domain insertion on sequence-structure divergence in a superfold. Proc Natl Acad Sci USA, 2013, 110(36): 3381–3387.

        [33] Pierre B, Xiong TN, Hayles L, et al. Stability of a guest protein depends on stability of a host protein in insertional fusion. Biotechnol Bioeng, 2011, 108(5): 1011–1020.

        [34] Crasson O, Rhazi N, Jacquin O, et al. Enzymatic functionalization of a nanobody using protein insertion technology. Prot Eng Des Select, 2015, 28(10): 451–460.

        [35] Aroul-Selvam R, Hubbard T, Sasidharan R. Domain insertions in protein structures. J Mol Biol, 2004, 338(4): 633–641.

        [36] Selvam RA, Sasidharan R. DomIns: a web resource for domain insertions in known protein structures. Nucl Acids Res, 2004, 32(S1): D193–D195.

        [37] Yudin AK. Macrocycles: lessons from the distant past, recent developments, and future directions. Chem Sci, 2015, 6(1): 30–49.

        [38] Ribeiro LF, Furtado GP, Lourenzoni MR, et al. Engineering bifunctional laccase-xylanase chimeras for improved catalytic performance. J Biol Chem, 2011, 286(50): 43026–43038.

        [39] Ribeiro LF, Nicholes N, Tullman J, et al. Insertion of a xylanase in xylose binding protein results in a xylose-stimulated xylanase. Biotechnol Biof, 2015, 8(1): 118.

        [40] Schoffelen S, Van Hest JCM. Multi-enzyme systems: bringing enzymes together. Soft Matt, 2012, 8(6): 1736–1746.

        [41] Domeradzka NE, Werten MW, De Wolf FA, et al. Protein cross-linking tools for the construction of nanomaterials. Curr Opin Biotechnol, 2016, 39: 61–67.

        [42] Heck T, Faccio G, Richter M, et al. Enzyme-catalyzed protein crosslinking. Appl Microbiol Biotechnol, 2013, 97(2): 461–475.

        [43] Hirakawa H, Kamiya N, Tanaka T, et al. Intramolecular electron transfer in a cytochrome P450cam system with a site-specific branched structure. Prot Eng Des Select, 2007, 20(9): 453–459.

        [44] Temperton B, Giovannoni SJ. Metagenomics: microbial diversity through a scratched lens. Curr Opin Microbiol, 2012, 15(5): 605–612.

        [45] Quail MA, Smith M, Coupland P, et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics, 2012, 13(1): 341.

        [46] Dimmer EC, Huntley RP, Alam-Faruque Y, et al. The UniProt-GO annotation database in 2011. Nucleic Acids Res, 2011, 40(D1): D565–D570.

        [47] Maia FRNC, Hajdu J. The trickle before the torrent—diffraction data from X-ray lasers. Sci Data, 2016, 3: 160059.

        [48] Tian L, Liu SJ, Wang S, et al. Ligand-binding specificity and promiscuity of the main lignocellulolytic enzyme families as revealed by active-site architecture analysis. Sci Rep, 2016, 6(1): 23605.

        [49] Yoo YJ, Feng Y, Kim YH, et al. Fundamentals of Enzyme Engineering. Netherlands: Springer, 2017: 87–100.

        [50] Furnham N, de Beer TA, Thornton JM. Current challenges in genome annotation through structural biology and bioinformatics. Curr Opin Struct Biol, 2012, 22(5): 594–601.

        [51] Baker D, Sali A. Protein structure prediction and structural genomics. Science, 2001, 294(5540): 93–96.

        [52] Finn RD, Bateman A, Clements J, et al. Pfam: the protein families database. Nucleic Acids Res, 2013, 42(D1): D222–D230.

        [53] Finn RD, Coggill P, Eberhardt RY, et al. The Pfam protein families database: towards a more sustainable future. Nucleic Acids Res, 2016, 44(D1): D279–D285.

        [54] Prli? A, Kalro T, Bhattacharya R, et al. Integrating genomic information with protein sequence and 3D atomic level structure at the RCSB protein data bank. Bioinformatics, 2016, 32(24): 3833–3835.

        [55] Friedberg I. Automated protein function prediction—the genomic challenge. Briefings in Bioinf, 2006, 7(3): 225–242.

        [56] Lee D, Redfern O, Orengo C. Predicting protein function from sequence and structure. Nature reviews Mol Cell Biol, 2007, 8(12): 995–1005.

        [57] Gu J, Bourne PE. Structural bioinformatics. 2nd ed. Hoboken, NJ, USA: John Wiley & Sons, 2009: 3–14.

        [58] Prakash T, Taylor TD. Functional assignment of metagenomic data: challenges and applications. Brief Bioinf, 2012, 13(6): 711–727.

        [59] Sillitoe I, Cuff AL, Dessailly BH, et al. New functional families (FunFams) in CATH to improve the mapping of conserved functional sites to 3D structures. Nucl Acids Res, 2012, 41(D1): D490–D498.

        [60] Aspeborg H, Coutinho PM, Wang Y, et al. Evolution, substrate specificity and subfamily classification of glycoside hydrolase family 5 (GH5). BMC Evolut Biol, 2012, 12(1): 186.

        [61] Niu CT, Zhu LJ, Xu X, et al. Rational design of thermostability in bacterial 1,3-1,4-β-glucanases through spatial compartmentalization of mutational hotspots. Appl Microbiol Biotechnol, 2017, 101(3): 1085–1097.

        [62] Liu SJ, Shao SJ, Li LL, et al. Substrate-binding specificity of chitinase and chitosanase as revealed by active-site architecture analysis. Carbohyd Res, 2015, 418: 50–56.

        [63] Harms MJ, Thornton JW. Analyzing protein structure and function using ancestral gene reconstruction. Curr Opin Struct Biol, 2010, 20(3): 360–366.

        [64] Jiang XK, Chen GJ, Wang LS. Structural and dynamic evolution of the amphipathic N-terminus diversifies enzyme thermostability in the glycoside hydrolase family 12. Phys Chem Chem Phys, 2016, 18(31): 21340–21350.

        [65] Sun JY, Liu MQ, Xu YL, et al. Improvement of the thermostability and catalytic activity of a mesophilic family 11 xylanase by N-terminus replacement. Prot Exp Purificat, 2005, 42(1): 122–130.

        [66] Jiang XK, Li W, Chen GJ, et al. Dynamic perturbation of the active site determines reversible thermal inactivation in glycoside hydrolase family 12. J Chem Informat Model, 2017, 57(2): 288–297.

        [67] Kapoor D, Kumar V, Chandrayan SK, et al. Replacement of the active surface of a thermophile protein by that of a homologous mesophile protein through structure-guided ‘protein surface grafting’. Biochim Biophys Acta (BBA)-Prot Proteom, 2008, 1784(11): 1771–1776.

        [68] Raghunathan G, Sokalingam S, Soundrarajan N, et al. Modulation of protein stability and aggregation properties by surface charge engineering. Mol BioSyst, 2013, 9(9): 2379–2389.

        [69] Sokalingam S, Raghunathan G, Soundrarajan N, et al. A study on the effect of surface lysine to arginine mutagenesis on protein stability and structure using green fluorescent protein. PLoS ONE, 2012, 7(7): e40410.

        [70] Graziano G, Merlino A. Molecular bases of protein halotolerance. Biochim Biophys Acta (BBA)-Prote Proteom, 2014, 1844(4): 850–858.

        [71] Kern M, McGeehan JE, Streeter SD, et al. Structural characterization of a unique marine animal family 7 cellobiohydrolase suggests a mechanism of cellulase salt tolerance. Proc Natl Acad Sci USA, 2013, 110(25): 10189–10194.

        [72] Fushinobu S, Ito K, Konno M, et al. Crystallographic and mutational analyses of an extremely acidophilic and acid-stable xylanase: biased distribution of acidic residues and importance of Asp37 for catalysis at low pH. Prot Eng, 1998, 11(12): 1121–1128.

        [73] Shirai T, Suzuki A, Yamane T, et al. High-resolution crystal structure of M-protease: phylogeny aided analysis of the high-alkaline adaptation mechanism. Prot Eng, 1997, 10(6): 627–634.

        [74] Umemoto H, Ihsanawati, Inami M, et al. Improvement of alkaliphily ofalkaline xylanase by introducing amino acid substitutions both on catalytic cleft and protein surface. Biosc, Biotechnol, Biochem, 2009, 73(4): 965–967.

        [75] Shivange AV, Hoeffken HW, Haefner S, et al. Protein consensus based surface engineering (ProCoS): a computer-assisted method for directed protein evolution. BioTechniques, 2016, 61(6): 305–314.

        [76] Warden AC, Williams M, Peat TS, et al. Rational engineering of a mesohalophilic carbonic anhydrase to an extreme halotolerant biocatalyst. Nat Commun, 2015, 6: 10278.

        [77] Woodley JM. Protein engineering of enzymes for process applications. Curr Opin Chem Biol, 2013, 17(2): 310–316.

        [78] Kiss G, ?elebi-?l?üM N, Moretti R, et al. Computational enzyme design. Angewandte Chemie Int Edition, 2013, 52(22): 5700–5725.

        [79] Halabi N, Rivoire O, Leibler S, et al. Protein sectors: evolutionary units of three-dimensional structure. Cell, 2009, 138(4): 774–786.

        [80] Csermely P, Korcsmáros T, Kiss HJ, et al. Structure and dynamics of molecular networks: a novel paradigm of drug discovery: a comprehensive review. Pharmacol Therap, 2013, 138(3): 333–408.

        [81] Reynolds KA, Mclaughlin RN, Ranganathan R. Hot spots for allosteric regulation on protein surfaces. Cell, 2011, 147(7): 1564–1575.

        [82] Csermely P, Palotai R, Nussinov R. Induced fit, conformational selection and independent dynamic segments: an extended view of binding events. Trends Biochem Sci, 2010, 35(10): 539–546.

        [83] Mclaughlin RN Jr., Poelwijk FJ, Raman A, et al. The spatial architecture of protein function and adaptation. Nature, 2012, 491(7422): 138–142.

        [84] Marks DS, Hopf TA, Sander C. Protein structure prediction from sequence variation. Nat Biotechnol, 2012, 30(11): 1072–1080.

        [85] Hopf TA, Sch?rfe CP, Rodrigues JP, et al. Sequence co-evolution gives 3D contacts and structures of protein complexes. Elife, 2014, 3: e03430.

        [86] Morcos F, Pagnani A, Lunt B, et al. Direct-coupling analysis of residue coevolution captures native contacts across many protein families. Proc Natl Acad Sci USA, 2011, 108(49): 19459–19460.

        [87] Jones DT, Buchan DW, Cozzetto D, et al. PSICOV: precise structural contact prediction using sparse inverse covariance estimation on large multiple sequence alignments. Bioinformatics, 2011, 28(2): 184–190.

        [88] Weigt M, White RA, Szurmant H, et al. Identification of direct residue contacts in protein–protein interaction by message passing. Proc Natl Acad Sci USA, 2009, 106(1): 67–72.

        [89] Hopf TA, Colwell LJ, Sheridan R, et al. Three-dimensional structures of membrane proteins from genomic sequencing. Cell, 2012, 149(7): 1607–1621.

        [90] Su?kowska JI, Morcos F, Weigt M, et al. Genomics-aided structure prediction. Proc Natl Acad Sci USA, 2012, 109(26): 10340–10345.

        [91] Nugent T, Jones DT. Accurate de novo structure prediction of large transmembrane protein domains using fragment-assembly and correlated mutation analysis. Proc Natl Acad Sci USA, 2012, 109(24): E1540–E1547.

        [92] Marks DS, Colwell LJ, Sheridan R, et al. Protein 3D structure computed from evolutionary sequence variation. PLoS ONE, 2011, 6(12): e28766.

        [93] Liu JT, Duan XY, Sun JY, et al. Bi-factor analysis based on noise-reduction (BIFANR): a new algorithm for detecting coevolving amino acid sites in proteins. PLoS ONE, 2013, 8(11): e79764.

        [94] Ho ML, Adler BA, Torre ML, et al. SCHEMA computational design of virus capsid chimeras: calibrating how genome packaging, protection, and transduction correlate with calculated structural disruption. ACS Synth Biol, 2013, 2(12): 724–733.

        [95] Kufner K, Lipps G. Construction of a chimeric thermoacidophilic beta-endoglucanase. BMC Biochem, 2013, 14(1): 1–9.

        [96] Gibson DG, Glass JI, Lartigue C, et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science, 2010, 329(5987): 52–56.

        [97] Huang ZL, Zhang C, Wu X, et al. Recent progress in fusion enzyme design and applications. Chin J Biotech, 2012, 28(4): 393–409 (in Chinese).黃子亮, 張翀, 吳希, 等. 融合酶的設(shè)計和應(yīng)用研究進(jìn)展. 生物工程學(xué)報, 2012, 28(4): 393–409.

        [98] Elleuche S. Bringing functions together with fusion enzymes—from nature’s inventions to biotechnological applications. Appl Microbiol Biotechnol, 2015, 99(4): 1545–1556.

        [99] Consortium EP. An integrated encyclopedia of DNA elements in the human genome. Nature, 2012, 489(7414): 57–74.

        [100] Krampis K, Booth T, Chapman B, et al. Cloud BioLinux: pre-configured and on-demand bioinformatics computing for the genomics community. BMC Bioinform, 2012, 13(1): 42.

        [101] Marx V. Biology: The big challenges of big data. Nature, 2013, 498(7453): 255–260.

        (本文責(zé)編 郝麗芳)

        Trend of hybrid enzyme design in the big data era

        Qun Zhang, Xiuyun Wu, Xukai Jiang, Yue Zhao, and Lushan Wang

        The State Key Laboratory of Microbial Technology, College of Life Sciences, Shandong University, Jinan 250100, Shandong, China

        The high efficiency and stability of enzymes are the basis for industrial application. Hybrid enzyme suitable for industrial applications could be constructed by many molecular biology technologies including tandem fusion, domain insertion and post-translational protein conjugation. However, the low expression and activity of hybrid enzyme limit its application in industrial production, and multifunctional design of a specific protein domain has been becoming a new trend. With the advent of high-throughput sequencing, biologists are starting to wrestling with massive data sets. Besides, the concept of protein sectors and co-evolution provides novel insight into the relationship of protein structure and function. The residues–covariation of a protein sector displays preference, which imparts functional diversity to different enzymes in the same family. The covariation-residues in specific protein sectors can be located based on the analysis of massive data, and then these functional residues can be assembled in a new enzyme variant using the biotechnology of synthetic biology, thus completing the redesign of natural enzymes. This indicates a new stage of designing hybrid enzyme, as well as the new trend of protein design in the era of biological big data.

        hybrid enzyme, sectors, biological big data, synthetic biology, protein engineering

        December 21, 2017;

        January 12, 2018

        National Natural Science Foundation of China (No. 31370111), Shandong Provincial Natural Science Foundation (No. ZR2013CM038), Shandong University Basic Research Business Special Funds (No. 2015YQ004).

        Lushan Wang. Tel: +86-531-88366202; E-mail: lswang@sdu.edu.cn

        10.13345/j.cjb.170504

        國家自然科學(xué)基金 (No. 31370111),山東省自然科學(xué)基金 (No. ZR2013CM038),山東大學(xué)基本科研業(yè)務(wù)費專項資金 (No. 2015YQ004) 資助。

        2018-05-23

        http://kns.cnki.net/kcms/detail/11.1998.Q.20180522.1335.001.html

        猜你喜歡
        生物功能
        也談詩的“功能”
        中華詩詞(2022年6期)2022-12-31 06:41:24
        生物多樣性
        生物多樣性
        上上生物
        發(fā)現(xiàn)不明生物
        史上“最黑暗”的生物
        軍事文摘(2020年20期)2020-11-28 11:42:50
        第12話 完美生物
        航空世界(2020年10期)2020-01-19 14:36:20
        關(guān)于非首都功能疏解的幾點思考
        懷孕了,凝血功能怎么變?
        媽媽寶寶(2017年2期)2017-02-21 01:21:24
        “簡直”和“幾乎”的表達(dá)功能
        亚洲婷婷久悠悠色悠在线播放| 亚洲AV成人无码久久精品四虎| 蜜桃视频色版在线观看| 国产高清无码91| 亚洲国产日韩综一区二区在性色 | 一区二区三区日本伦理| 国产精品妇女一二三区| 国产免费一区二区三区在线观看| av天堂线上| 亚洲不卡av一区二区三区四区 | 久久亚洲中文字幕精品二区| 少妇愉情理伦片| 99这里只有精品| 青青草一级视频在线观看| 国产性感丝袜在线观看| 男人天堂网2017| 欧美肥胖老妇做爰videos| 99国产精品久久久蜜芽| 视频在线播放观看免费| 亚洲午夜久久久精品影院| 又湿又黄裸乳漫画无遮挡网站| 午夜福利视频男同女同| 国产一区二区三区男人吃奶| 国产午夜手机精彩视频| 天美麻花果冻视频大全英文版 | 国产美女精品一区二区三区| 国产真人无遮挡作爱免费视频 | 97人人超碰国产精品最新o| 国产精品一区成人亚洲| 风韵人妻丰满熟妇老熟| 激情综合丁香五月| 九九免费在线视频| 日本人妻三级在线观看| √天堂资源中文www| a在线观看免费网站大全| 美女精品国产一区二区三区| 国内嫩模自拍诱惑免费视频| 国产台湾无码av片在线观看| 99久久超碰中文字幕伊人| 日本女优在线观看一区二区三区| 国产色婷婷久久又粗又爽|