曲戈,趙晶,鄭平,孫際賓,孫周通
1 中國科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 300308
2 工業(yè)酶國家工程實驗室,天津 300308
3 中國科學(xué)院系統(tǒng)微生物工程重點實驗室,天津 300308
自20世紀后半葉以來,隨著分子生物學(xué)和蛋白分離純化技術(shù)的進步,蛋白質(zhì)在生物技術(shù)、工業(yè)生產(chǎn)、醫(yī)藥食品、基因治療和環(huán)境保護等領(lǐng)域扮演了越來越重要的角色[1-2]。但作為生物催化劑,天然酶存在諸如立體/區(qū)域選擇性差、底物譜窄、催化效率低、穩(wěn)定性差及產(chǎn)物抑制性等問題[3-4],嚴重阻礙了生物催化劑的廣泛應(yīng)用。
為加快對生物催化劑——酶已有性能的改造提升及新功能開發(fā)應(yīng)用,近20年來涌現(xiàn)了一系列蛋白質(zhì)定向進化技術(shù),如飽和突變、易錯PCR和DNA混組等。通過在實驗室條件下模擬自然進化過程,從構(gòu)建的突變體文庫中篩選到能滿足特定需求的目標突變體[3-4],大大拓展了酶的應(yīng)用范圍。如改造后的氧化酶可直接使用氧分子作為電子受體,實現(xiàn)二氧化碳的高效固定[5];CRISPR-Cas9蛋白可識別的序列范圍也更大、更精準[6];重組酶可高效識別HIV病毒基因兩側(cè)特異性位點并將其從宿主基因組中切除[7];能催化卡賓反應(yīng)的仿生金屬酶[8]和實現(xiàn)轉(zhuǎn)氨酶法合成西他列汀的工業(yè)化應(yīng)用[9],都得益于定向進化技術(shù)的發(fā)展應(yīng)用。當今的定向進化技術(shù)整合了有理設(shè)計、適度的隨機突變和高效篩選,可在已知或未知目標蛋白質(zhì)結(jié)構(gòu)信息及催化機制的情況下,對蛋白質(zhì)進行針對性改造。然而,蛋白定向進化技術(shù)在上述領(lǐng)域中的應(yīng)用潛力還遠沒有被挖掘,其主要挑戰(zhàn)在于如何設(shè)計構(gòu)建高質(zhì)量的多樣性突變體文庫和建立高效、快速的篩選方法[10-11]。本文主要從突變體文庫的構(gòu)建方面綜述蛋白質(zhì)定向進化領(lǐng)域涌現(xiàn)的新方法及其應(yīng)用,并對發(fā)展前景進行展望。
根據(jù)突變體文庫構(gòu)建方法的不同,定向進化可分為非理性設(shè)計、半理性設(shè)計和理性設(shè)計3種策略。其大致思路是通過模擬自然進化,對目的基因進行重復(fù)多輪的突變、表達和篩選,從而在短時間內(nèi)完成自然界中需要成千上萬年的進化,最終獲得性能改進或具有新功能的蛋白質(zhì)[12]。
非理性設(shè)計即隨機進化策略,優(yōu)點是不需要對酶序列及結(jié)構(gòu)有深入了解,僅需通過隨機突變和片段重組的方法模擬自然進化。1978年,Michael Smith首次提出定點突變技術(shù)(Site-specific mutagenesis),開啟了蛋白質(zhì)改造與設(shè)計的大門[13]。自此以后,一系列經(jīng)典的基因突變方法被開發(fā)應(yīng)用,主要包括飽和突變(Saturation mutagenesis,SM)、 易 錯 PCR(Error-prone polymerase chain reaction,epPCR) 及DNA重組 (DNA shuffling)。
epPCR概念由Leung團隊于1989年提出[14],然而首次將 epPCR應(yīng)用于酶改造卻是 3年后由Hawkins等進行的體外抗體篩選[15]。其基本原理是通過改變PCR反應(yīng)體系的反應(yīng)條件或使用低保真的 DNA聚合酶,增加堿基隨機錯配率,從而造成多點突變,產(chǎn)生序列多樣性的突變體文庫,因其不需要蛋白結(jié)構(gòu)信息、操作簡單而被研究者廣泛采用。然而該技術(shù)的應(yīng)用受到以下幾方面制約:聚合酶的堿基偏好性 (通常 AG>TC)、突變效率低且缺少后續(xù)突變 (每輪每基因僅 3–5個突變) 等[16]。Arnold團隊于1993年開創(chuàng)性地使用多輪epPCR (sequential epPCR),連續(xù)反復(fù)地對枯草桿菌蛋白酶進行隨機突變,逐步提高了突變體在有機溶劑 DMF中的穩(wěn)定性[17]。通常情況下需要至少連續(xù)4輪的epPCR逐步積累正向突變,才能獲得酶性能顯著提高的目的突變體。
1994年,Stemmer團隊開發(fā)了DNA shuffling技術(shù),主要用于單基因或多基因的重組,不僅可加速有義突變的積累,還能組合兩個或多個已優(yōu)化的參數(shù),并成功提高了β-內(nèi)酰胺酶的活性[18]。該技術(shù)利用DNase將一組帶有有義突變位點的同源基因切成隨機片段 (通常10?50 bp),使用PCR使之延伸重組獲得全長基因。優(yōu)點是操作簡單,不需要蛋白結(jié)構(gòu)信息,容易獲得有義突變;缺點是要求基因序列間至少具有70%的一致性。
20世紀80年代Wells團隊提出寡核苷酸飽和突變(Oligonucleotide-based saturation mutagenesis,OSM)[19],可實現(xiàn)單點飽和突變。Reetz等利用寡聚核苷酸重組技術(shù)實現(xiàn)了多位點飽和突變(Assembly of designed oligonucleotides,ADO)[20]。接著Schwaneberg團隊開發(fā)了序列飽和突變技術(shù)(Sequence saturation mutagenesis,SeSaM)[21],能較好地克服 DNA聚合酶的堿基偏好性并提高突變效率;但因其操作繁瑣、試驗周期長而較少被采用[16]。此外,飽和突變技術(shù)還可與epPCR、DNA shuffling等技術(shù)組合使用,迅速積累有義突變,得到最佳突變組合的酶基因。如 Reetz團隊率先綜合利用這3項傳統(tǒng)技術(shù),成功提高了脂肪酶的對映體選擇性[22-23]。
理性設(shè)計是一種智能改造手段,依賴計算機技術(shù) (in silico) 模擬自然界蛋白質(zhì)的進化軌跡,通過計算機虛擬突變,篩選可快速準確預(yù)測目標突變體。通過一系列基于生物信息學(xué)開發(fā)的算法和程序[24],預(yù)測蛋白質(zhì)活性位點并考察特定位點突變對其穩(wěn)定性、折疊及與底物結(jié)合等方面的影響,從而對蛋白質(zhì)進行針對性地改造和模擬篩選[25]。
在當前第3次酶改造浪潮中,基于計算機輔助設(shè)計和大尺度的分子動力學(xué)模擬可高效、快捷地改造和篩選生物催化劑[26-27],不僅可高精度地預(yù)測蛋白結(jié)構(gòu)[28],還可從頭設(shè)計自然界中不存在的新酶[29],以及對現(xiàn)有酶進行改造,賦予其新功能。如改造后的細胞色素 C氧化酶可提高碳–硅鍵形成的催化效率[30];賦予 30億年來逆轉(zhuǎn)錄酶原本不存在的校對功能[31];從頭設(shè)計能催化Kemp 消除反應(yīng)的新酶[32],及新的(β/α)8TIM 桶蛋白[33]等。
盡管新酶設(shè)計已取得一定成功,但依然面臨諸多挑戰(zhàn):首先,其成功率較低;其次,計算工作繁重,對計算機資源依賴非常高;再次,設(shè)計出的新酶結(jié)構(gòu)和穩(wěn)定性較差,催化活性往往偏低。主要是因為對酶序列/結(jié)構(gòu)/功能之間關(guān)系的認識還不夠深入。
半理性設(shè)計主要借助生物信息學(xué)方法,基于同源蛋白序列比對、三維結(jié)構(gòu)或已有知識,理性選取多個氨基酸殘基作為改造靶點,結(jié)合有效密碼子的理性選用,通過構(gòu)建高質(zhì)量突變體文庫,有針對性地對蛋白質(zhì)進行改造[10]。常見的半理性策略如表1所示。
表1 半理性設(shè)計常用策略Table 1 Strategies of semi-rational design
近年來,結(jié)合非理性和理性設(shè)計的半理性設(shè)計,兼顧了序列空間多樣性 (Sequence space) 和篩選工作量,是一種應(yīng)用非常廣泛的定向進化技術(shù)[44-45]。通過Web of Science 數(shù)據(jù)庫檢索主題“相應(yīng)技術(shù)名稱” AND “biocatalysis”,自 2005 年至今(截止2017年4月25日),生物催化領(lǐng)域應(yīng)用DNA shuffling和 epPCR的文獻數(shù)目共計57篇,應(yīng)用從頭設(shè)計 (de novodesign) 的有62篇,而使用SM的有140篇 (圖1)。由此可見,生物催化領(lǐng)域中半理性設(shè)計策略占據(jù)了主導(dǎo)地位。
通過對來自銅綠假單胞菌Pseudomonas aeruginosa的脂肪酶及其他酶改造發(fā)現(xiàn),對手性選擇有義的突變主要集中在酶催化口袋區(qū)域。Reetz團隊由此提出了組合活性中心飽和突變策略 (Combinatorial active-site saturation test,CAST)[43]:基于序列和/或結(jié)構(gòu)信息,借助計算機模擬在酶催化活性中心周圍選取與底物有直接相互作用的氨基酸殘基,通過理性分組進行單輪或多輪迭代飽和突變 (Iterative saturation mutagenesis,ISM)。一般情況下單輪突變難以達到預(yù)期目標,需要進行多輪疊加突變。為減少篩選規(guī)模,通常將2?4個氨基酸殘基分為一組。這些殘基在空間上彼此靠近,往往具有協(xié)同作用。Kazlauskas團隊統(tǒng)計分析并比較了位于活性中心和遠離活性中心的氨基酸位點突變對酶的活性、底物選擇性、對映體選擇性及穩(wěn)定性的影響,指出前者更有利于改造酶的底物選擇性及對映體選擇性,從統(tǒng)計學(xué)的角度進一步支持了CAST方法的可靠性[46]。因此CAST方法廣泛應(yīng)用于酶的立體/區(qū)域選擇性、底物譜、催化效率等參數(shù)的改造[47-48]。
圖1 定向進化三大策略(無理、半理性和理性設(shè)計)在生物催化領(lǐng)域的文獻發(fā)表(數(shù)據(jù)來自Web of Science,采用主題查詢方式,自2005年至2017年4月25日)Fig. 1 The number of publications on directed evolution (non-, semi- and rational design) in the field of biocatalysis. Data were collected from Web of Science since 2005 to April 25, 2017, using Topic search. DS:DNA shuffling; epPCR: error-prone PCR; SM: saturation sutagenesis; de novo:de novo design. “+” represents AND biocatalysis; Dashed line denotes the trend of publication numbers.
以4位點 (A、B、C和D) 的ISM系統(tǒng)為例(圖 2A),一共有 24條進化路徑,其中每個位點可包括1至多個氨基酸殘基,對每個位點分別進行飽和突變,產(chǎn)生4個不同的突變體文庫。在進行下一輪迭代突變時,已進行過突變的位點保留。因此理論上4個位點全部完成迭代突變共需4輪,即構(gòu)建64個突變體文庫。然而實際上由于僅選取每輪迭代篩選到的最優(yōu)突變體進行下一輪突變,所以構(gòu)建的突變體文庫數(shù)目遠小于理論值。為了防止進入進化路線中局部最優(yōu)的“死胡同” (紅色虛線,圖 2B),可從上輪篩選中選取性能次好的突變體作為模板,進行后續(xù)的迭代突變[4,49]。
圖2 ISM系統(tǒng)進化路徑與能壘分布[4]Fig. 2 Representation of ISM system featuring all of the evolutionary pathways and energy barrier distributions[4]. (A)ISM scheme for 4-site system involving 24 upward pathways. (B) Experimental fitness-pathway landscape featuring all 24 pathways of a four-site ISM system using an epoxide hydrolase as catalyst in the kinetic resolution of a racemic epoxide. Green line: typical trajectory in which every mutant library in the four-step sequence contains an improved mutant (no local minima). Red line: typical trajectory in which at least one library along the four-step sequence is devoid of an improved mutant (local minimum).
篩選工作是酶定向改造中最重要的瓶頸[26,48]。基于CAST/ISM的半理性設(shè)計方法試圖通過建立針對特定改造靶點的高質(zhì)量突變體文庫來解決篩選問題[50]。雖然獲得了極大成功,然而隨著擬突變位點數(shù)目的增加,篩選規(guī)模呈指數(shù)級增長。以NNK簡并密碼子為例,設(shè)定95%文庫覆蓋度,如果同時突變10個位點時,需篩選3.4×1015個轉(zhuǎn)化子,即使采用 NDT為簡并密碼子,仍需篩選1.9×1011個轉(zhuǎn)化子 (表2)。因此需要設(shè)計開發(fā)更加高效的建庫策略來解決酶定向進化的篩選問題。
為降低篩選規(guī)模,僅使用單密碼子對酶催化口袋進行掃描,稱之為單密碼子飽和突變(SCSM)[51-52]?;诿复呋诖睦砘再|(zhì) (如親疏水性)以及已有信息,理性選取某一特定的氨基酸密碼子作為建構(gòu)單元,重塑酶催化口袋,達到提高或反轉(zhuǎn)立體選擇性目的[52]。以同時突變 10個位點為例,在95%覆蓋度下,篩選規(guī)模從NNK的約3×1015或NDT的2×1011(表2),降至約3 000。該方法的難點在于單密碼子的選擇,并缺少多密碼子間的協(xié)同作用。
為進一步降低篩選工作量,基于蛋白序列(多重序列同源比對確定保守位點) 及結(jié)構(gòu) (晶體結(jié)構(gòu)或同源建模) 的相關(guān)信息,結(jié)合酶的催化性質(zhì)及已知實驗數(shù)據(jù)支持,理性選擇3種氨基酸密碼子作為飽和突變的建構(gòu)單元,然后將擬突變的多個位點進行理性分組 (3?4個氨基酸殘基分為一組),該策略稱之為三密碼子飽和突變 (TCSM)。仍以同時突變10個位點為例,突變體文庫容量約為 3.14×106;而如果將該 10位點分為 3組(4+3+3),并分別構(gòu)建突變體文庫,那么突變體文庫的總體規(guī)模則可降至1 152 (768+192+192)。由此可見,選取合適的簡并密碼子,將多個擬突變位點理性分為若干組并分別構(gòu)建突變體文庫,結(jié)合ISM策略可有效減少轉(zhuǎn)化子篩選量[53-54]。
綜上所述,定向進化技術(shù)從誕生發(fā)展至今,經(jīng)歷了從隨機到半理性的過程,同時借助計算機技術(shù)向理性方向發(fā)展。在此過程中依據(jù)基礎(chǔ)和應(yīng)用研究的需要,涌現(xiàn)了一系列實用的新技術(shù),主要是為了平衡因不同建庫策略所帶來的序列多樣性和篩選工作量問題,重在提高文庫構(gòu)建的質(zhì)量。定向進化發(fā)展過程中的重要事件總結(jié)如圖 3所示,未來走向基于計算機技術(shù)的理性設(shè)計是必然,但任重而道遠,半理性設(shè)計依然會成為未來10年內(nèi)的主流技術(shù)。
圖3 定向進化技術(shù)大事記Fig. 3 Events in directed evolution.
以檸檬烯環(huán)氧水解酶 (LEH) 催化環(huán)氧己烷合成手性環(huán)己烷-1,2-二醇為模式反應(yīng)。借助計算機模擬選取 LEH疏水口袋與底物直接相互作用的10個氨基酸殘基(L74/F75/M78/I80/L103/L114/I116/F134/F139/L147)作為改造靶點,理性選取疏水的纈氨酸 (V) 和苯丙氨酸 (F) 分別作為構(gòu)建單元,對所選取的 10個位點進行SCSM組合掃描及迭代飽和突變??偤Y選約4 000個轉(zhuǎn)化子,成功獲得了立體選擇性提高和反轉(zhuǎn)的突變體,將ee值從野生型的2% (S,S)-構(gòu)型提高到了92%,而(R,R)-構(gòu)型的達到 96%[52]。為進一步降低篩選規(guī)模,提高建庫質(zhì)量,重新選取 10個氨基酸殘基(M32/L35/L74/M78/I80/V83/L103/L114/I116/L147)作為改造靶點,隨機分為3組(A: I80/V83/L114/I116;B: L74/M78/L147; C: M32/L35/L103) (圖 4)。理性選取 V-F-Y為氨基酸密碼子作為構(gòu)建單元,進行TCSM建庫和迭代飽和突變。在庫A中直接獲得了 (S,S)-構(gòu)型ee值提高至99%突變體和反轉(zhuǎn)突變(R,R)-構(gòu)型達到 89%,通過 1?2步 TCSM迭代飽和突變分別訪問B庫和/或C庫,(R,R)-構(gòu)型的ee值可達到97%,總篩選規(guī)模約1 000個轉(zhuǎn)化子[53]。同樣以LEH為例,采用TCSM方法同時對立體選擇性、熱穩(wěn)定性和催化活力進行共進化,通過TCSM 設(shè)計和建庫,雖然催化效率略有降低,但成功將ee值提高至94% (S,S)和80% (R,R),同時熱穩(wěn)定性提高了5?10 ℃,首次實現(xiàn)了立體選擇性和熱穩(wěn)定性的共進化[55]。
為進一步驗證TCSM的通用性,以嗜熱厭氧菌Thermoanaerobacter brockii來源的醇脫氫酶(TbSADH) 不對稱催化 α,α′碳骨架非常近似的羰基還原為手性醇。嘗試化學(xué)法難以催化的反應(yīng),如四氫呋喃-3-酮、四氫噻吩-3-酮還原為手性醇(分別用于合成抗艾滋病藥物安普那韋、膦沙那韋和第三代抗生素硫培南類藥物)。野生型TbSADH對四氫呋喃-3-酮的立體選擇性僅有23%且偏向于R-構(gòu)型。通過TCSM設(shè)計和建庫,分別理性選取纈氨酸-天冬酰胺-亮氨酸 (V-N-L) 和纈氨酸-谷氨酰胺-亮氨酸 (V-Q-L) 作為R-和S-構(gòu)型改造的構(gòu)建單元,將5個擬突變位點理性分為兩組,用來構(gòu)建和篩選R-和S-選擇性的突變體文庫,分別篩選576個轉(zhuǎn)化子后即獲得了系列提高的R-和S-選擇性突變體,ee值達到95%?99%[54]。
圖4 LEH結(jié)合口袋10個位點的選取及隨機分組Fig. 4 Ten residues lining the binding pocket of LEH,assigned to three randomization sites: A (blue), B (green),and C (yellow). Substrate 1 is shown by grey sticks.
TCSM的另一個應(yīng)用實例是對來自巨大芽孢桿菌自給型細胞色素 P450-BM3單加氧酶的定向進化改造。基于野生型 P450-BM3的晶體結(jié)構(gòu)及前期對酶結(jié)合口袋的研究,通過理性選擇突變位點及構(gòu)建密碼子單元,Li等成功地改造了該酶的區(qū)域選擇性、立體選擇性和底物適配性,并結(jié)合醇脫氫酶 (ADH) 設(shè)計級聯(lián)反應(yīng),以惰性石油基化合物環(huán)己烷為原料,可按設(shè)計一鍋法分別合成相應(yīng) (R,R)-型、(S,S)-型或消旋型手性二醇產(chǎn)物[56]。
因此,SCSM和TCSM策略的設(shè)計可大幅提高建庫質(zhì)量和降低篩選規(guī)模,在保證95%文庫覆蓋度的情況下,與使用 NNK密碼子相比,篩選工作量降低了 1012倍。并加速對酶的立體選擇/區(qū)域選擇性改造,已成功應(yīng)用于對檸檬烯環(huán)氧水解酶 (LEH)[53,55]、醇脫氫酶 (ADH)[54,57]和細胞色素P450單加氧酶[56]的改造。
近年來定向進化技術(shù)廣泛應(yīng)用于生物催化劑改造,但篩選工作是限制酶定向進化改造的瓶頸。探索高質(zhì)量突變體文庫的構(gòu)建及篩選新方法是定向進化領(lǐng)域的重要研究內(nèi)容?;贑AST/ISM的原理,孫周通等開發(fā)了系列快速半理性設(shè)計方法,如SCSM和TCSM,通過建立“小而精”的高質(zhì)量突變體文庫來解決篩選問題,為有機化學(xué)和生物技術(shù)中酶的改造和應(yīng)用提供了新策略。
TCSM 解決了定向進化一直存在的篩選瓶頸,總體篩選規(guī)模可控制在1 000左右,單文庫可控制在500左右,甚至更低 (<200)。使定向進化不再依賴于篩選方法,可應(yīng)用于酶的立體選擇性、區(qū)域選擇性及底物適配性等多參數(shù)并行改造,快速高效設(shè)計生物催化劑應(yīng)用于藥物前體催化,解決化學(xué)法難以催化的反應(yīng)等。不難想象,TCSM將會受到有機催化、生物催化、代謝工程與合成生物技術(shù)等領(lǐng)域研究人員更多的關(guān)注與應(yīng)用。此外,作者也嘗試了利用雙密碼子飽和突變(DCSM)[58],即采用兩個密碼子作為構(gòu)建單元重塑酶催化口袋。同樣以 LEH的立體選擇性改造為例,與SCSM和TCSM進行了系統(tǒng)的比較研究,拓展了定向進化技術(shù)工具箱[58]。然而無論哪種密碼子飽和突變策略,均依賴酶的保守位點、三維結(jié)構(gòu)和/或已有知識,可根據(jù)改造對象和應(yīng)用目的選擇合適突變策略及對其進行組合應(yīng)用。
除了構(gòu)建“小而精”的突變體文庫可有效克服篩選瓶頸外,將突變體篩選工作轉(zhuǎn)移至計算機進行虛擬篩選,也是快速獲得目標突變體的有效方式。2015年,Dick Janssen和David Baker團隊合作,將LEH催化中心附近的11個位點突變?yōu)槭杷詺埢?,并利用分子動力學(xué)模擬等計算機技術(shù)對突變體文庫進行虛擬篩選,最終僅通過實驗構(gòu)建驗證 37個突變體即獲得成功[59]。組合使用基于計算機設(shè)計大規(guī)模初篩和實驗室小規(guī)模二次篩選將成為解決篩選瓶頸的重要策略,同時隨著基因合成成本的降低,結(jié)合突變體文庫的全合成建庫策略,可以有效減少密碼子引入的偏好性和提高文庫序列多樣性,將成為定向進化技術(shù)重要的發(fā)展方向。
[1]Romero PA, Arnold FH. Exploring protein fitness landscapes by directed evolution. Nat Rev Mol Cell Biol, 2009, 10(12): 866–876.
[2]Packer MS, Liu DR. Methods for the directed evolution of proteins. Nat Rev Genet, 2015, 16(7):379–394.
[3]Bommarius AS. Biocatalysis: a status report. Annu Rev Chem Biomol Eng, 2015, 6(1): 319–345.
[4]Reetz MT. Biocatalysis in organic chemistry and biotechnology: past, present, and future. J Am Chem Soc, 2013, 135(34): 12480–12496.
[5]Schwander T, Schada von Borzyskowski L, Burgener S, et al. A synthetic pathway for the fixation of carbon dioxidein vitro. Science, 2016, 354(6314):900–904.
[6]Kleinstiver BP, Prew MS, Tsai SQ, et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature, 2015, 523(7561): 481–485.
[7]Karpinski J, Hauber I, Chemnitz J, et al. Directed evolution of a recombinase that excises the provirus of most HIV-1 primary isolates with high specificity.Nat Biotechnol, 2016, 34(4): 401–409.
[8]Dydio P, Key HM, Nazarenko A, et al. An artificial metalloenzyme with the kinetics of native enzymes.Science, 2016, 354(6308): 102–106.
[9]Savile CK, Janey JM, Mundorff EC, et al.Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin manufacture.Science, 2010, 329(5989): 305–309.
[10]Cheng F, Zhu LL, Schwaneberg U. Directed evolution 2.0: improving and deciphering enzyme properties. Chem Commun, 2015,51(48):9760–9772.
[11]Denard CA, Ren HQ, Zhao HM. Improving and repurposing biocatalysts via directed evolution. Curr Opin Chem Biol, 2015, 25: 55–64.
[12]Sheldon RA, Pereira PC. Biocatalysis engineering:the big picture. Chem Soc Rev, 2017, 46(10):2678–2691.
[13]Hutchison III CA, Phillips S, Edgell MH, et al.Mutagenesis at a specific position in a DNA sequence. J Biol Chem, 1978, 253(18): 6551–6560.
[14]Leung DW, Chen E, Goeddel DV. A method for random mutagenesis of a defined DNA segment using a modified polymerase chain reaction.Technique, 1989, 1: 11–15.
[15]Hawkins RE, Russell SJ, Winter G. Selection of phage antibodies by binding affinity: mimicking affinity maturation. J Mol Biol, 1992, 226(3):889–896.
[16]Ruff AJ, Dennig A, Schwaneberg U. To get what we aim for——Progress in diversity generation methods.FEBS J, 2013, 280(13): 2961–2978.
[17]Chen KQ, Arnold FH. Tuning the activity of an enzyme for unusual environments: sequential random mutagenesis of subtilisin E for catalysis in dimethylformamide. Proc Natl Acad Sci USA, 1993,90(12): 5618–5622.
[18]Stemmer WPC. Rapid evolution of a protein in vitro by DNA shuffling. Nature, 1994, 370(6488):389–391.
[19]Wells JA, Vasser M, Powers DB. Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites. Gene, 1985,34(2/3): 315–323.
[20]Zha DX, Eipper A, Reetz MT. Assembly of designed oligonucleotides as an efficient method for gene recombination: a new tool in directed evolution.ChemBioChem, 2003, 4(1): 34–39.
[21]Wong TS, Tee KL, Hauer B, et al. Sequence saturation mutagenesis (SeSaM): a novel method for directed evolution. Nucleic Acids Res, 2004, 32(3):e26.
[22]Reetz MT, Zonta A, Schimossek K, et al. Creation of enantioselective biocatalysts for organic chemistry by in vitro evolution. Angew Chem Int Ed, 1997, 36(24):2830–2832.
[23]Reetz MT, Wilensek S, Zha DX, et al. Directed evolution of an enantioselective enzyme through combinatorial multiple-cassette mutagenesis. Angew Chem Int Ed, 2001, 40(19): 3589–3591.
[24]Ebert MC, Pelletier JN. Computational tools for enzyme improvement: why everyone can- and should-use them. Curr Opin Chem Biol, 2017, 37:89–96.
[25]Huang PS, Boyken SE, Baker D. The coming of age ofde novoprotein design. Nature, 2016, 537(7620):320–327.
[26]Bornscheuer UT, Huisman GW, Kazlauskas RJ, et al.Engineering the third wave of Biocatalysis. Nature,2012, 485(7397): 185–194.
[27]Privett HK, Kiss G, Lee TM, et al. Iterative approach to computational enzyme design. Proc Natl Acad Sci USA, 2012, 109(10): 3790–3795.
[28]Ovchinnikov S, Park H, Varghese N, et al. Protein structure determination using metagenome sequence data. Science, 2017, 355(6322): 294–298.
[29]Lin YR, Koga N, Tatsumi-Koga R, et al. Control over overall shape and size in de novo designed proteins.Proc Natl Acad Sci USA, 2015, 112(40):E5478–E5485.
[30]Kan SBJ, Lewis RD, Chen K, et al. Directed evolution of cytochrome c for carbon-silicon bond formation: bringing silicon to life. Science, 2016,354(6315): 1048–1051.
[31]Ellefson JW, Gollihar J, Shroff R, et al. Synthetic evolutionary origin of a proofreading reverse transcriptase. Science, 2016, 352(6293): 1590–1593.
[32]R?thlisberger D, Khersonsky O, Wollacott AM, et al.Kemp elimination catalysts by computational enzyme design. Nature, 2008, 453(7192): 190–195.
[33]Huang PS, Feldmeier K, Parmeggiani F, et al.De novodesign of a four-fold symmetric TIM-barrel protein with atomic-level accuracy. Nat Chem Biol,2015, 12(1): 29–34.
[34]O'Maille PE, Bakhtina M, Tsai MD. Structure-based combinatorial protein engineering (SCOPE). J Mol Biol, 2002, 321(4): 677–691.
[35]Wijma HJ, Floor RJ, Jekel PA, et al. Computationally designed libraries for rapid enzyme stabilization.Protein Eng Des Sel, 2014, 27(2): 49–58.
[36]Chen F, Gaucher EA, Leal NA, et al. Reconstructed evolutionary adaptive paths give polymerases accepting reversible terminators for sequencing and SNP detection. Proc Natl Acad Sci USA, 2010,107(5): 1948–1953.
[37]Kuipers RK, Joosten HJ, van Berkel WJH, et al.3DM: systematic analysis of heterogeneous superfamily data to discover protein functionalities.Proteins, 2010, 78(9): 2101–2113.
[38]Fox RJ, Davis SC, Mundorff EC, et al. Improving catalytic function by ProSAR-driven enzyme evolution. Nat Biotechnol, 2007, 25(3): 338–344.
[39]Gonzalez-Perez D, Molina-Espeja P, Garcia-Ruiz E,et al. Mutagenic organized recombination process by homologousin vivogrouping (MORPHING) for directed enzyme evolution. PLoS ONE, 2014, 9(3):e90919.
[40]Gutierrez EA, Mundhada H, Meier T, et al.Reengineered glucose oxidase for amperometric glucose determination in diabetes analytics. Biosens Bioelectron, 2013, 50(4): 84–90.
[41]Voigt CA, Martinez C, Wang ZG, et al. Protein building blocks preserved by recombination. Nat Struct Mol Biol, 2002, 9(7): 553–558.
[42]Reetz MT, Carballeira JD, Vogel A. Iterative saturation mutagenesis on the basis of B factors as a strategy for increasing protein thermostability.Angew Chem Int Ed, 2006, 45(46): 7745–7751.
[43]Reetz MT, Bocola M, Carballeira JD, et al.Expanding the range of substrate acceptance of enzymes: combinatorial active-site saturation test.Angew Chem Int Ed, 2005, 44(27): 4192–4196.
[44]Lutz S. Beyond directed evolution-semi-rational protein engineering and design. Curr Opin Biotechnol, 2010, 21(6): 734–743.
[45]Chica RA, Doucet N, Pelletier JN. Semi-rational approaches to engineering enzyme activity:combining the benefits of directed evolution and rational design. Curr Opin Biotechnol, 2005, 16(4):378–384.
[46]Morley KL, Kazlauskas RJ. Improving enzyme properties: when are closer mutations better? Trends Biotechnol, 2005, 23(5): 231–237.
[47]Reetz MT, Prasad S, Carballeira JD, et al. Iterative saturation mutagenesis accelerates laboratory evolution of enzyme stereoselectivity: rigorous comparison with traditional methods. J Am Chem Soc, 2010, 132(26): 9144–9152.
[48]Reetz MT, Kahakeaw D, Lohmer R. Addressing the numbers problem in directed evolution.ChemBioChem, 2008, 9(11): 1797–1804.
[49]Gumulya Y, Sanchis J, Reetz MT. Many pathways in laboratory evolution can lead to improved enzymes:how to escape from local minima. ChemBioChem,2012, 13(7): 1060–1066.
[50]Reetz MT, Sanchis J. Constructing and analyzing the fitness landscape of an experimental evolutionary process. ChemBioChem, 2008, 9(14):2260–2267.
[51]Sun ZT, Wikmark Y, B?ckvall JE, et al. New concepts for increasing the efficiency in directed evolution of stereoselective enzymes. Chem Eur J,2016, 22(15): 5046–5054.
[52]Sun ZT, Lonsdale R, Kong XD, et al. Reshaping an enzyme binding pocket for enhanced and inverted stereoselectivity: use of smallest amino acid alphabets in directed evolution. Angew Chem Int Ed,2015, 54(42): 12410–12415.
[53]Sun ZT, Lonsdale R, Wu L, et al. Structure-guided triple-code saturation mutagenesis: efficient tuning of the stereoselectivity of an epoxide hydrolase. ACS Catal, 2016, 6(3): 1590–1597.
[54]Sun ZT, Lonsdale R, Ilie A, et al. Catalytic asymmetric reduction of difficult-to-reduce ketones:triple-code saturation mutagenesis of an alcohol dehydrogenase. ACS Catal, 2016, 6(3): 1598–1605.
[55]Li GY, Zhang H, Sun ZT, et al. Multiparameter optimization in directed evolution: engineering thermostability, enantioselectivity, and activity of an epoxide hydrolase. ACS Catal, 2016, 6(6):3679–3687.
[56]Li AT, Ilie A, Sun ZT, et al. Whole-cell-catalyzed multiple regio- and stereoselective functionalizations in cascade reactions enabled by directed evolution.Angew Chem Int Ed, 2016, 55(39): 12026–12029.
[57]Sun ZT, Li GY, Ilie A, et al. Exploring the substrate scope of mutants derived from the robust alcohol dehydrogenase TbSADH. Tetrahedron Lett, 2016,57(32): 3648–3651.
[58]Sun ZT, Lonsdale R, Li GY, et al. Comparing different strategies in directed evolution of enzyme stereoselectivity: single- versus double-code saturation mutagenesis. ChemBioChem, 2016,17(19): 1865–1872.
[59]Wijma HJ, Floor RJ, Bjelic S, et al. Enantioselective enzymes by computational design andin silicoscreening. Angew Chem Int Ed, 2015, 54(12):3726–3730.