陳永燦,司同,張建志
(中國科學院深圳先進技術研究院,深圳合成生物學創(chuàng)新研究院,中國科學院定量工程生物學重點實驗室,廣東 深圳 518055)
微生物細胞工廠在現(xiàn)代工業(yè)生物技術中起著核心作用。然而,天然微生物的產(chǎn)物種類有限且產(chǎn)量較低,無法滿足各個領域?qū)瘜W品的生產(chǎn)需求。傳統(tǒng)的微生物育種方法主要依賴于天然微生物的篩選和非理性誘變育種技術,隨機性強且耗時長[1-3]。為了提高生產(chǎn)水平,研究者利用基因工程技術對細胞代謝途徑進行了改造和設計,構建異源分子的生物合成途徑。然而,由于細胞網(wǎng)絡的復雜性和非線性特征,人工引入的外源通路和底盤基因組突變往往難以實現(xiàn)預期功能,需要對大量基因元件、線路和系統(tǒng)進行反復合成和調(diào)試,缺乏對細胞工廠的理性設計能力[4],這導致了構建人工微生物細胞工廠時間和成本的增加[5]。
為了解決這些困難,依托自動化設施平臺的自動化合成生物技術應運而生。自動化合成生物設施平臺又稱自動化合成生物鑄造廠(biofoundry),以合成生物學基礎研究為理論基礎,把自動化工業(yè)的智能制造理念引入到合成生物學研究中。基于智能化、自動化及高通量設備和機器人系統(tǒng),結合設計軟件與機器學習,開發(fā)自動化合成生物技術,快速、低成本、多循環(huán)地完成“設計-構建-測試-學習”的閉環(huán),服務于包括細胞工廠構建在內(nèi)的合成生物學研究與產(chǎn)業(yè)應用[6]。目前,在全球范圍內(nèi)相繼投資建設了數(shù)十個自動化合成生物鑄造廠,并成立了“全球合成生物設施聯(lián)盟”(Global Biofoundry Alliance,GBA),進行基礎設施、數(shù)據(jù)資源、合成生物標準的開放共享,共同應對自動化合成生物研究的技術難題[7]。自動化合成生物技術依托合成生物設施軟硬件平臺,將生物體系設計、構建、表征與分析等合成生物技術工藝進行自動化開發(fā)與應用,以減少人員干預并降低錯誤率,提高通量和可重復性[8]。
自動化合成生物技術的一個重要應用領域就是開發(fā)標準化生物元件庫、模塊化的DNA組裝技術和精準的基因編輯方法,以實現(xiàn)對細胞工廠的規(guī)?;O計、組裝和改造[9-12]。在構建人工細胞工廠的過程中涉及 “設計-構建-測試-學習”(designbuild-test-learn,DBTL)的循環(huán)步驟,其中“構建”是最耗時、耗力的過程之一[13]。細胞工廠“構建”步驟主要需要完成兩類實驗任務:①工程DNA的構建;②底盤細胞的操作[8,12]。為了自動化完成這些實驗任務,需要開發(fā)對應的硬件平臺、軟件系統(tǒng)和工藝流程。在工程DNA的構建過程中,涉及基因合成、PCR擴增、酶切、組裝、提取純化、測序等多個步驟。而微生物細胞底盤的操作包括工程DNA轉化、菌落涂布、菌落挑取、細胞裂解和熒光分選等驗證流程。開發(fā)相應的硬件和軟件系統(tǒng)是實現(xiàn)生物學實驗操作自動化的關鍵。在硬件系統(tǒng)方面,標準化的實驗容器及其配套設備,包括機械臂、液體工作站、分液器、封膜儀和撕膜儀等,均是必需的。而在軟件系統(tǒng)方面,集成軟件可以控制自動化實驗儀器并管理物料與數(shù)據(jù),實現(xiàn)實驗過程的自動化控制和數(shù)據(jù)分析。針對Thermo、TECAN等主流合成生物自動化品牌商的設備特點以及在自動化設施平臺搭建過程中的設備選型方案,Thurow K.和Junginger S.進行了專門的比較和論證[14]。更進一步,自動化合成生物研究通過引入人工智能算法,大幅提升研究過程中實驗對象、方法、技術的標準化和模塊化水平,不但可以快速積累大批優(yōu)質(zhì)生物元件,還可以產(chǎn)生高質(zhì)量、大規(guī)模的實驗數(shù)據(jù),實現(xiàn)數(shù)據(jù)驅(qū)動的DBTL自動化閉環(huán),不斷提升細胞工廠的構建速度、研發(fā)效率和理性設計水平[8,12,15-17]。本文將重點針對自動化細胞工廠構建過程中的DNA組裝及微生物細胞操作兩個自動化合成生物技術比較關注的方向的進展進行介紹。對于自動化基因編輯,特別是基于CRISPR(clustered regularly interspaced palindromic repeats)家族及其衍生技術的自動化基因組工程[18-21],以及DBTL循環(huán)中的其他步驟,例如“設計”[22]、“測試”[12,23]和“學習”[24-25],讀者可參考其他相關的專業(yè)文獻報道。
為了獲得符合下游實驗要求的DNA組裝產(chǎn)物,并提高DNA組裝自動化的成功率和效率,需要對自動化DNA組裝進行預先頂層設計。合成生物學設計是除集成控制軟件外合成生物自動化設施在軟件方面的另一個重要組成,主要包括零件與系統(tǒng)設計、DNA組裝圖譜設計[26]。其中,DNA組裝圖譜設計以工程DNA序列為輸入,基于所計劃采用的DNA組裝方法,輸出產(chǎn)生目標DNA序列所需的元件序列和組裝路徑。DNA組裝圖譜設計工具是自動化DNA合成和組裝的關鍵共性技術。Vector NTI[27]是早期開發(fā)的一款商業(yè)化序列分析和設計工具集成套件,但無法滿足利用標準化元件進行大量DNA組裝的設計需求。美國能源部Agile Biofoundry研發(fā)了網(wǎng)頁版DNA組裝設計軟件j5[28],可根據(jù)用戶選擇或軟件推薦的組裝方法設計組裝圖譜和組裝過程,并編譯產(chǎn)生可用于移液工作站、微流控等的操作指令,大大提高了設計效率。波士頓大學Douglas Densmore團隊開發(fā)了RAVEN工具[29],不僅實現(xiàn)了DNA設計自動化,還可通過自主學習算法基于實驗結果以交互方式優(yōu)化組裝設計。此外,伊利諾伊大學iBioFAB團隊研發(fā)了DNA組裝設計軟件iBioCAD[30],可基于酵母體內(nèi)組裝、Gibson組裝、連接酶循環(huán)反應(ligase cycling reaction, LCR)和Golden Gate等不同方法進行工程DNA的構建設計;該團隊還開發(fā)了PlasmidMaker[31],允許用戶從網(wǎng)站前端界面提交質(zhì)粒構建需求,由系統(tǒng)自動化完成引物設計后根據(jù)任務清單觸發(fā)機器人系統(tǒng)完成自動化DNA組裝。愛丁堡大學EGF團隊針對同源臂設計、序列優(yōu)化、組裝規(guī)劃、計算機輔助酶切、測序驗證等DNA組裝流程中的不同環(huán)節(jié),開發(fā)了包含一系列DNA組裝工具的CUBA軟件平臺(https://cuba.genomefoundry.org/)。然而,針對合成生物自動化發(fā)展的新需求,如大規(guī)模DNA序列的組合式并行設計、大片段DNA可視化分析和操作、基于機器學習的DNA組裝反饋優(yōu)化等,還需要開發(fā)更多的DNA組裝設計工具。
基于上述生物設計自動化(bio-design automation,BDA)軟件完成DNA組裝方案設計后,需要采用一系列高通量DNA組裝方法快速、高效地完成從單個轉錄單元到整個合成生物系統(tǒng)的拼裝和構建[32]。這些方法包括如下幾類:①基于限制性內(nèi)切酶的組裝技術,如Golden Gate、BioBrick、Flexi Cloning、MASTER等方法,此類方法基于限制性內(nèi)切酶使基因片段和載體產(chǎn)生互補的黏性末端序列,并通過DNA連接酶進行無痕組裝;②基于同源重組的組裝技術,包括Gibson、Gateway、Echo Cloning、Creator等體外酶法組裝,以及DNA assembler等酵母胞內(nèi)組裝方法,此類方法簡便高效,既可用于單片段的克隆,也可用于多片段與載體的組裝,且不受到酶切位點的限制;③基于寡核苷酸的架橋法組裝技術,該方法通過設計與相鄰DNA的兩端序列互補的單鏈橋接寡核苷酸(bridging oligo),在較低溫度下進行退火,從而使上游片段的3′端與下游片段的5′端連接,將2個DNA片段組裝成單個的線性片段。然后以組裝好的線性片段為模板來組裝互補鏈,通過多次熱循環(huán),將線性DNA片段組裝成環(huán)形質(zhì)粒;④基于可編程核酸酶的組裝技術,如基于CRISPR系統(tǒng)Cpf1蛋白的大DNA片段體外編輯CCTL方法(Cpf1-assisted Cutting and Taq DNA ligase-assisted Ligation)、基于Ago蛋白的PlasmidMaker方法等。
其中,Golden Gate組裝方法[圖1(a)]和Gibson組裝方法[圖1(b)]都可以一步實現(xiàn)轉錄單元的高效率、規(guī)?;囱b,有利于節(jié)省后續(xù)對構成轉錄單元的生物元件進行優(yōu)化和替換的時間,是自動化合成生物研究中最常用的DNA組裝方法[32]。Gibson方法依賴T5核酸外切酶、DNA聚合酶和TaqDNA連接酶的組合作用。首先T5核酸外切酶作用于待組裝的雙鏈DNA片段后生成可互補配對的黏性末端并自發(fā)配對成雙鏈DNA結構,利用DNA聚合酶將空隙補齊,在TaqDNA連接酶作用下,缺口被連接形成完整的DNA分子。Golden Gate組裝方法基于ⅡS型限制性內(nèi)切酶在同一反應體系中進行酶切和質(zhì)粒組裝。ⅡS型限制性內(nèi)切酶,如BsaⅠ、BsmBⅠ等,在其識別序列的外側進行切割產(chǎn)生4 bp的黏性末端。因此,只需在相鄰片段上合理地設計4 bp的互補序列接口(linker),就可進行無痕組裝。理論上,4 bp互補區(qū)域有256種不同組合,可實現(xiàn)多片段一次性組裝,且不受重復序列的影響。同時,通過多種ⅡS型限制性內(nèi)切酶的替換使用,可實現(xiàn)模塊化的多輪逐級組裝(hierarchical assembly)。但在實際應用中,不同接口序列的組裝效率、特異性不同,需要進行優(yōu)化[30]。此外,基于Golden Gate方法的DNA組裝需要移除目的基因和質(zhì)粒載體序列中的BsaI、BsmBI等酶切位點,會增加DNA組裝工藝的復雜性和成本。
圖1 Golden Gate和Gibson組裝自動化[33]Fig. 1 Automated DNA assembly methods[33]
研究者分別采用Golden Gate[圖1(c)]和Gibson[圖1(d)]組裝方法以紅色熒光蛋白為報告基因完成了相應轉錄單元的半自動化構建[33]。研究者主要基于超聲納升移液儀Echo 550、自動化PCR儀和384孔板,實施了2片段DNA的快速組裝和工程DNA轉化等生物學操作,并通過Sanger測序和凝膠電泳的方法對質(zhì)粒進行了驗證?;贓cho,單次移液體積可減少至2.5 nL,連接反應體系縮小至50 nL,是常規(guī)人工操作所需體積的1/20~1/100,不僅實現(xiàn)了較高的組裝成功率,亦可有效地降低試劑和連接酶的成本?;贕olden Gate組裝方法,伊利諾伊大學趙惠民團隊[11]開發(fā)了類轉錄激活因子感受器核酸酶(transcription activatorlike effector nucleases, TALEN)表達質(zhì)粒的自動化組裝方法。研究者將192個人基因組位點信息輸入自主開發(fā)的DNA組裝設計軟件Script Generator對TALEN序列進行設計,并生成自動化組裝流程腳本,通過連接酶反應、大腸桿菌轉化和培養(yǎng)、質(zhì)粒提取、酶切驗證等過程的自動化運行,iBioFAB平臺在17 h內(nèi)對444種DNA元件或試劑進行了3648步移液工作,實現(xiàn)了15個DNA片段的一步法組裝;每天內(nèi)可以構建400對編碼TALEN蛋白的DNA序列,正確組裝效率達96%以上,且每對TALEN表達載體的構建成本僅為2.1美元(商業(yè)售價的0.3%)。
此外,TAR(transformation associated recombination)、BASIC(Biopart Assembly Standard for Idempotent Cloning)、USER(uracil-specific excision reagent)等方法也因其可實現(xiàn)多片段、調(diào)控元件、催化元件、代謝途徑等的一步無痕組裝,被應用于自動化設施平臺。例如,美國Amyris公司采用TAR組裝方法,可在釀酒酵母體內(nèi)實現(xiàn)最多12個DNA片段的一次性組裝,正確率>25%;London Biofoundry基于BASIC方法和自動化設施平臺,搭建了全自動化的多片段DNA構建平臺DNA-BOT(圖2)[34]。DNA-BOT讀取元件和接頭存儲信息以及構建設計信息并生成自動化腳本文件,分配給4個功能執(zhí)行模塊:①剪接反應模塊,將所需生物元件從其保存質(zhì)粒上剪切成DNA片段,并在其兩端分別連接相應的Prefix和Suffix接頭序列;②核酸純化模塊,采用磁珠法純化帶有21 bp黏性末端的生物元件;③組裝模塊,將生物元件與相應的載體骨架進行組裝;④轉化模塊,將構建的組裝體系轉化至大腸桿菌感受態(tài)細胞,并涂布于篩選平板,用于后續(xù)的分析驗證?;谠撈脚_,通過1578步移液操作,38個磁珠法核酸提取、96個熱激轉化(96孔板)的自動化操作,一步實現(xiàn)了88個各包含3個DNA片段的質(zhì)粒組裝。與傳統(tǒng)人工所需的5 h操作時間相比,其操作時間(非運行時間)縮短至1.5 h,每個質(zhì)粒的構建成本僅為1.5~5.5美元,同時具有較高的質(zhì)粒構建成功率。
在人工細胞工廠的構建階段,微生物細胞底盤的操作是自動化合成生物技術主要關注的一個方面。底盤細胞是細胞工廠的“硬件”基礎,理想的細胞底盤需要具有較好的穩(wěn)定性和魯棒性,并且在不被外源工程DNA元件影響原始代謝和生長的情況下與其進行適配[35-36]。然而,自動化設施平臺的終端產(chǎn)品,即人工細胞工廠,僅僅是目標化合物工業(yè)化生產(chǎn)的起點。而且,自動化設施平臺改造細胞工廠不是一蹴而就的,在生物過程放大過程中仍然需要對細胞工廠進行重新設計、迭代,甚至需要更換更加合適的細胞底盤。自動化合成生物技術有助于揭示微生物復雜表型的分子機制,拓展對傳統(tǒng)微生物的理解,進一步利用這些信息定制目標細胞工廠。
目前,在綠色生物制造領域應用比較成熟的細胞底盤包括大腸桿菌、釀酒酵母、谷氨酸棒狀桿菌等模式微生物。在手工操作方面,模式微生物的生物學操作工藝成熟,大腸桿菌和釀酒酵母作為應用最廣泛的模式微生物,具有培養(yǎng)條件簡單、生長繁殖快、遺傳工具成熟、遺傳背景清晰等特點,也是目前研究者最為關注、容易實現(xiàn)自動化操作的細胞底盤[10,37]。隨著生物技術從早期的形態(tài)學觀察發(fā)展到分子水平的分子生物學、系統(tǒng)生物學及合成生物學,非模式生物與模式生物之間的技術障礙正在逐漸縮小。模式生物建立的部分方法和工具可以直接或改造后應用于非模式生物,指導非模式生物的元件挖掘、細胞工廠的建立和改造優(yōu)化等。然而,由于跨物種的不兼容性,某些基于模式微生物開發(fā)的生物技術很難平移至非模式微生物,如RecA蛋白介導的同源重組功能。盡管一些前沿技術為在非模式微生物細胞工廠中的應用進行了相應的方法改造,但仍有很大的探索空間。采用非模式微生物作為細胞工廠改造的宿主面臨的主要挑戰(zhàn)不僅僅是缺乏基因工具,更重要的是對其代謝網(wǎng)絡和調(diào)控信息的理解有限[38]。因此,需要對不同生長環(huán)境下的非模式微生物的代謝情況進行詳細的分析,例如遺傳或化學擾動,以深入了解代謝及調(diào)控機制。自動化合成生物技術自動化、標準化、高通量、信息化和智能化的特性可加速重要非模式菌株的系統(tǒng)開發(fā)和應用推廣[39-40]。
針對微生物細胞底盤的操作而言,主要涉及細胞培養(yǎng)、工程DNA轉化、菌落涂布、菌落挑取、細胞裂解、熒光分選等驗證流程。在設備方面,除了使用標準化的實驗容器(例如符合SBS標準的96孔、384孔微孔板等)以外,還需整合與之適配的多通道自動化移液機械臂的液體工作站、微孔板離心機、分液器、封膜儀、撕膜儀、自動化震動培養(yǎng)箱/搖床、自動化PCR儀、高通量毛細管電泳儀、自動化菌落涂布挑選儀等以完成包括DNA構建在內(nèi)的細胞底盤操作。此外,還需要通過硬件接口將這些儀器設備與機械手、傳送帶、AGV智能小車等自動化轉運設備對接,從而按照實驗流程進行樣品、試劑、耗材等的傳輸。最終,實現(xiàn)噬菌體、細菌及真菌等不同尺度生命體的自動化構建與測試[8,12,17,41]。但是,針對特殊環(huán)境需求的非模式細胞底盤則需要對自動化設施進行定制化設計、裝備或升級。例如,定制化搭建厭氧功能島以維持全程無氧環(huán)境;搭建自動化光照培養(yǎng)反應器以適配光照細胞的培養(yǎng)和基因操作等。下面將對微生物底盤自動化操作過程中最為關注的細胞培養(yǎng)和DNA轉化環(huán)節(jié)進行介紹。
標準化的自動化DNA組裝構建、細胞底盤操作等生物學流程,基本上都是基于微孔板(96孔板等)完成移液、微生物培養(yǎng)或儲存甘油菌等操作。與非自動化方法一致,自動化微生物細胞培養(yǎng)也包括振蕩培養(yǎng)和靜置培養(yǎng)兩種方式。振蕩培養(yǎng)有利于改善氧氣供應和營養(yǎng)分布,促進微生物生長,對大多數(shù)微生物的常規(guī)培養(yǎng)來說通常是首選。商業(yè)化設備方面,Thermo Fisher公司開發(fā)了Cytomat系列,LiCONiC公司開發(fā)了StoreX系列,WakenBtech公司開發(fā)了NeXCell R系列,HighRes Biosolutions公司開發(fā)了SteriStore系列等自動化培養(yǎng)箱。以Thermo Fisher 公司Cytomat系列為例,這些培養(yǎng)箱內(nèi)置即用型的條形碼讀碼器對微孔板進行標記和位置追蹤,通過與現(xiàn)有自動化硬件或平臺進行無縫集成。根據(jù)型號的不同,最短取板時間低于10 s,最大可同時存儲240塊深孔板、504塊96或384孔板或672塊1536孔板,并可智能化控制溫度和濕度,各平板分別設置振蕩速度。此外,一些研究團隊自研開發(fā)了基于微流控的高通量液滴微生物培養(yǎng)方法[42-44],也可拓展至自動化設施平臺。
然而,對于一些有特殊培養(yǎng)環(huán)境需求的微生物,如絕對厭氧、光照、嗜高壓等微生物,目前還沒有成熟的自動化設施平臺可以將其所需的厭氧操作箱、光照反應器等進行自動化集成。因此,針對這些非模式微生物,需要進行定制化的設備開發(fā),并且需要將它們與自動化平臺的其他硬件設備進行端口串聯(lián)。雖然目前在這方面仍存在一些挑戰(zhàn),但隨著技術的不斷發(fā)展,可以期待未來會有更多的解決方案出現(xiàn),以滿足特殊微生物的自動化需求。
理想的微生物細胞工廠需要具有較好的穩(wěn)定性和魯棒性,自動化合成生物技術及自動化設施平臺可以從多個方向加速或拓展細胞底盤的開發(fā)。工程DNA的轉化是自動化生物過程最為煩瑣的步驟之一,且十分耗時。目前,伊利諾伊大學iBioFAB[11]、愛丁堡大學EGF[33,45]、帝國理工學院London Biofoundry[46]等平臺已經(jīng)開發(fā)了基于常規(guī)液體工作站、微孔板或微流控的化學轉化(熱激法)或電轉化,用于TALEN蛋白表達質(zhì)粒制備、番茄紅素代謝途徑組裝等。
釀酒酵母具有培養(yǎng)條件簡單、生長繁殖快、GRAS(generally regarded as safe,通常認為是安全的)、遺傳操作工具成熟等優(yōu)勢。但是由于釀酒酵母代謝網(wǎng)絡十分復雜,單基因或多基因的編輯可能限制了目標產(chǎn)物的生產(chǎn),傳統(tǒng)的改造方法通量較低限制了細胞工廠的構建[36]。自動化的高通量基因編輯技術在基因組水平上改造細胞生理功能構建細胞工廠,可提高細胞工廠的生產(chǎn)性能。London Biofoundry基于自主開發(fā)的軟件平臺AMOS將實驗設計軟件JMP和Echo納升移液工作站進行集成,開發(fā)了高通量的釀酒酵母轉化方法(圖3)[46]。首先,在大腸桿菌中實現(xiàn)了88個包含熒光蛋白編碼基因的質(zhì)粒構建、驗證和提取的自動化操作。構建好的質(zhì)粒通過多通道移液器轉移至預先裝有釀酒酵母S288c感受態(tài)的96孔深孔板中,采用聚乙二醇(polyethylene glycol,PEG)介導的化學轉化法將質(zhì)粒與感受態(tài)細胞進行混合,將工程DNA高通量的轉化至細胞底盤中。然后,采用多通道移液器將3 μL稀釋后的細胞涂布于Omnitray平板進行克隆篩選。類似地,基于微孔板的自動化底盤細胞轉化也可應用在大腸桿菌[47]、谷氨酸棒狀桿菌[48]、枯草芽孢桿菌[49]及絲狀真菌[50]等細胞底盤。
圖3 London Biofoundry開發(fā)的高通量釀酒酵母轉化流程[46]Fig. 3 High-throughput transformation process for Saccharomyces cerevisiae[46]
此外,George Church團隊[51]基于微流控芯片開發(fā)了可用于大腸桿菌自動化、規(guī)模化、微量化DNA電轉化的平臺EP/EWD(EP: Electroporation,電穿孔;EWD:Electrowetting-On-Dielectric,介電潤濕電極),并對其電轉化過程參數(shù)進行了優(yōu)化(圖4)。該裝置的芯片底盤集成了22個700 μm長的介電潤濕EWD電極,研究者采用6個EP/EWD芯片進行了44次獨立的報告質(zhì)粒轉化實驗。在平均電場強度2.25 kV/mm條件下,質(zhì)粒的轉化效率高達8.6 ×108CFU/μg,大腸桿菌的存活率為1.5%~2.3%;因為采用微流控操縱微流體(微升或納升)的系統(tǒng)技術,單個轉化體系的體積僅為200 nL,并且在進行平行轉化實驗的過程中未觀察到交叉污染現(xiàn)象。同樣地,高通量的微流控電轉化方法也在微藻細胞工廠的構建中得到了應用[52]。
圖4 基于微流控芯片的高通量大腸桿菌轉化系統(tǒng)[51]Fig. 4 High-throughput transformation of Escherichia coli[51]
一些研究團隊還專注針對一些具有挑戰(zhàn)性的非模式微生物細胞底盤開發(fā)了自動化工藝流程。例如,Joosu Kuivanen等[53]開發(fā)了一套基于原生質(zhì)體的高通量工程DNA轉化和篩選工藝流程,用于黑曲霉全基因組編輯。Tecan公司則利用Freedom EVO 150移液工作站、8通道移液機械臂(LiHa)、納升移液器和自動化成像識別系統(tǒng)(Pickolo)開發(fā)了一套針對絲狀真菌克隆挑取的自動化工藝流程(https://www.tecan.com/hubfs/Tecan_Journal/201401/16_17_Customizing_automated_colony_picking_012014.pdf)。這些自動化設施平臺的引入和應用,極大地簡化了微生物細胞底盤DNA轉化等關鍵步驟的操作,顯著減少了時間又降低了勞動成本,使得細胞工廠的構建過程更加高效、精確和可重復。
自動化技術在微生物細胞工廠研究中的應用為加速DBTL工程循環(huán)和標準化實驗提供了解決方案。傳統(tǒng)的手工實驗操作限制了循環(huán)效率和設計通量,人為錯誤和偏差也導致實驗操作的不一致性和主觀性。自動化技術的應用改變了生物實驗的范式,實現(xiàn)了實驗操作的多通道和實驗過程的標準化。細胞工廠的構建方法正朝著全自動化方向發(fā)展,推動以石化原料為基礎的工業(yè)向可循環(huán)、可持續(xù)的生物基綠色制造轉變。在此過程中,全自動的DBTL循環(huán)將是下一波創(chuàng)新,能夠引導自動化的代謝途徑組裝和底盤細胞優(yōu)化,并提高循環(huán)效率。本節(jié)將從生物合成基因簇挖掘、代謝通路工程改造和底盤細胞優(yōu)化三方面介紹國內(nèi)外研究者在微生物細胞工廠自動化快速構建領域取得的科研進展。
武漢大學劉天罡課題組[54]基于Auto-HTP自動化高通量平臺及“基因簇功能元件理性可控重組”策略,實現(xiàn)了絲狀真菌未知萜類基因簇的高效挖掘(圖5)。該研究以米曲霉為細胞底盤,利用近緣宿主解決同源基因異源表達的適配性和產(chǎn)量低的問題。通過模塊化組合重構了39個絲狀真菌來源的萜類生物合成基因簇,構建了173個質(zhì)粒,并在細胞底盤內(nèi)重構208株突變體,形成了包含185個萜類產(chǎn)物的化合物庫,同時解決了研究通量、產(chǎn)物集中度低的問題,提高了新化合物發(fā)現(xiàn)的效率。最終,篩選到具備高抗炎活性的二倍半萜類產(chǎn)物mangicol J,并對生物合成機理進行了解析,通過對細胞底盤代謝工程改造,解決了目標產(chǎn)物產(chǎn)量低的問題。
圖5 自動化工作站(auto-HTP)工作流程[54]Fig. 5 Workflow of auto-HTP[54]
趙惠民課題組與Wilfred A. van der Donk課題組及Douglas A. Mitchell 課題組合作開發(fā)了一個基于自動化設施可快速、高通量、自動、可擴展的發(fā)現(xiàn)核糖體合成和翻譯后修飾肽(ribosomally synthesized and post-translationally modified peptides,RiPPs)的平臺FAST-RiPPs(圖6)[55]。研究人員通過生信分析發(fā)現(xiàn)了96個疑似RiPPs合成基因簇序列,基于iBioFAB平臺自動化的重構這些基因簇,對基因序列進行密碼子優(yōu)化、保留前導肽序列、融合His標簽序列,在大腸桿菌細胞底盤中進行異源表達和肽結構表征,最終,RiPPs合成基因簇的構建成功率達到86%。對獲得的基因簇進行異源表達篩選,發(fā)現(xiàn)27個基因簇成功實現(xiàn)了異源表達,合成了30種RiPPs,有7種表現(xiàn)出了對超級細菌的抑制作用,并且首次被發(fā)現(xiàn)對肺炎克雷伯菌有抑制作用。
圖6 RiPPs結構式、合成機制及FAST-RiPPs流程[55]Fig. 6 Overview of RiPPs and FAST-RiPPs pipelines[55]
本課題組基于深圳設施平臺對環(huán)二肽[56]、羊毛硫肽[37]、萜類[57]等天然產(chǎn)物的生物合成基因簇開展了一系列自動化、高通量的基因組挖掘和工程改造研究。其中,本課題組采用模塊化DNA組裝方法,規(guī)模化構建了古菌細胞膜極性脂的生物合成通路,在酵母底盤中“即插即用”式引入產(chǎn)甲烷古菌(Methanosarcina acetivorans)、硫化古菌(Sulfolobus islandicusas)、Asgard古菌等不同來源的關鍵合成基因,成功合成了具備古菌醚鍵特征的雜合極性脂DGGGO-FA,首次在真核細胞中實現(xiàn)了古菌來源極性細胞膜脂的異源合成(圖7)?;诨蚯贸⒒匮a等方法,對古菌細胞膜極性脂類合成關鍵酶/通路功能表征,探究了DGGGOFAs的生物合成機制,發(fā)現(xiàn)釀酒酵母中二酰甘油酰基轉移酶DGAT是關鍵合成酶,催化DGGGOH古菌醇和Acyl-CoA縮合產(chǎn)生DGGGO-FA。同時,證實了古菌中也廣泛存在DGAT酶,并具備合成DGGGO-FA的能力,對目前古菌能量存儲方式的認知提出了挑戰(zhàn)[57]。
圖7 重組釀酒酵母中古菌特征脂類合成途徑(藍色背景)及酵母內(nèi)源脂類合成途徑(黃色背景)[57]Fig. 7 Biosynthetic pathways of archaeal phospholipids, hybrid neutral lipids (DGGGO-FAs)and triacylglycerol (TAG) in engineered S. cerevisiae[57]
趙惠民團隊利用iBioFAB自動化設施平臺,集成貝葉斯機器學習算法搭建了一個完全由機器學習算法驅(qū)動的生物系統(tǒng)設計優(yōu)化平臺——BioAutomata,實現(xiàn)了“設計-構建-測試-學習”的全自動化運行,通過大腸桿菌細胞底盤完成了番茄紅素代謝途徑的組合優(yōu)化構建、產(chǎn)品合成和篩選分析(圖8)[10]。在完成初始的設計和設置后,機器學習算法驅(qū)動自動化設備執(zhí)行實驗操作,并將數(shù)據(jù)反饋給算法模型,由算法評估并確定下一輪實驗的步驟。研究者基于該平臺以大腸桿菌BL21(DE3)為細胞底盤,對包含3個基因表達框的番茄紅素合成途徑進行了組合優(yōu)化。利用iBioFAB平臺,完成了代謝途徑的組裝(Gibson和Golden Gate方法)、大腸桿菌的化學轉化(熱激法)、細胞培養(yǎng)和番茄紅素提取等生物學過程。以各個基因的啟動子強度為變量,以番茄紅素的產(chǎn)量為目標函數(shù)生成實驗設計。通過對所有13 824種可能性的算法評估,只需測試其中不到1%的組合,就可以得到最優(yōu)的代謝途徑組合方案,使番茄紅素的產(chǎn)量提高了1.77倍。結合了機器學習算法的全自動設施平臺,可以執(zhí)行實驗操作并即時分析數(shù)據(jù),以迭代的方式優(yōu)化指定的生物過程,降低實驗成本,促使細胞工廠構建向更加自動化和智能化方向發(fā)展。與此類似,Carbonell等[10]依托Hamilton Microlab STAR平臺對啟動子強度、代謝途徑基因順序和基因拷貝數(shù)等因素進行組合優(yōu)化,在大腸桿菌細胞底盤成功將(2S)-喬松素的產(chǎn)量提高了500倍。
圖8 基于iBioFAB平臺開發(fā)的機器學習算法驅(qū)動的生物系統(tǒng)設計優(yōu)化平臺BioAutomata在大腸桿菌細胞底盤進行番茄紅素代謝途徑組合優(yōu)化構建、番茄紅素合成和篩選[10]Fig. 8 The application of an integrated robotic system coupled with machine learning algorithms to fully automate the DBTL process for biosystems design[10]
美國勞倫斯-伯克利國家實驗室的研究人員基于貝葉斯機器學習算法及高通量、標準化的DNA組裝方法,開發(fā)了一套自動推薦工具(automated recommendation tool,ART)。使用基于采樣的優(yōu)化,ART對下一輪工程周期的構建菌株進行推薦,并提供其生產(chǎn)水平的概率預測(圖9)[58-59]。研究人員選擇了5個基因,每個基因受細胞內(nèi)不同啟動子或其他機制的調(diào)控,總共包含將近8000種潛在的生物合成途徑。對其中250種組合進行自動化實驗驗證,用于訓練算法模型,解析輸入?yún)?shù)(氨基酸合成)與輸出參數(shù)(基因表達)之間的關聯(lián),從而推測剩余7000多種組合中的每一種對應的色氨酸合成的情況。最終,色氨酸的產(chǎn)量相較當時報道最高值增加了106%左右,比用于訓練模型的最優(yōu)組合高17%左右。
圖9 ART可基于較小訓練數(shù)據(jù)集為下一輪實驗提供預測及建議[59]Fig. 9 ART provides predictions and recommendations for the next experimental cycle[59]
模式微生物方面,George Church團隊[60]在大腸桿菌中開發(fā)的多重自動化基因組工程(multiplex automated genome engineering,MAGE)進行大規(guī)模的細胞編程和進化等。趙惠民團隊開發(fā)了以釀酒酵母為細胞底盤的RNAi(RNA interference)輔助的自動化基因組進化方法RAGE(RNAi-Assisted Genome Evolution)(圖10)[61]?;谝氘愒碦NA干擾途徑的酵母底盤及iBioFAB自動化平臺,利用標準化的全長互補DNA文庫構建編碼過表達和敲低突變的基因調(diào)控元件庫,并在其中引入δ位點序列作為基因組整合的供體,通過CRISPR/Cas9引入DNA雙鏈斷裂(DNA doublestrand break, DSB)實現(xiàn)了高效、無標記的文庫基因組整合。通過自動化移液工作站和96孔板,利用PEG介導的化學轉化法將質(zhì)粒文庫轉化至細胞進行表型篩選,轉化效率達到104細胞/μg質(zhì)粒;通過自動化平臺可每次實施192個平行轉化實驗,得到106以上的克隆突變體。通過高通量測序(next generation sequencing,NGS)方法對得到的突變體進行測序分析,基因突變位點覆蓋了釀酒酵母基因組全部編碼基因的90%以上。經(jīng)過6周共計3輪的工程菌株自動化構建和篩選,快速獲得了當時已報道乙酸耐受性能最高的酵母菌株。
圖10 釀酒酵母自動化多重基因組進化技術[61]Fig. 10 Scheme of automated RNAi-assisted genome evolution in S. cerevisiae[61]
在非模式底盤方面,中國科學院天津工業(yè)生物技術研究所王猛團隊[48]依托高通量基因編輯與篩選自動化平臺,在谷氨酸棒狀桿菌中開發(fā)了多元自動化基因組編輯方法MACBETH(multiplex automatedCorynebacterium glutamicumbase editing method),實現(xiàn)了質(zhì)粒構建、基因組編輯、克隆篩選和表型驗證的全流程自動化操作,可實現(xiàn)每月數(shù)千突變株的編輯。其中,基于CRISPR/nCas9(D10A)-AID(activation-induced cytidine deaminase)方法對94個轉錄因子進行自動化、高通量的基因編輯,86%的目的基因編輯效率達50%以上。此外,該團隊還開發(fā)了基于液滴微流控的鏈霉菌高通量培養(yǎng)和篩選技術,檢測分選速度達到每小時1萬菌株,人工混庫的單輪分選富集率超過了330倍(圖11)[43]。通過優(yōu)化啟動子強度、分泌蛋白表達等方面的優(yōu)化和測試,成功從隨機突變文庫中篩選獲得纖維素酶產(chǎn)量提高211.4%的菌株。同時,由于鏈霉菌孢子的穩(wěn)定性,該平臺也可適用于生長中期胞內(nèi)、胞外目標蛋白的篩選,在次級代謝產(chǎn)物如抗生素等篩選方面展示出較好的應用前景。
圖11 基于液滴微流的鏈霉菌高通量篩選技術[43]Fig. 11 Flow chart of high throughput screening of Streptomyces using fluorescence-activated droplet sorting[43]
自動化合成生物技術基于其自動化、標準化、高通量的特性以及信息化、智能化的發(fā)展,有望突破依賴手工實驗的傳統(tǒng)生物學研究范式,在多個方面為微生物細胞工廠的快速設計和構建提供重要的技術和平臺支撐。在微生物細胞工廠快速構建方面,自動化合成生物技術已在模式菌株領域有了較為廣泛的應用,并取得了一些令人矚目的研究成果。但是,如何將這些使能技術及經(jīng)驗擴展至其他重要的非模式微生物,實現(xiàn)從天然馴化到理性設計的轉變,克服非模式微生物復雜代謝網(wǎng)絡和有限理化知識造成的阻礙是人工微生物細胞工廠構建面臨的主要問題之一。目前暫未有針對非模式微生物的全自動設施平臺,如何面對非模式微生物多樣性的生理特性,如厭氧、光照、高溫或者高壓等,實現(xiàn)非模式微生物高通量、自動化操作也是自動化設施平臺面臨的主要問題之一[38,40]。另一方面,即使是對常用的細胞底盤如大腸桿菌、釀酒酵母而言,目前大多數(shù)自動化設施平臺仍未能實現(xiàn)微生物細胞工廠構建的全自動化。如前所述,微生物細胞工廠的構建是指構建工程DNA并將其導入底盤細胞,其中工程DNA的構建主要包括元件準備、多元件組裝和基因組工程。自動化DNA組裝和底盤細胞操作是共性的合成生物自動化工藝,涉及基因合成、PCR擴增、酶切、DNA組裝、核酸提取純化、測序、工程DNA轉化、菌落涂布、菌落挑取、細胞裂解和熒光分選等流程。我們對主要自動化設施平臺在DNA組裝和底盤細胞轉化方面的能力和進展進行了總結和比較[12]。除了非模式微生物給自動化構建提出的廣泛性挑戰(zhàn)外,對構建的工程DNA和底盤細胞的驗證性測試也為全流程自動化提出了新工藝開發(fā)、新設備與軟件研發(fā)的需求。
自動化設施平臺是一種綜合性平臺,集成了移液工作站、高通量檢測與分析設備、處理分析軟件、人員/數(shù)據(jù)管理和運行系統(tǒng)。目前合成生物自動化設備、機器人集成等核心技術由Thermo、Beckman、Tecan、HiRes、Hamilton、Roche等國外公司掌控。iBioFAB、EGF兩個設施平臺均由Thermo提供集成方案,實現(xiàn)了全自動整合。然而,建立不同類型的自動化設施平臺所需的設備成本,尤其是構建和測試環(huán)節(jié),可能至少需要數(shù)千萬元,對任何研究機構或者團隊都可能是最大的一個挑戰(zhàn)。往往搭建一個完全自動化的平臺都是從小規(guī)模開始,以緩慢的速度向自動化和集成化發(fā)展。例如,美國能源部Agile Biofoundry、澳大利亞AusFAB、Australian Genome Biofoundry、天津大學Biofoundry等則主要由可以進行高通量操作的單臺儀器組成。英、美等國現(xiàn)有的自動化設施中大部分已建成的平臺更專注于某種細胞底盤或者DBTL循環(huán)中的特定任務,仍然存在一定的局限性,包括復雜線路設計能力不強、底盤細胞單一、大片段DNA的制造成本高、高通量測試手段少、與下游應用銜接不緊密等問題。此外,采用Thermo等國外廠商的方案及設備搭建的全自動化平臺存在一些局限。其中之一是,生物學實驗的需求往往是個性化的,平臺的靈活性往往難以適應不同實驗需求,且平臺維護成本高、難以升級改造。另一個挑戰(zhàn)是不同自動化系統(tǒng)和軟件平臺的集成和互操作性不高。
國產(chǎn)化自主研發(fā)可在一定程度上解決上述問題,同時避免核心設備僅依靠進口,途徑單一。但是,任何設備的開發(fā)或者更新,都需要進行大量試錯,以確保所有組件都經(jīng)過驗證并在自動化平臺中穩(wěn)健運行。在實現(xiàn)國產(chǎn)化路徑方面,“引進-消化-吸收-創(chuàng)新”的模式可極大地縮短國產(chǎn)自主研發(fā)的周期,為國內(nèi)研發(fā)和制造提供基礎;加強合成生物學及自動化領域的人才培養(yǎng)和團隊建設,提高人才儲備;高校和科研院所可通過引入政府或企業(yè)資金,促進科研機構在自動化合成生物技術領域的創(chuàng)新研發(fā)和產(chǎn)業(yè)化推進;加強合作與開放創(chuàng)新,各團隊可基于各自特點建設半自動化的設施模塊,可降低投入成本;不同自動化實驗室需要實現(xiàn)更高的標準化(硬件、計量、流程語義、數(shù)據(jù)等標準內(nèi)容)、數(shù)據(jù)來源追蹤、可溯性(步驟、操作方法、材料、設備等信息,數(shù)據(jù)采集記錄,樣本、實驗材料信息,數(shù)據(jù)處理和分析方法,軟件、算法版本等)和再現(xiàn)性,從而可與具有不同專業(yè)知識和設備的實驗室進行合作及交互,實現(xiàn)生物學實驗的分布式操作。自動化設施平臺的國產(chǎn)化替代,也面臨一些難點:需要生物學、自動化、人工智能等不同領域?qū)<液献骺朔夹g壁壘;贏得與歐美等自動化廠商的市場競爭;短期內(nèi)仍處于國產(chǎn)設備和試劑耗材性能不佳的窘境;建立可持續(xù)的生態(tài)系統(tǒng),將產(chǎn)學研進行深度聯(lián)合等。
自動化合成生物技術改變了生物學的研究范式,然而在建設及使用中也需要考慮技術變革帶來的一些科學問題,如:自動化設施平臺如何成為工業(yè)4.0的重要參與者而非輔助技術?自主研發(fā)或低成本商用設備與更成熟、整合度更高的設備相比如何選擇?選擇時需要權衡哪些因素(時間、效率、資源可用性等)?自動化設施平臺是否會引起任何倫理問題?自動化設施平臺是否可以引起代謝工程領域的一場革命?國內(nèi)的自動化設施平臺仍處于起步階段,如何搭建、迭代,適用于哪些科學問題,建設及使用過程中會引起哪些問題,都值得探討和跟進。