汪君儀,武曉樂,曹月陽,李炳志
(教育部合成生物學(xué)前沿科學(xué)中心,系統(tǒng)生物工程教育部重點(diǎn)實(shí)驗(yàn)室,天津大學(xué)化工學(xué)院,天津 300072)
快速發(fā)展的基因組測序技術(shù)推動(dòng)了基因組信息的爆發(fā)式增長,正逐步加深人們對生命過程和調(diào)控的理解[1-3]。合成基因組學(xué)從復(fù)寫已知天然基因組開始,逐步建立基因組合成技術(shù),探索基因組設(shè)計(jì)原則,嘗試以人工設(shè)計(jì)合成的基因組實(shí)現(xiàn)對生命活動(dòng)的調(diào)控,深度拓展對生命過程的認(rèn)知。
隨著基因組測序技術(shù)的發(fā)展、DNA 合成與組裝技術(shù)的進(jìn)步、合成成本的降低,基因組的從頭合成與重新設(shè)計(jì)日益受到關(guān)注。2002 年脊髓灰質(zhì)炎病毒的基因組成為世界上第一個(gè)人工合成的基因組[4],2003 年φX174 噬菌體的基因組也被成功合成[5],2020年新冠肺炎病COVID-19基因組也被迅速從頭化學(xué)合成并組裝出有活性的毒株[6]。隨著DNA 大片段合成組裝技術(shù)的發(fā)展,2008 年原核生物生殖支原體的基因組被成功從頭合成[7]。2010 年Venter 團(tuán)隊(duì)實(shí)現(xiàn)了利用人工合成的蕈狀支原體基因組調(diào)控生命活動(dòng)的目標(biāo)[8],證實(shí)了化學(xué)合成基因組的生命活性。隨著包括染色體構(gòu)建與轉(zhuǎn)移等基因組合成相關(guān)技術(shù)的發(fā)展[9-14],合成基因組學(xué)的研究可以在更多的物種范圍和更大的設(shè)計(jì)尺度上探究基因組的基本科學(xué)問題,例如,在大腸桿菌中嘗試進(jìn)行基因組密碼子的刪減研究[15-18],在支原體中進(jìn)行大規(guī)?;蚪M簡化的研究[19],在釀酒酵母中進(jìn)行基因組穩(wěn)定性和柔性的研究[20-28],等等。真核單細(xì)胞模式生物釀酒酵母基因組的設(shè)計(jì)與合成成為科學(xué)家的又一個(gè)重大目標(biāo)。
在合成基因組學(xué)發(fā)展的初期,目標(biāo)主要是利用化學(xué)合成的手段成功復(fù)寫野生型基因組,關(guān)鍵在于建立基因組合成的技術(shù)方法。近年來合成基因組學(xué)不斷地發(fā)展,國內(nèi)外也形成了不少相關(guān)綜述[29-31],研究者逐漸開始利用合成基因組學(xué)探索生物學(xué)基本問題和原理,這就需通過對基因組進(jìn)行不同的設(shè)計(jì)并以基因組合成的方式驗(yàn)證設(shè)計(jì)的可行性。本文作者將從人工基因組的密碼子改變、人工標(biāo)簽、人工位點(diǎn)、基因組簡化等幾種重要設(shè)計(jì)角度,介紹基因組合成的相關(guān)研究進(jìn)展。
密碼子豐度是表征某一個(gè)密碼子在全基因組編碼中使用頻率的指標(biāo)。遺傳密碼具有簡并性,這導(dǎo)致了對應(yīng)同一種氨基酸會存在多個(gè)不同的密碼子(同義密碼子),同時(shí),在不同生物間,甚至在同一生物不同蛋白間,編碼相同氨基酸的同義密碼子的使用頻率不同,這就導(dǎo)致了密碼子豐度的差異,通常也稱之為密碼子使用的偏好性[32]。為了讓異源基因更好地在宿主中表達(dá),根據(jù)宿主細(xì)胞密碼子的偏好性對異源基因進(jìn)行優(yōu)化已經(jīng)成為基因組設(shè)計(jì)中一種成熟的技術(shù)手段,已有多種密碼子優(yōu)化軟件被開發(fā),如Codon Optimization OnLine[33]。研究表明在釀酒酵母體內(nèi)將同義密碼子中相同的密碼子排列在一起,可以使tRNA 分子循環(huán)利用從而加快翻譯速度[34]。密碼子分布與基因的GC 含量密切相關(guān),連續(xù)同義密碼子的選擇具有相關(guān)性,傾向于選擇使用相同tRNA的密碼子。
Venter 團(tuán)隊(duì)在蕈狀支原體基因組(JCVIsyn3.0)的合成過程中,對密碼子豐度轉(zhuǎn)變的原則進(jìn)行了一定程度的探究,野生型蕈狀支原體基因組中腺嘌呤(A)和胸嘧啶(T)的含量極高,TGA 僅作為編碼色氨酸的密碼子而并非終止密碼子,并且偶爾會使用非標(biāo)準(zhǔn)的起始密碼子。該研究將包含三個(gè)必需基因的5000 bp 區(qū)域中密碼子的編碼原則進(jìn)行了三種不同方式的修改:①將編碼色氨酸的密碼子由TGA 更改為TGG,采用非標(biāo)準(zhǔn)的起始密碼子;②根據(jù)大腸桿菌密碼子的偏好性對該區(qū)域的密碼子豐度進(jìn)行修改,色氨酸仍由TGA 編碼;③根據(jù)大腸桿菌密碼子的偏好性對該區(qū)域的密碼子豐度進(jìn)行修改,使用標(biāo)準(zhǔn)的起始密碼子,色氨酸由TGG 編碼。實(shí)驗(yàn)結(jié)果表明這些密碼子更改基本不影響細(xì)胞生長,但若在基因組設(shè)計(jì)中想要大規(guī)模改變密碼子的豐度可能需要伴隨tRNA水平的修飾以保證翻譯能夠正常進(jìn)行[19]。
自然界中大多數(shù)生物均使用64 個(gè)遺傳密碼子編碼20 種標(biāo)準(zhǔn)氨基酸,密碼子具有通用性,即不同的生物使用一套高度相似的密碼子表。通過在全基因組范圍內(nèi)進(jìn)行同義密碼子的替換并消除其對應(yīng)的tRNA,使其無法翻譯所刪除的密碼子,則無法正確翻譯來自病毒、質(zhì)粒和其他細(xì)胞獲得的DNA,從而使重新編碼的生物具備遺傳隔離能力。并且我們可以利用所刪除的密碼子來編碼非標(biāo)準(zhǔn)氨基酸,合成具備新化學(xué)性質(zhì)的蛋白,也可利用非標(biāo)準(zhǔn)氨基酸來建立生物防逃逸體系。
為了進(jìn)一步探索密碼子的使用規(guī)則及遺傳信息的保存、編碼、交換原理,2013 年Church 團(tuán)隊(duì)提出創(chuàng)建使用63 個(gè)密碼子的生物。在大腸桿菌MG1655 中采取基因編輯的方式利用同義密碼子UAA 替換了所有UAG 終止密碼子,并通過刪除RF1(釋放因子)消除了在密碼子UAG處終止翻譯的功能,從而可以將UAG 用于特異性地編碼非標(biāo)準(zhǔn)氨基酸[15]。在成功完成單密碼子替換工作的基礎(chǔ)上,進(jìn)一步開始探索在全基因組范圍內(nèi)進(jìn)行多個(gè)密碼子替換的可行性。2016年,在大腸桿菌全基因組范圍內(nèi)使用同義密碼子系統(tǒng)地替換了7 個(gè)密碼子(包含6個(gè)有義密碼子以及UAG終止密碼子),使大腸桿菌的遺傳密碼子從64 個(gè)減少到57 個(gè),共涉及到62 214 個(gè)同義密碼子的替換,但最終僅包含57個(gè)密碼子的大腸桿菌無法正常存活,至今也未能成功構(gòu)建。完成替換后將重新編碼的基因組解析為87 個(gè)約50 kb 的片段,并對其中55 個(gè)片段(包含2229 個(gè)基因)進(jìn)行基因功能的驗(yàn)證,其中僅有13 個(gè)重新編碼的必需基因無法支持細(xì)胞生存,99.5%重新編碼的基因無需任何優(yōu)化即可替代野生型基因的功能[16],這在一定程度上表明了從根本上改變遺傳密碼和大規(guī)模合成基因組重構(gòu)的可行性。
利用基因組的重新編碼以去除部分有義密碼子,可以促進(jìn)具備非天然氨基酸編碼功能的細(xì)胞的合成。2016 年Chin 團(tuán)隊(duì)提出了利用大于100 kb的DNA 合成片段迭代替換相應(yīng)野生型片段的基因組組裝技術(shù),在進(jìn)行多次迭代后可以完成整個(gè)大腸桿菌基因組的替換,該方法為全基因組同義密碼子的替換提供了基礎(chǔ)。此外該研究嘗試使用了8種不同的同義密碼子替換方案,并成功地在富含必需基因的操縱子中去除了373 個(gè)有義密碼子[17]。2019年,在此研究基礎(chǔ)上,利用基因組全合成的方式完成了大腸桿菌全基因組范圍內(nèi)2 個(gè)有義密碼子和1個(gè)終止密碼子的替換,并且僅含有61種密碼子的大腸桿菌可以維持正常的生長,該研究重新編碼了18 214 個(gè)密碼子,成功創(chuàng)建使用61 個(gè)密碼子的生物,并刪除了其對應(yīng)的tRNA[18](圖1)。
圖1 密碼子刪除相關(guān)研究進(jìn)展[16,18](2016年Church團(tuán)隊(duì)在大腸桿菌全基因組范圍內(nèi)使用同義密碼子系統(tǒng)地替換了7個(gè)密碼子,90%以上的基因仍具有功能[16] ;2019年Chin團(tuán)隊(duì)重新編碼了大腸桿菌的18 214個(gè)密碼子,創(chuàng)建了使用61個(gè)密碼子的生物[18])Fig.1 Research progress on codons deletion[16,18](In 2016,seven codons were replaced with synonymous alternatives the entire genome of E.coli by Church's group,more than 90%of the genes retained functionality[16];In 2019,Chin's group recoded 18 214 codons to create a strain with a 61-codon genome [18])
2010 年,在合成蕈狀支原體基因組研究中,為了區(qū)分合成基因組和天然基因組,在不干擾細(xì)胞活力的前提下在合成型基因組中引入了四個(gè)“水印”序列[8]。在Sc2.0 項(xiàng)目中,利用同義密碼子替換,在合成型基因組中引入了大量的PCR 標(biāo)簽,用于區(qū)分合成型和野生型序列[20]。除此之外,Sc2.0 的設(shè)計(jì)還包括內(nèi)含子及重復(fù)序列的刪除、tRNA 的移位等[35]。在synⅩ染色體的合成過程中,Wu 等[25]開 發(fā) 了 一 種 名 為 混 菌PCR 標(biāo) 簽 定 位(pooled PCRTag mapping, PoPM)的高通量定位策略,用于高效識別合成型染色體中導(dǎo)致生長缺陷的位點(diǎn)。該方法以生長缺陷和長勢正常兩個(gè)混菌庫提取的基因組作為模板,以PCRtag 為引物進(jìn)行PCR 反應(yīng),通過結(jié)果分析正常菌株表型庫中缺失的合成型區(qū)域和生長缺陷菌株庫中缺失的野生型區(qū)域,快速定位導(dǎo)致缺陷的基因組位點(diǎn)。
除此之外,利用PCRtag 可以便捷地分析合成型基因組重排前后變化的基因組位點(diǎn),是一種有效的快速縮小潛在目標(biāo)基因位點(diǎn)所在區(qū)域的方法。Luo 等[36]利用基因組重排對酵母菌株乙醇的耐受性機(jī)制進(jìn)行了探索,將重排后的菌株分為耐受乙醇組和不耐受乙醇組,利用合成型基因組上的PCRtag 對這兩組菌株進(jìn)行PCR 分析,找到了影響乙醇耐受性的基因位點(diǎn)。在利用含有合成型染色體菌株的基因組重排研究中,利用合成型染色體中非必需基因上包含的96 個(gè)PCRtag 對7 株重排后獲得的菌株進(jìn)行分析,發(fā)現(xiàn)其中4株菌株都包含一段長度約為11 448 bp 區(qū)域的缺失,在這段區(qū)域內(nèi)進(jìn)一步進(jìn)行基因的刪除分析,獲得了堿性耐受相關(guān)基因的位點(diǎn)[37]。
染色體的結(jié)構(gòu)以及基因的排列順序都會影響基因的表達(dá),利用合成型基因組重排快速探究菌株更優(yōu)的生理表型受到廣泛的關(guān)注。Sc2.0 項(xiàng)目中合成型酵母染色體設(shè)計(jì)的一大亮點(diǎn)是在每個(gè)非必需基因的終止密碼子后均插入了一段反向?qū)ΨQ的人工位點(diǎn)-loxPsym 序列[35],兩個(gè)loxPsym 位點(diǎn)之間的序列在Cre重組酶的作用下可隨機(jī)發(fā)生刪除和反轉(zhuǎn)[38],從而在合成型酵母體內(nèi)形成了可快速進(jìn)行基因組重排(缺失、重復(fù)、倒置、易位)的SCRaMbLE (Synthetic Chromosome Rearrangement and Modification by LoxPsym-mediated Evolution)系統(tǒng)。為了證明SCRaMbLE 系統(tǒng)在探索基因組多樣性方面的能力,利用合成染色體臂synIXR(包含43 個(gè)loxPsym 位點(diǎn))進(jìn)行基因組重排,其中64個(gè)SCRaMbLE 菌株深度測序結(jié)果顯示,重排后除了可以獲得基因組缺失、重復(fù)、倒位的菌株還可以獲得發(fā)生大量復(fù)雜重排的菌株,并且這些重排均發(fā)生在所設(shè)計(jì)的loxPsym 位點(diǎn)之間[39]。利用SCRaMbLE 系統(tǒng)可以快速地進(jìn)行大規(guī)模的基因組重排(包含染色體內(nèi)及染色體間的重排),在選擇性條件下可快速有效地進(jìn)行基因組的定向進(jìn)化。SCRaMbLE 系統(tǒng)不斷在應(yīng)用中得到改進(jìn),逐步使SCRaMbLE 系統(tǒng)成為優(yōu)化宿主、提高產(chǎn)量以及增強(qiáng)菌株耐受性的有效手段。
最初設(shè)計(jì)的SCRaMbLE 系統(tǒng)是以雌激素誘導(dǎo)為重排開關(guān),但在缺乏雌激素誘導(dǎo)的情況下仍然可以觀察到染色體重排引起的合成型酵母的生長缺陷,這表明了單開關(guān)控制下的SCRaMbLE 系統(tǒng)存在開關(guān)的泄漏[39]。Jia 等[40]將半乳糖驅(qū)動(dòng)的Cre酶誘導(dǎo)表達(dá)系統(tǒng)引入最初的設(shè)計(jì)體系,通過構(gòu)建與門開關(guān)實(shí)現(xiàn)了對SCRaMbLE 系統(tǒng)的精準(zhǔn)控制。與門開關(guān)結(jié)合了轉(zhuǎn)錄控制以及細(xì)胞定位控制,使SCRaMbLE 系統(tǒng)只有在同時(shí)具備半乳糖和雌激素的情況下才可開啟。在此基礎(chǔ)上,進(jìn)一步開發(fā)了多重SCRaMbLE 迭代循環(huán)(Multiplex SCRaMbLE Iterative Cycling,MuSIC)技術(shù)以產(chǎn)生更多的合成基因組重排變體。Cre 酶表達(dá)的泄漏還會導(dǎo)致重排結(jié)束后基因組的不穩(wěn)定,為了維持重排后基因組的穩(wěn)定性,Lin 等[41]在釀酒酵母中導(dǎo)入與Cre重組系統(tǒng)正交的Vika 重組系統(tǒng),利用Vika-vox 系統(tǒng)在重排結(jié)束后徹底刪除Cre基因以維持重排后菌株的穩(wěn)定性。
盡管雌激素是一種強(qiáng)力誘導(dǎo)劑,但它具有的活性在濃度較高的情況下可能對人體有毒害。Hochrein 等[42]開發(fā)了一種光控拆分的Cre重組系統(tǒng)(light-controlled induction system, L-SCRaMbLE),該系統(tǒng)中Cre 酶被分裂為N 端和C 端,并分別融合到可以光學(xué)誘導(dǎo)二聚化的兩個(gè)蛋白上,在紅光介導(dǎo)的二聚作用下重構(gòu)Cre 重組酶。L-SCRaMbLE 操作更加簡便,并且可以通過調(diào)節(jié)感光體發(fā)色團(tuán)的濃度、光照射時(shí)間以及光照強(qiáng)度來微調(diào)重組效率。雖然L-SCRaMbLE 系統(tǒng)總體重組效率較低,但較低的重組效率更有利于產(chǎn)生重組多樣性[42]。
利用SCRaMbLE 系統(tǒng)篩選對某些脅迫因素具有更高耐受性的菌株時(shí),發(fā)現(xiàn)很多菌株耐受性的提高并不是染色體重排導(dǎo)致。為了有效鑒定細(xì)胞是否發(fā)生染色體重排,Luo 等[36]基于營養(yǎng)缺陷型標(biāo)簽URA3 和LEU2 的交替切換設(shè)計(jì)了ReSCuES(reporter of SCRaMbLEd cells using efficient selection)系統(tǒng)。未發(fā)生SCRaMbLE 時(shí)菌株能在缺乏尿嘧啶的培養(yǎng)基中存活,只有發(fā)生染色體重排的菌株才能在缺乏亮氨酸的培養(yǎng)基中存活,該系統(tǒng)可快速鑒別發(fā)生重排的菌株。
單倍體合成型酵母在發(fā)生SCRaMbLE 時(shí),必需基因的缺失使基因組重排存在高致死率的問題,為此Shen等[43]開發(fā)了雜合二倍體的SCRaMbLE技術(shù)。該研究將單倍體合成型Sc2.0 菌株與單倍體天然親本菌株交配產(chǎn)生雜合二倍體菌株,以此雜合二倍體菌株進(jìn)行SCRaMbLE,并且該技術(shù)也可以在種間雜交中應(yīng)用。利用二倍體菌株進(jìn)行SCRaMbLE 降低重排的致死率,通過環(huán)境選擇可更快更多地產(chǎn)生新的表型。
為了使SCRaMbLE 系統(tǒng)更加可控和便捷,進(jìn)一步開發(fā)了自上而下和自下而上的體外SCRaMbLE系統(tǒng),該系統(tǒng)由試管中的Cre 重組酶驅(qū)動(dòng),同時(shí)存在含有多個(gè)loxPsym位點(diǎn)DNA片段,通過相關(guān)轉(zhuǎn)錄單元的重排來優(yōu)化生物合成的通路[44]。Liu 等[45]提出了一種基于重組酶的方法(recombinase-based combinatorial method, SCRaMbLE-in),包含一個(gè)體外重組酶系統(tǒng),可以在途徑水平上快速實(shí)現(xiàn)基因表達(dá)的多樣化,同時(shí)開啟體內(nèi)SCRaMbLE 系統(tǒng)將體外組裝的路徑整合到合成型酵母基因組中,并在宿主細(xì)胞中進(jìn)行大量的基因組重排,以同時(shí)達(dá)到外源途徑優(yōu)化和底盤菌株優(yōu)化的效果。
合成型酵母染色體的重排是優(yōu)化宿主、提高產(chǎn)量以及增強(qiáng)菌株耐受性的有效手段。研究人員利用含有合成型染色體的釀酒酵母進(jìn)行SCRaMbLE,得到了可以利用木糖的宿主細(xì)胞,提高了釀酒酵母中紫色桿菌素、脫氧紫色桿菌素前體、青霉素、β-胡蘿卜素、類胡蘿卜素等次級代謝產(chǎn)物產(chǎn)量[40,46-47]。并且通過重排產(chǎn)生了乙醇耐受性增強(qiáng)、耐堿性增強(qiáng)的菌株,同時(shí)對釀酒酵母的耐乙醇機(jī)制及耐堿機(jī)制進(jìn)行了更加深入的探究[36-37]。此外利用SCRaMbLE 系統(tǒng)進(jìn)行基因組規(guī)模的基因敲除是研究基因間相互作用的有效途徑之一,可以利用SCRaMbLE 系統(tǒng)隨機(jī)產(chǎn)生缺失突變體,以此來探索基因合成致死的相互作用[48]。隨著SCRaMbLE系統(tǒng)應(yīng)用的逐漸成熟,研究人員開發(fā)了一種基于此系統(tǒng)的基因組簡化方法(SCRaMbLE-based genome compaction,SGC),并通過迭代SGC 實(shí)現(xiàn)了合成型染色體臂(synXIIL)中39 個(gè)非必需基因的刪除[49]。
在自然界中大多數(shù)生物為了能夠適應(yīng)多種環(huán)境,體內(nèi)含有很多與細(xì)胞基本生長無關(guān)的基因,簡化基因組的研究可以促進(jìn)基因功能的解析,減少基因組中冗余的基因,增加細(xì)胞對能量的利用效率,增強(qiáng)細(xì)胞的可控性,有助于生物遺傳調(diào)控的研究,為合成基因組的設(shè)計(jì)提供基礎(chǔ)。
近年來,基因組簡化研究也取得了快速發(fā)展(圖2)。利用Tn5 轉(zhuǎn)座子的衍生物將E.coli K-12 的基因組減小了200 kb[50],在粟酒裂殖酵母體內(nèi)敲除了冗余的223 個(gè)基因,將基因組減小了657.3 kb[50]。使用改良的轉(zhuǎn)座子誘變法,經(jīng)過不斷地設(shè)計(jì)、合成、測試,確定了維持細(xì)胞生長的必需及準(zhǔn)必需基因,構(gòu)建了簡化的蕈狀支原體JCVIsyn3.0 菌株,該基因組(531 kb)大小僅有原基因組JCVI-syn1.0 (1079 kb)的1 2 左右,比自然界中已知可獨(dú)立存活的最小基因組M. genitalium(580 kb)還要小[19]。該簡化過程中刪除了428 個(gè)基因,但仍有149個(gè)功能未知的基因,這表明還存在著某些維持生命所必需的功能是未知的,JCVIsyn3.0 可作為進(jìn)一步基因組功能研究以及全基因組設(shè)計(jì)探索的平臺[19]。
合成基因組學(xué)研究發(fā)展迅速,從病毒基因組和原核生物基因組的全合成,已經(jīng)快速發(fā)展到真核生物基因組的合成階段,釀酒酵母6條染色體已經(jīng)完成人工設(shè)計(jì)合成?,F(xiàn)在已經(jīng)提出了基因組編寫計(jì)劃[52],將有更多的多細(xì)胞生物基因組進(jìn)入設(shè)計(jì)合成研究的計(jì)劃。但目前合成基因組學(xué)的發(fā)展仍處于起步階段,還面臨著很多技術(shù)的挑戰(zhàn)。
圖2 基因組簡化的研究進(jìn)展[19,50-51][(a)利用Tn5轉(zhuǎn)座子的衍生物將大腸桿菌K-12的基因組縮減200 kb[50];(b)利用LATOUR刪除法將粟酒裂殖酵母基因組縮減657.3 kb[51];(c)利用全基因組設(shè)計(jì)和化學(xué)合成的方法簡化支原體JCVI-syn1.0(1079 kb),通過設(shè)計(jì)、合成、測試三個(gè)步驟的循環(huán),保留了必需基因和準(zhǔn)必需基因,得到支原體JCVI-syn3.0(531 kb,473個(gè)基因)[19]]Fig.2 Advances in genome simplification[19,50-51][(a)Simplification of the E.coli K-12 genome.The deletion procedure has reduced the genome at an average of 200 kb by using specialized transpo‐sons (Tn5 derivatives) to create deletions in the E. coli K-12 chromosome[50]. (b) Simplification of the Schizosaccharomyces pombe genome. Re‐searchers have reduced the genome of S. pombe by 657.3 kb using a large-scale gene deletion method called LATOUR[51]. (c) Simplification and chemical synthesis of M. mycoides genome. Using whole-genome design and complete chemical synthesis, researchers have minimized the 1079-kilobase pair synthetic genome of M.mycoides JCVI-syn1.0.Three cycles of design,synthesis, and testing,with the retention of essential and quasiessential genes,produced JCVI-syn3.0(531 kilobase pairs,473 genes)[19]]
基因組的理性設(shè)計(jì)需要借助更多的技術(shù)手段,例如利用計(jì)算機(jī)輔助設(shè)計(jì)(computer-aided design , CAD)進(jìn)行的大規(guī)?;蚪M設(shè)計(jì)以及利用計(jì)算機(jī)軟件進(jìn)行基因組的可視化和質(zhì)量控制等。目前使用的合成基因組CAD 軟件雖然可以進(jìn)行大規(guī)模的染色體水平DNA 序列設(shè)計(jì),但設(shè)計(jì)后基因組的功能驗(yàn)證仍然只能通過實(shí)驗(yàn)來完成。開發(fā)根據(jù)基因組設(shè)計(jì)預(yù)測生物生存能力及表型的軟件還面臨著巨大的挑戰(zhàn)。伴隨著人工智能的發(fā)展,大量生物信息的整合,將來可以通過機(jī)器學(xué)習(xí)的方法來促進(jìn)人工基因組表型的預(yù)測。然而,目前數(shù)據(jù)不兼容及缺乏足夠的描述性元數(shù)據(jù)的問題還有待解決[29]。我們對基因組功能的了解逐漸深入,可以獲得的生物基本數(shù)據(jù)快速增多,這將可以幫助我們進(jìn)一步加大設(shè)計(jì)尺度,探究基因組設(shè)計(jì)的邊界。
Sc2.0 項(xiàng)目中提出的SCRaMbLE 系統(tǒng)可在短時(shí)間實(shí)現(xiàn)基因組大規(guī)模的重排, SCRaMbLE 系統(tǒng)的誘導(dǎo)方式、重排效率、應(yīng)用對象等方面也在不斷地改進(jìn),但目前SCRaMbLE 系統(tǒng)大多只應(yīng)用于含有單條或兩條合成型染色體的菌株中。在酵母全基因組合成完成后,全基因組重排系統(tǒng)將會產(chǎn)生更多更復(fù)雜的染色體內(nèi)和染色體間的基因組重排。另一方面,目前SCRaMBLE 系統(tǒng)完全依賴于Creloxp 位點(diǎn)特異性重組系統(tǒng),還可以將與Cre 酶正交的重組酶系統(tǒng)引入已完成基因分區(qū)的細(xì)胞內(nèi),構(gòu)建可誘導(dǎo)的基因組模塊化重排系統(tǒng)。越來越多的酪氨酸重組酶系統(tǒng)被發(fā)現(xiàn),從最初的Cre/Loxp 和FLP/FRT系統(tǒng)到新發(fā)現(xiàn)的Vika/vox、Dre/rox、VCre/Vloxp、SCre/Sloxp 等系統(tǒng)均被證明可在異源宿主中發(fā)揮重組作用[53],這些重組酶均可用于嘗試構(gòu)建正交化的重組系統(tǒng)。利用基因組模塊化重排系統(tǒng)有望解析不同的基因組合與生物性能的關(guān)聯(lián)性。
目前針對基因組簡化的方法主要是從理性簡化的角度,對已知的冗余基因、重復(fù)序列、高度可變區(qū)、轉(zhuǎn)座子以及內(nèi)含子等進(jìn)行刪除,通過不斷“設(shè)計(jì)-合成-測試”的循環(huán)來實(shí)現(xiàn)基因組的簡化,工作量較大。利用SCRaMBLE系統(tǒng)進(jìn)行多輪隨機(jī)刪除,還可在保證菌株適應(yīng)度的基礎(chǔ)上實(shí)現(xiàn)基因組的持續(xù)簡化,進(jìn)一步探究基因組簡化的規(guī)律。