李金玉,楊姍,崔玉軍,王濤,滕越
綜 述
細(xì)菌最小基因組研究進(jìn)展
李金玉1,2,3,楊姍2,3,崔玉軍2,3,王濤1,滕越2,3
1. 天津大學(xué)生命科學(xué)學(xué)院,天津 300110 2. 軍事科學(xué)院軍事醫(yī)學(xué)研究院微生物流行病研究所,北京 100071 3. 病原微生物生物安全國家重點(diǎn)實(shí)驗(yàn)室,北京 100071
具有最小基因組的細(xì)菌只包含維持自我生命復(fù)制所必需的基因,其作為一種潛在的工業(yè)生產(chǎn)平臺具有諸多優(yōu)勢。由于高通量DNA測序和合成技術(shù)的發(fā)展,目前已經(jīng)構(gòu)建了多種縮減基因組的菌株。本文首先介紹了最小基因組的概念,其次總結(jié)了細(xì)菌必需基因的相關(guān)研究進(jìn)展,然后梳理了人工縮減與合成微生物基因組的相關(guān)工作,最后探討了在設(shè)計(jì)和組裝基因組的過程中遇到的技術(shù)障礙和限制,以期為人工合成基因組的實(shí)驗(yàn)與應(yīng)用提供理論參考。
細(xì)菌;最小基因組;必需基因;合成生物學(xué);人工設(shè)計(jì)
人們很早就認(rèn)識到支原體屬()等物種的基因組比大多數(shù)細(xì)菌要小得多[1~3]。雖然最初認(rèn)為這些小基因組生物代表了生物進(jìn)化的原始祖先,但到20世紀(jì)80年代,基于16S核糖體RNA序列的系統(tǒng)發(fā)育研究證實(shí):[4]以及其他具有小基因組的胞內(nèi)細(xì)菌,如立克次氏體科()中的一些物種[5],皆來源于具有更大基因組的細(xì)菌。20世紀(jì)初,基因組測序結(jié)果證實(shí)了這些發(fā)現(xiàn),并在不同的細(xì)菌類群中發(fā)現(xiàn)了獨(dú)立的通過縮減基因組進(jìn)化的案例,如柔膜菌綱中的[6]、α-變形菌綱中的普氏立克次體()[7]、γ-變形菌綱中的蚜蟲內(nèi)共生菌()[8]和螺旋體綱中的伯氏疏螺旋體()[9]。這些微生物的基因組保留了滿足其自身在宿主中生存的關(guān)鍵基因,證明不同細(xì)菌類群在特定情況下具有丟失多種基因的“能力”,這表明控制基因組縮減的機(jī)制和動力可能存在于多數(shù)細(xì)菌中。
隨著全基因組測序技術(shù)的發(fā)展,通過對幾個(gè)胞內(nèi)共生細(xì)菌的基因組測序發(fā)現(xiàn)存在更小的基因組,這突破了早期測序達(dá)到的約500 kb (即500個(gè)基因左右)的下限;其中一些基因組還包括其他極端特征,如極快的基因進(jìn)化、密碼子重排和核苷酸組成的極端偏向性等[10,11]。這些變化的主要驅(qū)動因素包括較小的種群規(guī)模以及無性繁殖背景下的選擇、突變和遺傳漂變[11~13]。這類生物不僅編碼很少的蛋白質(zhì),而且其高度修飾的蛋白質(zhì)很容易發(fā)生錯(cuò)誤折疊,需要大量分子伴侶以保證蛋白質(zhì)具有正常功能[10]。盡管與宿主相互作用的關(guān)鍵基因得以保留,但其基因組通過持續(xù)刪除特定基因而不斷被縮減。共生生物和宿主的共適應(yīng)可能促進(jìn)一些基因丟失,但與從線粒體和胞質(zhì)體向細(xì)胞核的基因轉(zhuǎn)移不同,細(xì)菌基因向宿主基因組的轉(zhuǎn)移似乎與細(xì)菌基因組縮減無關(guān)。
20世紀(jì)初,伴隨重組DNA技術(shù)的出現(xiàn),合成生物學(xué)可以設(shè)計(jì)并構(gòu)建基于合成遺傳回路和通路的新型高潛力生物系統(tǒng)。在合成生物學(xué)的“設(shè)計(jì)–構(gòu)建–測試–學(xué)習(xí)”循環(huán)中,系統(tǒng)生物學(xué)為其設(shè)計(jì)步驟提供了關(guān)于復(fù)雜生物過程的完整信息。因此,借助系統(tǒng)生物學(xué)和合成生物學(xué),可最小化細(xì)菌基因組,使其僅包含細(xì)胞復(fù)制和產(chǎn)品生產(chǎn)所必需的基因,并以此設(shè)計(jì)和構(gòu)建可預(yù)測、高效和精于生產(chǎn)的細(xì)胞(圖1)。本文首先介紹了細(xì)菌最小基因組概念,其次總結(jié)了必需基因的研究進(jìn)展,然后回顧了在構(gòu)建人工縮減與合成基因組方面的研究工作,最后探討了在設(shè)計(jì)和構(gòu)建縮減基因組的過程中遇到的技術(shù)障礙和限制,以期為人工合成基因組的實(shí)驗(yàn)與應(yīng)用提供理論參考。
最小基因組被定義為在無外界壓力(營養(yǎng)豐富和無應(yīng)激)條件下足以維持生命活動的基因集。許多實(shí)驗(yàn)研究進(jìn)一步將其定義為在豐富培養(yǎng)基中支持純種培養(yǎng)的基因集。因?yàn)榇蠖鄶?shù)生物在大自然的生態(tài)環(huán)境中需要額外的基因,所需的基因集會隨著環(huán)境條件的變化而有所不同。最小基因組概念出現(xiàn)和發(fā)展的時(shí)間與細(xì)菌全基因組測序時(shí)代相同,都始于20世紀(jì)90年代中期[14]。生物的基因組大小從幾十萬個(gè)堿基對到一千多億個(gè)堿基對不等。其中,布赫納氏菌(spp.)是一種胞內(nèi)共生菌,與大腸桿菌()具有共同祖先;與其祖先相比,基因組縮減達(dá)75%,僅為250 kb[15,16],是自然界中基因組大規(guī)??s減的一個(gè)明顯示例。最小基因組不僅存在于布赫納氏菌,也存在許多其他共生細(xì)菌中。是一種昆蟲共生細(xì)菌,具有最小的自我復(fù)制基因組(112 kb)[17]。此外,本課題組還聚焦于最近發(fā)現(xiàn)的為食液昆蟲提供營養(yǎng)的共生細(xì)菌中的極端微小基因組,包括來自4個(gè)遠(yuǎn)緣細(xì)菌類群的5個(gè)獨(dú)立的極端基因組縮減實(shí)例,其基因組大小都不到生殖支原體基因組的一半(甚至不到1/4) (表1)。這些例子顯示出源于生態(tài)位適應(yīng)的基因組進(jìn)化趨勢。共生生物不需要環(huán)境條件響應(yīng)相關(guān)的基因,因?yàn)槠渌拗魈峁┝朔€(wěn)定的營養(yǎng)供應(yīng),并保護(hù)其免受惡劣環(huán)境變化的影響,因此,在長期進(jìn)化過程中,這些不必要的基因已經(jīng)從它們的基因組中移除。
許多研究表明,物種種群規(guī)模較小、無性繁殖[18~20]以及細(xì)菌所固有的基因刪除偏倚[19,21],是基因組縮減的主要原因。由于特定宿主的限制和不同宿主中的菌株之間缺乏重組,導(dǎo)致了高度遺傳漂變,使有益但非必需的基因失活和缺失。這種菌群結(jié)構(gòu)的另一個(gè)影響是最初發(fā)現(xiàn)于和中的微小基因組基因序列快速進(jìn)化,及其對蛋白質(zhì)二級結(jié)構(gòu)穩(wěn)定性的影響[22,23]?;蚪M減少的早期階段以一些較新進(jìn)化的共生生物為代表,其特征是移動元件的增加,假基因的形成,多個(gè)基因組重排和染色體片段的缺失(圖2)[24~26]。然而,在更早期進(jìn)化的共生體中,如,移動元件和大多數(shù)假基因已被移除。
圖1 設(shè)計(jì)、構(gòu)建和測試最小基因組的研究
以合成生物學(xué)為基礎(chǔ)的最小基因組的構(gòu)建,包括設(shè)計(jì)、構(gòu)建、測試、學(xué)習(xí)、應(yīng)用的循環(huán)周期。A:通過不同方法確定物種的必需基因集,包括比較基因組學(xué)、轉(zhuǎn)座子測序、反義RNA、CRISPRi等。B:構(gòu)建最小基因組的過程,主要遵循自上而下,自下而上兩種原則。C:對構(gòu)建的最小基因組進(jìn)行系統(tǒng)生物學(xué)研究,以測序技術(shù)、組學(xué)技術(shù)等為手段進(jìn)行測試、學(xué)習(xí)、應(yīng)用。
通過對不同生物基因庫的計(jì)算分析[14,27~32],以及純種培養(yǎng)生物的基因誘變破壞實(shí)驗(yàn)[33~36],可對最小基因組的基因完整性進(jìn)行預(yù)測。這種誘變實(shí)驗(yàn)只限于可純種培養(yǎng)的生物,如.,它的基因組是迄今為止純種培養(yǎng)生物中最小的。研究表明,通用基因集很小,且不包括許多已被實(shí)驗(yàn)確定為特定生物所必需的基因。因此,不同生物可能以完全不同的方式完成基本生命活動。例如,通過運(yùn)輸而不是從頭合成獲得所需的化合物,或者使用不相關(guān)的基因和不同的途徑使特定tRNA裝載正確的氨基酸[37]。某些通用或接近通用的基因缺失并不致死[32]。不同的研究預(yù)測了不同的最小基因集,雖然這些基因的分布較廣泛,但都包括參與細(xì)胞基本功能的基因。有些新陳代謝相關(guān)基因分布較廣泛,在自然環(huán)境下對特定生物至關(guān)重要,但并非必不可少。
表1 具有代表性的細(xì)菌、共生生物、病毒和細(xì)胞器基因組的比較
a:指個(gè)體所屬的綱,細(xì)胞器或病毒家族類型;b:蛋白質(zhì)直系同源基因簇,即指位于蛋白質(zhì)直系同源基因簇中M簇(細(xì)胞膜生物發(fā)生,外膜)和I簇(脂質(zhì)代謝)的基因數(shù);NA:不適用。
細(xì)菌基因組含有數(shù)百萬個(gè)堿基對。例如,研究最廣泛的模式生物大腸桿菌的基因組>5 Mb,包含4000多個(gè)基因,其中1000多個(gè)為未知功能的基因[38,39]。大腸桿菌可在多種環(huán)境下繁殖,如好氧和厭氧,以及不同營養(yǎng)物質(zhì)、pH值和溫度等。大腸桿菌的基因組中有許多基因負(fù)責(zé)處理環(huán)境壓力和利用各種營養(yǎng)物質(zhì);然而,在環(huán)境確定的實(shí)驗(yàn)室條件下,不再需要某些應(yīng)激反應(yīng)基因;因此許多基因可以被刪除,而不會對細(xì)胞生長產(chǎn)生負(fù)面影響[40]。同時(shí),大腸桿菌基因組還編碼了許多實(shí)驗(yàn)室培養(yǎng)和工業(yè)發(fā)酵不需要的基因,這些基因會導(dǎo)致能量和生物質(zhì)前體的浪費(fèi),不必要的基因組片段的復(fù)制,以及功能冗余或無用的轉(zhuǎn)錄物、蛋白質(zhì)和代謝物的合成。因此,刪除這些不必要基因的生物體或可成為人工條件下產(chǎn)品生產(chǎn)的全新平臺[41]。
圖2 細(xì)菌基因組的減少階段及其進(jìn)化特征
線粒體比較基因組學(xué)使人們了解線粒體祖先的基因組是什么樣的,以及它包含的基因是什么。從它所包含的基因組的角度看,線粒體具有毫無疑問的細(xì)菌起源,起源于α-變形桿菌()[42]。因此,內(nèi)共生假說認(rèn)為真核細(xì)胞中的線粒體從細(xì)菌祖細(xì)胞通過共生進(jìn)化而來?;谙到y(tǒng)發(fā)育的分析表明,線粒體基因組進(jìn)化的特征是某些譜系大量擴(kuò)增,另一些譜系則極度減少和壓縮,通過內(nèi)共生基因轉(zhuǎn)移將線粒體基因組中的許多初始遺傳信息重新定位到細(xì)胞核[43]。α-變形桿菌基因組之間的比較表明,線粒體的細(xì)菌祖先包含約3000~5000個(gè)基因,線粒體基因組中直系同源基因的祖先簇的上限約為1700個(gè),這些估計(jì)表明,從細(xì)菌共生體到原始細(xì)胞器的過渡過程中丟失了大約3000個(gè)基因[44]。可以預(yù)見,基因組學(xué)和蛋白質(zhì)組學(xué)數(shù)據(jù)的不斷增長將提供關(guān)于線粒體結(jié)構(gòu)和功能的新的數(shù)據(jù)和見識,并將不斷重塑和完善目前的線粒體進(jìn)化理論。
隨著基因組學(xué)革命以及系統(tǒng)生物學(xué)的不斷進(jìn)步,合成生物學(xué)在過去10年中飛速發(fā)展,尤其是在基于系統(tǒng)和合成生物學(xué)的微生物底盤工程和改造領(lǐng)域。在系統(tǒng)生物學(xué)中,理想的底盤可代指具有簡化的基因組且可以實(shí)現(xiàn)全部功能的生物,以及能夠更有效地合成所需產(chǎn)物的代謝網(wǎng)絡(luò);在合成生物學(xué)中,底盤是指通過提供允許其運(yùn)轉(zhuǎn)的資源來容納和支持遺傳成分的生物。
構(gòu)建合成微生物底盤包括兩種方法:自上向下和自下向上。自上而下的方法是通過去除不必要的細(xì)胞基因來了解基因組架構(gòu)并改善其特性的減少基因組大小的策略。基于大規(guī)模DNA分析的出現(xiàn),通過對來自不同生物體的基因組進(jìn)行比較分析,通常可以揭示對于細(xì)胞生命和相似和/或截然不同的代謝途徑必不可少的基因。接下來,再通過不同的實(shí)驗(yàn)方法來實(shí)現(xiàn)缺失。工程設(shè)計(jì)和修改合成微生物底盤揭示生命的基本原理,是加強(qiáng)其在衛(wèi)生醫(yī)藥和食品工業(yè)中的應(yīng)用的最佳方法之一。有關(guān)這個(gè)主題的研究計(jì)劃已在多個(gè)國家獲得資助?!白钚』蚪M工廠”(minimum genome factory, MGF)項(xiàng)目于2001年在日本啟動,其目標(biāo)是構(gòu)建具有較小基因組的微生物以用于工業(yè)用途?;诒容^大腸桿菌和布赫納氏菌獲得的非必需基因信息,Hiroshi等[45]通過刪除大腸桿菌W3110中的大腸桿菌特異性基因構(gòu)建了大腸桿菌MGF-01,其構(gòu)建方法與其他缺失方法一致,即連續(xù)缺失結(jié)合P1轉(zhuǎn)導(dǎo)。簡言之,用含有和基因的DNA組件同源替換刪除靶DNA序列。然后,用另一個(gè)DNA組件替換選擇標(biāo)記,用蔗糖進(jìn)行負(fù)篩選獲得無標(biāo)記克隆。最后,在28個(gè)P1轉(zhuǎn)導(dǎo)循環(huán)中積累了53個(gè)缺失,從而使總?cè)笔чL度達(dá)1.03 Mb。MGF-01的最終生物量是野生型親本的1.5倍。據(jù)稱,MGF-01相比親本菌株葡萄糖利用效率更高,這是因?yàn)轱@著減少了過量的醋酸鹽積累(從大腸桿菌W3110中的1.37 g/L降至MGF-01中的0.50 g/L)。此外,與野生型相比,MGF-01的蘇氨酸濃度和產(chǎn)量分別提高了2.44倍和1.69倍,醋酸鹽副產(chǎn)物則顯著降低。MGF-01的這些意想不到的有益特性與其他具有與野生型祖先相似表型的縮減基因組大腸桿菌不同,但需要進(jìn)一步研究MGF-01的差異性。
構(gòu)建最小基因組,首先要闡明維持生命所必需的基因。20世紀(jì)90年代,只測得少數(shù)微小細(xì)菌的全基因組序列。Mushegian和Koonin等[59]對生殖支原體和流感嗜血桿菌()進(jìn)行比較,表明這兩種細(xì)菌都有相對較小的基因組,但表現(xiàn)出完全不同的進(jìn)化軌跡。根據(jù)比較基因組學(xué)原則,在多種生物中保守的基因很可能有必需的功能。在生殖支原體和流感嗜血桿菌中,共發(fā)現(xiàn)240個(gè)直系同源基因;但此分析遺漏了幾個(gè)編碼細(xì)胞必需功能的基因,如磷酸甘油酸變位酶和核苷二磷酸激酶基因。這兩個(gè)物種有不同且不相關(guān)的磷酸甘油酸變位酶,因此非同源基因偶爾可以取代古老的基因并破壞其保守性。最終,研究結(jié)果證明包括非直系同源基因取代在內(nèi),預(yù)測共有262個(gè)基因構(gòu)成了兩個(gè)物種的核心生物功能。盡管這兩種細(xì)菌和它們的共同祖先之間經(jīng)歷了15億年的進(jìn)化,仍有約50%的基因被保存下來。
自2000年以來,已獲得數(shù)萬基因組序列??茖W(xué)家比較了數(shù)百個(gè)基因組,以確定物種間普遍存在的基因,然而這樣的基因并不常見。Brown等[61]比較了45個(gè)基因組,發(fā)現(xiàn)只有23個(gè)保守基因[60];Koonin等[62]報(bào)道了普遍存在于100個(gè)基因組的63個(gè)基因;Charlebois等[63]比較了14個(gè)門中的147個(gè)原核生物基因組,僅發(fā)現(xiàn)34個(gè)通用基因。雖然報(bào)告的保守基因數(shù)目不同,但都這些研究同時(shí)證明只有少數(shù)保守基因絕對不足以維持生命。因此,比較基因組學(xué)對必需基因的理論預(yù)測僅限于功能未知、非同源取代和具有數(shù)十億年進(jìn)化歷史的基因。
除了計(jì)算預(yù)測,研究者還使用實(shí)驗(yàn)方法來探究必需基因。最簡單的方法是從基因組中刪除一個(gè)特定的基因位點(diǎn),觀察其致死效應(yīng)。在迄今為止已知的任何自由生活的生物體中,生殖支原體具有最小的基因組(580 kb,編碼517個(gè)基因),其中許多基因可能通過轉(zhuǎn)座子作用而失活[64]。在枯草芽孢桿菌()中,通過對其基因組的79個(gè)區(qū)域進(jìn)行隨機(jī)突變[65],發(fā)現(xiàn)只有6個(gè)位點(diǎn)是必不可少的,大小約318~526 kb,與生殖支原體基因組大小相似。因此,人們設(shè)計(jì)了各種方法來確定細(xì)菌中的必需基因。如通過重組、轉(zhuǎn)座子插入和反義RNA (asRNA)直接使單個(gè)基因失活。通過插入非復(fù)制質(zhì)粒失活枯草芽孢桿菌中的單個(gè)基因,Kobayashi等[66]發(fā)現(xiàn)4101個(gè)基因中只有271個(gè)是必需基因。在大腸桿菌中,4288個(gè)開放閱讀框(open reading frame, ORF)中的3985個(gè)可被敲除,表明剩余的303個(gè)ORFs對生命至關(guān)重要[67]。盡管靶向基因敲除研究提供了基因必需性的直接證據(jù),但該方法耗時(shí)長,需要進(jìn)行數(shù)千次刪除實(shí)驗(yàn)。
為了克服這些限制,可采用基于轉(zhuǎn)座子誘變失活的高通量方法。轉(zhuǎn)座子是一種基因元件,可在基因組內(nèi)隨機(jī)移動并插入,破壞基因的正常功能。如果基因組中的必需基因被插入轉(zhuǎn)座子,則此突變體不能存活。利用此特征,可以通過鑒定存活突變體中的轉(zhuǎn)座子插入位點(diǎn)來區(qū)分必需和非必需基因。Glass等[68]和Hutchison等[69]分別利用1300和3000個(gè)突變體,在生殖支原體中構(gòu)建了全基因組轉(zhuǎn)座子插入圖譜,發(fā)現(xiàn)265~382個(gè)必需編碼序列(coding sequences, CDSs)。由3000個(gè)唯一插入位點(diǎn)組成的轉(zhuǎn)座子插入圖譜,其平均分辨率約為每200 bp一個(gè)插入位點(diǎn)。此分辨率無法檢測功能性RNAs (如tRNAs和ncRNAs)等小遺傳元件的必需性。此外,一些必需基因在3?端對轉(zhuǎn)座子插入檢測具有抗性,因?yàn)槎探匚不蜓由觳⒉挥绊懫涔δ堋榱艘?guī)避這一限制,研究者發(fā)明了一種通過asRNAs使基因失活的方法[70]。與轉(zhuǎn)座子不可逆的基因破壞不同,利用asRNAs可以特異性敲低某個(gè)基因。因此,一旦構(gòu)建出asRNA文庫,研究者可以在多種環(huán)境條件和迭代過程中評估基因必需性或適合性,而無需重復(fù)構(gòu)建敲除菌株或轉(zhuǎn)座子突變體。
轉(zhuǎn)座子插入位點(diǎn)的鑒定依賴于單個(gè)克隆的分離和現(xiàn)有的高通量測序技術(shù)的發(fā)展;通過與高通量測序技術(shù)相結(jié)合,可以并行識別多個(gè)插入位點(diǎn)。因此,轉(zhuǎn)座子誘變與下一代測序技術(shù)(Tn-Seq)相結(jié)合,即利用轉(zhuǎn)座子誘變以更高的分辨率檢測必需基因。對2×105大腸桿菌轉(zhuǎn)座子突變體文庫的統(tǒng)計(jì)分析,共鑒定出620個(gè)必需基因[71]。Tn-Seq和單個(gè)基因敲除研究之間的差異可能源于細(xì)胞增殖。一個(gè)重要基因,即使不是嚴(yán)格意義上的必需基因,其失活也會導(dǎo)致嚴(yán)重的生長缺陷;在細(xì)胞繁殖過程中,這種缺陷可能未被充分表達(dá)或逐漸消失。此外,不同的統(tǒng)計(jì)臨界值和實(shí)驗(yàn)條件也可能導(dǎo)致這種差異。
最后,基于成簇規(guī)律間隔短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats, CRISPR)引領(lǐng)的技術(shù)革命,催化失活Cas9 (dead Cas9, dCas9)可以在轉(zhuǎn)錄水平抑制靶基因的表達(dá)[72]。由于CRISPR系統(tǒng)的特異性只取決于嵌合單導(dǎo)向RNA (sgRNA)中20 nt的原間隔序列,因此易于通過DNA合成構(gòu)建大規(guī)模全基因組sgRNA文庫。利用全基因組CRISPR干擾(CRISPR interference, CRISPRi),通過約59 000個(gè)sgRNAs抑制所有基因,在大腸桿菌中鑒定出379個(gè)必需基因[73]。利用CRISPRi技術(shù)估計(jì)的必需基因數(shù)量略大于其他方法估計(jì)的數(shù)量。在細(xì)菌中,許多基因是多順反子轉(zhuǎn)錄的,故前導(dǎo)多順反子的破壞會使操縱子中包含的下游基因失活。因此,即使前導(dǎo)基因是非必需的,其轉(zhuǎn)錄抑制也會導(dǎo)致下游必需基因的致死效應(yīng),即多順反子結(jié)構(gòu)導(dǎo)致必需基因的高估。利用目前的高通量DNA合成技術(shù),可以高效合成龐大的sgRNA文庫,并將其用于鑒定具有更大基因組的生物(如人類)的必需基因[74,75]。
總之,人們已經(jīng)采用多種方法來闡明各種生物體中的必需基因。盡管不同方法得到的必需基因的確切數(shù)目不同,但500個(gè)基因被認(rèn)為足以維持生命。利用單基因敲除研究、Tn-Seq和CRISPRi直接檢查單個(gè)基因是否必需無法規(guī)避各種技術(shù)固有的局限性。因?yàn)檫@些方法依賴于單個(gè)基因的移除或失活,而同時(shí)失活兩個(gè)以上的基因從未被測試過。例如,假設(shè)兩個(gè)基因在大腸桿菌中具有相同的基本功能,這兩個(gè)基因可以單獨(dú)刪除,因?yàn)榱硪粋€(gè)基因可以恢復(fù)其功能;但是,兩個(gè)基因同時(shí)失活則產(chǎn)生致死效應(yīng)。即使在最簡單的細(xì)菌生殖支原體中,構(gòu)建雙基因敲除庫也需要25萬個(gè)菌株??紤]到構(gòu)建約4 000個(gè)大腸桿菌單基因敲除菌株所需的巨大時(shí)間和費(fèi)用成本[40],需要采用新的技術(shù)來探索基因高階組合的必需性。
大腸桿菌是研究最廣泛的模式生物,已為其構(gòu)建了多種縮減基因組,缺失大小從300 kb到1.38 Mb不等(表2)。大腸桿菌K-12菌株的基因組約為4.64 Mb,缺失大小約為原始基因組的6.8%~29.7%。下面簡介了一些目前構(gòu)建的縮減基因組大腸桿菌,還回顧了其他物種中基因組縮減案例。
2002年有兩例關(guān)于縮減基因組大腸桿菌的報(bào)道。其中之一是Yu等[76]報(bào)道的CDΔ3456,缺失片段大小超過300 kb。該菌株構(gòu)建過程中,位于位點(diǎn)特異性重組酶識別的兩個(gè)位點(diǎn)之間的一個(gè)較大的基因組區(qū)域被刪除。使用轉(zhuǎn)座子將位點(diǎn)預(yù)先插入到基因組中的任意位置。具體方法是,用兩種抗生素抗性基因盒構(gòu)建兩個(gè)轉(zhuǎn)座子突變庫,并定位所有轉(zhuǎn)座子插入位點(diǎn)。篩選轉(zhuǎn)座子分別定位在目標(biāo)缺失區(qū)域一端的兩個(gè)突變體,其中包含兩個(gè)不同的標(biāo)記基因,并通過P1轉(zhuǎn)導(dǎo)將其基因組融合。使用兩種不同的抗生素抗性基因標(biāo)記來篩選成功轉(zhuǎn)導(dǎo)的細(xì)胞。然后,融合基因組中的兩個(gè)位點(diǎn)通過Cre重組酶重組,產(chǎn)生較大的靶向缺失。由此構(gòu)建了6個(gè)缺失菌株,并進(jìn)一步利用P1轉(zhuǎn)導(dǎo)將多個(gè)缺失累積到一個(gè)基因組中。在此過程中,某些基因組區(qū)域可以單獨(dú)從基因組中刪除,但是特定的基因組合不能同時(shí)刪除,這種關(guān)系被稱為合成致死,其原因可能是存在基因重復(fù)或直系同源物[77]。當(dāng)兩個(gè)基因的一個(gè)拷貝被刪除時(shí),另一個(gè)拷貝可以維持生物體正常功能,而雙突變體則不能。為了避免合成致死組合,4個(gè)區(qū)域被整合在CDΔ3456中,該菌株缺少287個(gè)ORFs,其中包含179個(gè)未知基因,以及與組氨酸生物合成、菌毛和數(shù)個(gè)轉(zhuǎn)運(yùn)蛋白相關(guān)的基因,最終獲得克隆的生長速率與親本大腸桿菌相當(dāng)。
表2 縮減基因組大腸桿菌及其特征
2002年報(bào)道了縮減基因組大腸桿菌MDS12,其缺少大腸桿菌K-12菌株的12個(gè)K-島[78]。K-島是K-12通過水平基因轉(zhuǎn)移獲得的基因組區(qū)域。K-島含有非必需基因,如原噬菌體和轉(zhuǎn)座子。利用I-I巨核酶和雙鏈斷裂修復(fù)系統(tǒng),用無痕刪除法將12個(gè)K-島依次刪除。具體方法是,將含有氯霉素抗性基因的DNA組件引入大腸桿菌MG1655,以取代同源靶區(qū)。雖然靶標(biāo)被刪除,但下一輪刪除需要去除抗性基因,因此采用I-I將該基因刪除。
之后,雙鏈斷裂被RecA修復(fù),形成無痕缺失株。經(jīng)過12次迭代刪除和P1轉(zhuǎn)導(dǎo),刪除長度合計(jì)為376 kb,包含409個(gè)ORFs。由于被刪除的基因沒有必需功能,MDS12的生長速度和DNA轉(zhuǎn)化效率與原始菌株無差異。MDS12的最終細(xì)胞密度比野生型大腸桿菌高約10%。在MDS12中,節(jié)省的能量和物質(zhì)可以轉(zhuǎn)化為生物量,顯示出縮減基因組的優(yōu)勢。
4年后,Pósfai等[79]報(bào)告了大腸桿菌MDS41、42和43,它們是MDS12的后代,含有額外的缺失(與野生型相比,總?cè)笔?63~708 kb)。MDS42不含任何可轉(zhuǎn)位和插入序列(insertion sequence, IS)元件。據(jù)報(bào)道,在大腸桿菌中,20%~25%的突變與IS元件有關(guān)[79]。MDS42未顯示IS介導(dǎo)的基因失活。利用該特性,MDS42可穩(wěn)定復(fù)制攜帶毒性O(shè)RFs的質(zhì)粒DNA,且基因組構(gòu)成穩(wěn)定。大腸桿菌有一個(gè)沉默的操作子,能夠利用水楊苷;因此,通常條件下,大腸桿菌不利用水楊苷作為其唯一碳源。當(dāng)使用水楊苷作為唯一碳源培養(yǎng)時(shí),MDS41的操縱子激活率低于MG1655 (8%)。此外,MDS42產(chǎn)生的蘇氨酸比野生型大腸桿菌多80%以上[80]。
成功構(gòu)建MDS菌株之后,Park等[81]在MDS42中又引入了14個(gè)缺失,以此構(gòu)建大腸桿菌MS56。除MDS42的缺失外,還刪除了非必需基因和遺傳元件,如氫化酶、菌毛樣黏附素和厭氧呼吸酶,基因組縮減總量達(dá)1.07 Mb。編碼抑制大腸桿菌生長的人蛋白異源基因可在MS56中成功表達(dá),不會有任何IS介導(dǎo)的失活,而正常含IS的大腸桿菌中會迅速發(fā)生失活。
Hashimoto等[82]構(gòu)建了大腸桿菌Δ16,其基因組縮減量為1.377 Mb (占其原始基因組的29.7%),是報(bào)道的最大縮減量。與其他縮減基因組一樣,Δ16的構(gòu)建方法也是同源重組連續(xù)缺失結(jié)合P1轉(zhuǎn)導(dǎo)。Hashimoto等[82]采用正篩選和負(fù)篩選兩種方法進(jìn)行基因刪除。首先,構(gòu)建靶區(qū)序列末端同源DNA組件。該盒還含有三個(gè)基因:氯霉素乙酰轉(zhuǎn)移酶()、和。將此DNA組件導(dǎo)入后,用氯霉素選擇目標(biāo)基因組區(qū)域被此組件取代的克隆。然后,用新的同源DNA組件取代該序列,接著用和基因進(jìn)行負(fù)篩選,使細(xì)胞對鏈霉素和蔗糖敏感。通過P1轉(zhuǎn)導(dǎo)將16個(gè)無痕缺失進(jìn)行組合,獲得最終菌株Δ16,累計(jì)缺失1.377 Mb。在連續(xù)缺失過程中,倍增時(shí)間從MG1655的26.2 min依次增加到Δ16的45.4 min,細(xì)胞形狀變長變寬,擬核呈不規(guī)則分布,其復(fù)制與細(xì)胞分裂不同步。
枯草芽孢桿菌是研究最廣泛的革蘭氏陽性菌之一,因其具有蛋白分泌系統(tǒng)而成為各種蛋白的優(yōu)良生產(chǎn)宿主。Westers等[83]通過去除6個(gè)基因組位點(diǎn),包括聚酮、蛋白質(zhì)抗生素生物合成、原噬菌體和原噬菌體樣元件相關(guān)基因,構(gòu)建了基因組縮減枯草芽孢桿菌Δ6。這些位點(diǎn)共包含332個(gè)基因(320 kb)。通過使用整合質(zhì)粒pG + host4整合并切除選擇標(biāo)記實(shí)現(xiàn)基因刪除[84]?;蚪M縮減枯草芽孢桿菌Δ6在細(xì)胞生理上沒有明顯變化。與親本菌株相比,該菌株的生長速度、葡萄糖/醋酸鹽代謝通量、異源蛋白分泌和生物量均相同。出乎意料的是,盡管沒有刪除與細(xì)胞運(yùn)動相關(guān)的基因,Δ6在瓊脂糖平板上顯示出細(xì)胞運(yùn)動性增加。基因組縮減菌株偶爾會出現(xiàn)此類意外表型,說明對即使是微小細(xì)菌的基因組理解也是有限的[85]。
枯草芽孢桿菌Δ6基因組被進(jìn)一步縮減,構(gòu)建形成PG10和PG38。Reu等[86]構(gòu)建了兩個(gè)獨(dú)立的基因組縮減菌株P(guān)G10和PG38,分別包含88和94個(gè)迭代缺失,缺失部分包含產(chǎn)孢、運(yùn)動、抗生素合成和次生代謝相關(guān)的非必需基因。在連續(xù)缺失過程中,中間菌株逐漸喪失DNA整合所需的感受態(tài)。因此,在基因組中引入了額外的感受態(tài)蛋白(ComK和ComS),以有效導(dǎo)入缺失所需的DNA。兩種衍生菌株的生長速度較慢(倍增時(shí)間延長約40%),細(xì)胞形態(tài)呈長絲狀。雖然這兩個(gè)菌株的生長速度都有所降低,與之前認(rèn)為細(xì)胞存活所需的基因組相比,它們的基因組縮減比例是迄今為止最大的(1.46和1.54 Mb;超過了它們原始基因組的1/3)。
Ara等[87]基于枯草芽孢桿菌168構(gòu)建了一株縮減基因組枯草芽孢桿菌MGB469。縮減菌株缺少9個(gè)與原噬菌體和原噬菌體樣元件相關(guān)的基因組位點(diǎn)和2個(gè)抗生素合成基因(巴斯他汀和聚酮)。首先從枯草芽孢桿菌的基因組中逐一刪除這些位點(diǎn),以確認(rèn)其不包含必需基因。然后,依次合并刪除,使刪除區(qū)域達(dá)469 kb,由此得到菌株MGB469,其生長速度和蛋白質(zhì)產(chǎn)率與原始菌株無差別,從而達(dá)到進(jìn)一步縮減基因組的目的。該文作者發(fā)現(xiàn)一個(gè)可以增加蛋白質(zhì)產(chǎn)率的基因組縮減位點(diǎn),最終構(gòu)建出比原始菌株具有更高生產(chǎn)率的基因組縮減菌株。從MGB469中進(jìn)一步刪除單獨(dú)缺失時(shí)增加纖維素酶產(chǎn)率的6個(gè)基因組位點(diǎn),構(gòu)建了總基因組縮減991 kb的菌株MG1M。然而,MG1M中纖維素酶和蛋白酶的生產(chǎn)沒有發(fā)生明顯的變化。
由于枯草芽孢桿菌MGB469和MG1M的表型與野生型相當(dāng),并且在進(jìn)一步基因組縮減后沒有產(chǎn)生有益表型,Morimoto等[88]重新利用中間菌株MGB469構(gòu)建具有優(yōu)勢特征的新型基因組縮減枯草芽孢桿菌。該文作者測試了包括原噬菌體和次級代謝基因在內(nèi)的74個(gè)基因組區(qū)域的缺失。在63個(gè)可發(fā)生缺失的區(qū)域中,11個(gè)連續(xù)缺失被引入MGB469,從而得到缺失長度為874 kb的枯草芽孢桿菌MGB874。雖然MGB874具有正常的細(xì)胞形態(tài)和擬核結(jié)構(gòu),但其生長速度降低至野生型枯草芽孢桿菌的70%。與枯草芽孢桿菌的其他縮減基因組不同,MGB874產(chǎn)生的纖維素酶和蛋白酶比枯草芽孢桿菌168分別提高1.7倍和2.5倍。轉(zhuǎn)錄組研究發(fā)現(xiàn)了許多轉(zhuǎn)錄組水平的基因表達(dá)變化,如產(chǎn)孢、降解酶分泌和σ因子,推測是其生產(chǎn)率提高的原因。MGB874證明具有縮減基因組的菌株可作為工業(yè)蛋白生產(chǎn)的優(yōu)良宿主。
放線菌門中的鏈霉菌屬是一類工業(yè)和臨床應(yīng)用中重要的放線菌,已知其可產(chǎn)生抗生素等大多數(shù)具有生物活性的次級代謝產(chǎn)物。鏈霉菌屬基因組在細(xì)菌中相對較大,其染色體DNA呈線性而非環(huán)狀?;趹?yīng)用最廣的工業(yè)菌種之一阿維鏈霉菌,Komatsu等[89,90]構(gòu)建了菌株SUKA17。阿維鏈霉菌中含有20多個(gè)次級代謝物生物合成基因簇,主要位于基因組的末端,稱為亞端粒區(qū)。對灰色鏈霉菌()、天藍(lán)色鏈霉菌()和阿維鏈霉菌進(jìn)行比較基因組學(xué)研究,揭示了位于基因組中心的必需核心基因。使用同源重組和Cre介導(dǎo)的重組,從阿維鏈霉菌中刪除亞端粒區(qū)主要次級代謝相關(guān)基因(包括萜烯代謝)。與大腸桿菌和枯草芽孢桿菌不同,阿維鏈霉菌不易發(fā)生發(fā)重組。因此,兩個(gè)位點(diǎn)首先通過同源重組從環(huán)狀DNA模板導(dǎo)入到基因組中。然后,通過Cre介導(dǎo)重組刪除基因組中大片段目標(biāo)位點(diǎn)。該缺失包括1272個(gè)ORFs的基因組區(qū)域,總長度為1.67 Mb。由于其基因組較簡單,無需承擔(dān)不必要的次生代謝物合成,含有異源基因簇的SUKA17比原生灰色鏈球菌和棒狀鏈霉菌()產(chǎn)生更多的鏈霉素和頭霉素C。
上面討論的縮減基因組都是使用自上而下的方式對基因組進(jìn)行縮減而構(gòu)建的。現(xiàn)今,研究者已實(shí)現(xiàn)從頭合成病毒、噬菌體和細(xì)菌基因組。借助基因組編輯和合成工具,可以進(jìn)行全基因組水平上進(jìn)行工程設(shè)計(jì)。研究者已實(shí)現(xiàn)設(shè)計(jì)并構(gòu)建基于合成遺傳回路和通路的新型高潛力生物系統(tǒng)。借助系統(tǒng)生物學(xué)和合成生物學(xué)而發(fā)展的合成基因組學(xué),可最小化細(xì)菌基因組,從頭開始合成基因組可以對基因組結(jié)構(gòu)和功能進(jìn)行前所未有的修飾,獲得對生命基本原理的新見解并致力于設(shè)計(jì)有價(jià)值的應(yīng)用,例如設(shè)計(jì)并構(gòu)建可預(yù)測的、高效的或是精于生產(chǎn)的細(xì)胞(圖3)。
自1995年關(guān)于生殖支原體基因組大小為525個(gè)基因的第一份報(bào)道以來,該細(xì)菌和該屬的其他成員已成為探索賦予生命最少數(shù)量的細(xì)胞成分的最有用的試驗(yàn)臺。事實(shí)上,到目前為止,某些支原體菌株已成為我們最了解的生物系統(tǒng),其所有組成部分及其相互作用的各個(gè)方面都經(jīng)過了非常詳細(xì)的探索和量化。里程碑式的工作包括通過轉(zhuǎn)座子誘變檢查每個(gè)基因的必要性,實(shí)現(xiàn)支原體基因組的完全化學(xué)合成等。
支原體是小基因組細(xì)菌,其將成為探索生命所需的最低限度的基因組大小的理想平臺。Gibson等[91]構(gòu)建的支原體JCVI-syn1.0含有一個(gè)完全化學(xué)合成的基因組,即略加修飾的1.08 Mb蕈狀支原體()基因組的復(fù)制體。通過轉(zhuǎn)座子誘變闡明蕈狀支原體的必需基因后,合成了最小基因組蕈狀支原體JCVI-syn3.0[92](包含473個(gè)基因,總長度為531 kb)。進(jìn)一步的實(shí)驗(yàn)驗(yàn)證表明,基于分子生物學(xué)的系統(tǒng)知識以及有限的轉(zhuǎn)座子誘變數(shù)據(jù)相結(jié)合的初始設(shè)計(jì)未能產(chǎn)生活細(xì)胞。隨后,改良的轉(zhuǎn)座子誘變方法揭示了穩(wěn)健生長所需的一類準(zhǔn)必需基因,這解釋了其最初設(shè)計(jì)的失敗。最后,研究者通過設(shè)計(jì),合成和測試的3個(gè)循環(huán)(保留了基本必需的基因)產(chǎn)生了JCVI-syn3.0,相對于其親本菌株而言,基因組的凈基因組大小減少了約50% (從約1079 kb減少到531 kb),并將基本生物學(xué)信息精簡到了473個(gè)基因,其基因組比自然界中任何自主復(fù)制的細(xì)胞都要小。雖然JCVI-syn3.0的倍增時(shí)間是JCVI-syn1.0的3倍(~180 min),但遠(yuǎn)小于具有天然最小基因組的生殖支原體(~16 h)。盡管全基因組合成需要漫長的時(shí)間和巨大的費(fèi)用[93],但無疑是基因組縮減的一種極有吸引力的替代方法。
圖3 合成基因組的過程:從設(shè)計(jì)序列到體外組裝到體內(nèi)復(fù)蘇
A:在體外進(jìn)行寡核苷酸的合成。常用方法包括列式合成、陣列式合成、酶法合成等。B:通過PCA、Gibson組裝等進(jìn)行體外組裝,或是導(dǎo)入細(xì)胞內(nèi)進(jìn)行由轉(zhuǎn)化以及減數(shù)分裂介導(dǎo)的重組、組裝。C:最后進(jìn)行分型、調(diào)試。
JCVI-syn3.0是一個(gè)多功能平臺,可用于研究生活的核心功能并探索全基因組設(shè)計(jì)。最小細(xì)胞的概念乍看之下似乎很簡單,但基于實(shí)驗(yàn)的實(shí)踐驗(yàn)證卻變得更加復(fù)雜。除了必需和非必需基因外,還有許多準(zhǔn)必需基因,它們對生存力不是絕對關(guān)鍵,但對于強(qiáng)勁的生長卻是必需的。因此,在最小化基因組的過程中,需要在基因組大小和生長速率之間進(jìn)行權(quán)衡。JCVI-syn3.0近似為最小細(xì)胞基因組,為最小基因組與實(shí)驗(yàn)生物可行生長速率間的折中,它保留了幾乎所有與大分子合成和加工有關(guān)的基因。出乎意料的是,它還包含149個(gè)生物學(xué)功能未知的基因,表明存在著生命必需的未發(fā)現(xiàn)功能。
大自然使用64個(gè)密碼子編碼來自基因組的蛋白質(zhì)合成,并從多達(dá)6個(gè)同義詞中選擇1個(gè)有義密碼子編碼每個(gè)氨基酸。同義密碼子選擇具有多種重要作用,且許多同義替換是有害的。合成基因組不僅模仿模板DNA,而且允許遺傳密碼重編程。 Lajoie等[94]將80個(gè)大腸桿菌菌株中42個(gè)高度表達(dá)的必需基因中13個(gè)稀有密碼子的所有實(shí)例與編碼相同氨基酸的密碼子交換,顯示了在活細(xì)胞中以全基因組規(guī)模進(jìn)行編碼的可行性。
生命科學(xué)的技術(shù)進(jìn)步加快了我們處理基因組編碼信息的能力,包括接合組裝基因組改造(con-jugative assembly genome engineering, CAGE)技術(shù)等。通過定義的同義密碼子對目標(biāo)密碼子進(jìn)行全基因組取代,可以減少用于編碼規(guī)范氨基酸的密碼子數(shù)量,最后,通過重新編碼18 214個(gè)密碼子,創(chuàng)建了一個(gè)具有61個(gè)密碼子,基因組大小為4 Mb的大腸桿菌變體,其利用59個(gè)密碼子編碼20個(gè)氨基酸,并能夠刪除以前必不可少的轉(zhuǎn)移RNA[95]。使用減少數(shù)量的有義密碼子(59)編碼20個(gè)必需氨基酸產(chǎn)生的生物體表明,生命可以在減少數(shù)量的同義有義密碼子下運(yùn)轉(zhuǎn)。研究者開發(fā)的將設(shè)計(jì)的基因組分為多個(gè)片段、部分,通過Rexer、定向綴合等方法進(jìn)行融合,最后進(jìn)行無縫和強(qiáng)大的集成來實(shí)現(xiàn)設(shè)計(jì)的策略,為將來的基因組合成提供了一個(gè)藍(lán)圖。
作為合成生物學(xué)的基石,DNA組裝過程允許使用被定義的、標(biāo)準(zhǔn)化的、特征明確的組件構(gòu)建新穎的生物學(xué)系統(tǒng)。實(shí)際上是將多個(gè)DNA片段首尾相連的一種物理方式,從而創(chuàng)建目標(biāo)高階裝配,然后將其連接到載體。采用限制酶切消化和逐個(gè)元素克隆的傳統(tǒng)技術(shù)既耗時(shí)又低廉成本。因此,人們正在付出巨大的努力來開發(fā)更好的克隆策略和DNA組裝技術(shù),以使多基因系統(tǒng)能夠被更快,更有效地構(gòu)建。這樣,構(gòu)建具有復(fù)雜遺傳功能的菌株將變得更加容易。這些新技術(shù)還有助于提高重組菌株的活力、可轉(zhuǎn)化性或是穩(wěn)定性。
DNA組裝技術(shù)的加速使用使的得研究人員能夠進(jìn)行更復(fù)雜的合成項(xiàng)目,常見的組裝方法除了上面提到的Gibson 組裝,還有Golden Gate組裝(GG)。Golden Gate模塊化克隆系統(tǒng)利用II型限制酶建立了標(biāo)準(zhǔn)化且可互換的DNA部分文庫,隨后將其一步一步組裝到一個(gè)預(yù)先設(shè)計(jì)的4nt懸臂支架。目前,Golden Gate組裝已成為許多基因組編輯試劑盒的核心,許多實(shí)驗(yàn)室已經(jīng)具備在單個(gè)反應(yīng)中按定義的順序裝配許多不同零件的能力。GG的優(yōu)點(diǎn)之一是它允許組合組裝,可用于高效地生成庫。此外,使用GG的啟動子改組策略用于篩選表達(dá)的每個(gè)轉(zhuǎn)錄單位的最佳啟動子–基因?qū)?,然后使用最佳啟動子組合工程改造脂質(zhì)過量生產(chǎn)菌株。
解析突變和選擇對細(xì)菌GC含量的不同影響一直是個(gè)難題。1962年,研究者提出一個(gè)模型,將基因組中GC平均含量描述為由(G或C)→(A或T)和(A或T)→(G或C)堿基替換率差異所驅(qū)動的嚴(yán)格中性突變的過程函數(shù)。之后,人們將細(xì)菌類群之間基因組GC含量的變異歸因于譜系特異性突變模式和對各種全基因組特性的選擇[96]。最近發(fā)表的兩篇論文指出存在一種固有且普遍的(G或C)→(A或T)突變偏倚,并表明有利于高GC含量的選擇過程是決定細(xì)菌基因組堿基組成的主要因素[97,98]。
縮減的細(xì)菌基因組往往具有更高的AT含量,且有時(shí)AT含量會急劇增加。具有最高AT偏倚的細(xì)胞基因組來自共生菌‘’ (β-變形菌,基因組為209 kb,GC含量為13.5%[99])和‘.’ (γ-變形菌,GC含量為16.6%[100])。已提出幾種假設(shè)來解釋嚴(yán)格內(nèi)共生菌的AT偏倚,包括選擇或群體遺傳結(jié)合突變模式變化[101~103]。微小基因組傾向于刪除許多參與DNA修復(fù)的基因,這可能導(dǎo)致更多的A或T突變,因?yàn)槊撗鹾颂呛怂釗p傷,如胞嘧啶脫氨和鳥嘌呤氧化,往往會導(dǎo)致(G或C)→(A或T)[104]。穆勒棘輪效應(yīng)(Muller’s ratchet)和純化選擇壓力減輕將產(chǎn)生更多輕微有害突變,此類突變偏向A或T突變,并在種群中得到固定。這幾種因素的共同作用使基因組GC平均含量移向AT含量較高的新平衡點(diǎn)。
值得注意的是,兩個(gè)最小的細(xì)菌基因組,.[105](基因組GC含量為58.8%,四重簡并密碼子第三位的GC含量為66.6%)和.[105](α-變形菌,基因組大小為144 kb,基因組GC含量為58.4%,四重簡并密碼子第三位的GC含量為62.5%),打破了極端縮減基因組和低GC含量之間原本普遍的聯(lián)系。在.中,縮減基因組表現(xiàn)為偏向GC的突變壓力,因?yàn)樵诘鞍踪|(zhì)序列水平上,四重簡并密碼子第三位幾乎沒有選擇壓力[106]。由此提出一種假設(shè),即在基因組縮減的過程中,.以某種方式維持了自由生活α-變形菌中的高GC含量突變偏倚。通過后續(xù)研究.和.的突變方向,可以確定它們的GC突變偏倚是否具有普遍性,或它們是否像大多數(shù)(或所有)其他細(xì)菌一樣,存在AT突變偏倚[97,98]。因此,其獨(dú)特基因組組成的一個(gè)最明顯的解釋是全基因組范圍內(nèi)偏向GC的選擇壓力。
在細(xì)胞和細(xì)胞器基因組中,多種遺傳密碼獨(dú)立于“通用”密碼[107],UGA從終止密碼子重新分配到色氨酸密碼子是最常見的密碼變化之一。在細(xì)菌中,這種密碼子改變發(fā)現(xiàn)于柔膜菌綱的一個(gè)譜系中[108],這也是直到最近唯一報(bào)道的細(xì)菌編碼重組事件。對來自昆蟲共生細(xì)菌的微小基因組進(jìn)行測序,發(fā)現(xiàn)了這種終止子–色氨酸重編碼的兩個(gè)新案例:.[107]和.[99]。這是柔膜菌綱譜系以外的細(xì)菌中唯一發(fā)現(xiàn)的密碼子重新分配的兩個(gè)案例,而.是唯一已知的在高GC含量的基因組中發(fā)生UGA密碼子重新分配的案例。這一發(fā)現(xiàn),以及基于幾種線粒體基因組對密碼子重新分配機(jī)制的分析[109],似乎與廣泛引用的觀點(diǎn)不符,即低GC含量是密碼子重新分配的先決條件(“密碼子捕獲”假說)[110~112]。McCutcheon等[106]設(shè)想了一種基于“模糊翻譯”[109]的機(jī)制,其中tRNATrp突變允許色氨酸(UGG)和終止(UGA)密碼子的混雜解碼,從而允許通過持續(xù)的基因組縮減移除識別UGA密碼子的肽鏈釋放因子2 (RF-2;由編碼)。在此假設(shè)中,UGA密碼子重新分配是對關(guān)鍵基因缺失的一種遺傳共適應(yīng),而不是為了使基因組(或翻譯)更加精簡的適應(yīng)性事件[113],也不是通過GC含量偏倚導(dǎo)致的密碼子丟失和重新分配的完全中性事件。
大部分縮減基因組菌株的生長速度與其原始菌株相當(dāng)。其中一些菌株的生長速率和最終生物量甚至高于其親本菌株。此外,縮減基因組還具有諸如更高的轉(zhuǎn)化效率[79]和生物化學(xué)法生產(chǎn)[85]等有利特性。少數(shù)情況下,盡管與生長、細(xì)胞周期和形態(tài)相關(guān)的基因未發(fā)生改變,但縮減基因組表現(xiàn)出意想不到的表型,如生長遲緩和異常細(xì)胞形態(tài)。最近一項(xiàng)研究提出了一種實(shí)驗(yàn)室適應(yīng)進(jìn)化(ALE)技術(shù),以改善縮減基因組大腸桿菌的生長表型[80]。對進(jìn)化菌株的多組學(xué)分析表明,不平衡代謝通過ALE重組代謝擾動,誘導(dǎo)生長延遲和轉(zhuǎn)錄組及翻譯組重構(gòu)。上述研究說明我們對基因功能、代謝和基因組的認(rèn)識還不全面,亟需對細(xì)菌基因組進(jìn)行更全面的研究以填補(bǔ)我們知識空白,解答基因組縮減生物體所呈現(xiàn)的表型特征。
回顧全文,首先介紹了基于各種方法闡明必需基因集的研究,并依此設(shè)計(jì)最小(或縮減)基因組。通過比較多個(gè)基因組對必需基因進(jìn)行計(jì)算研究,表明只有不到300個(gè)基因是細(xì)菌生存復(fù)制必需的。然而,這種比較低估了必需基因的數(shù)量,因?yàn)榛虻墓δ芸梢员黄渌蛉〈?。利用轉(zhuǎn)座子誘變、敲除、asRNA和CRISPRi技術(shù)進(jìn)行實(shí)驗(yàn)評估,可揭示必需基因的直接和精確信息。但是,由于上述實(shí)驗(yàn)方法使基因破壞或失活,所以無法研究基因失活組合(如合成基因致死),需要開發(fā)更精細(xì)的方法以闡明基因之間相互關(guān)聯(lián)的上位相互作用。
然后,介紹了以前構(gòu)建的縮減基因組的特點(diǎn)及其構(gòu)建方法。科學(xué)家們試圖通過縮減已有基因組,使之成為最小基因組。現(xiàn)有的研究結(jié)果證明,縮減基因組是一把“雙刃劍”,一方面,基因組縮減菌株可保留原始菌株優(yōu)勢特性,甚至還具有諸如更高的轉(zhuǎn)化效率和生物化學(xué)法生產(chǎn)等有利特性;另一方面,仍會出現(xiàn)意想不到的表型,如生長遲緩和異常細(xì)胞形態(tài)等。這說明我們對基因組、基因功能和代謝的認(rèn)識還不全面,還需要對細(xì)菌基因組進(jìn)行更全面的研究以填補(bǔ)知識空白。
現(xiàn)今,高速發(fā)展的生物技術(shù)使設(shè)計(jì)基因網(wǎng)絡(luò),生物合成途徑乃至整個(gè)基因組的構(gòu)建成為可能,將遺傳學(xué)和基因組學(xué)領(lǐng)域從描述性應(yīng)用轉(zhuǎn)移到了合成應(yīng)用。在合成小型病毒基因組之后,DNA組裝和重寫技術(shù)的進(jìn)步使細(xì)菌基因組(例如生殖支原體)的層次化合成成為可能[114],并且通過將密碼子的數(shù)量從64個(gè)減少到57個(gè)來重新編碼大腸桿菌基因組。目前,合成基因組學(xué)已經(jīng)發(fā)展到合成整個(gè)真核基因組的地步。合成酵母基因組計(jì)劃(Sc2.0)正在進(jìn)行中,旨在重寫所有16個(gè)釀酒酵母染色體;到2018年,已經(jīng)設(shè)計(jì)并合成了6.5條染色體。使用自下而上的裝配并應(yīng)用全基因組的改變將增進(jìn)對基因組結(jié)構(gòu)和功能的理解。這種方法不僅將為真核染色體的系統(tǒng)研究提供平臺,還將產(chǎn)生可能適用于醫(yī)學(xué)和工業(yè)應(yīng)用的各種“簡化”菌株。Sc2.0的目的是設(shè)計(jì)和完全化學(xué)合成16條染色體,這些染色體包含來自啤酒酵母的1250萬個(gè)堿基和一個(gè)帶有所有tRNA基因的“新染色體”(http://syntheticyeast.org/)[115]。該項(xiàng)目不僅將為真核染色體的系統(tǒng)研究提供一個(gè)平臺,還將通過其“從構(gòu)建到理解”的過程擴(kuò)展生物學(xué)知識的范圍。
從小型病毒基因組的合成到酵母染色體Sc2.0,從罕見的密碼子替代到全基因組重新編碼,合成基因組學(xué)的可行性和能力已得到一次又一次的證明。Sc2.0著重介紹了用于生產(chǎn)非天然藥物和工業(yè)化合物(如青蒿素)的酵母“底盤”的開發(fā)?;诤铣扇旧w,可以將多種異源途徑直接整合到酵母基因組中。合成基因組學(xué)還使改組基因組以快速生成新的基因組并篩選所需的特性成為可能。
最后,合成最小基因組是合成基因組學(xué)領(lǐng)域的一個(gè)里程碑,高通量基因合成技術(shù)正在持續(xù)發(fā)展過程中,憑借其已被證實(shí)的優(yōu)勢,使得最小基因組生物成為科學(xué)、工業(yè)和許多其他應(yīng)用的理想生物平臺,相信隨著系統(tǒng)和合成生物學(xué)前沿技術(shù)的不斷發(fā)展,終將解決目前存在的許多障礙和挑戰(zhàn)。
[1] Bullmore E, Sporns O. The economy of brain network organization., 2012, 13(5): 336–349.
[2] Felleman DJ, Van Essen DC. Distributed hierarchical processing in the primate cerebral cortex., 1991, 1(1): 1–47.
[3] Cox DD, Dean T. Neural networks and neuroscience- inspired computer vision., 2014, 24(18): R921–R929.
[4] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks., 2017, 60(6): 84–90.
[5] Maass W. Networks of spiking neurons: the third generation of neural network models., 1997, 10(9): 1659–1671.
[6] Mcculloch WS, Pitts W. A logical calculus of the ideas immanent in nervous activity., 1990, 52(1–2): 99–115.
[7] Nair V, Hinton GE. Rectified linear units improve restricted boltzmann machines vinod nair., 2010, 807–814.
[8] Rumelhart DE, Hinton GE, Williams RJ. Learning representations by back-propagating errors., 1986, 323(6088): 533–536.
[9] Izhikevich EM. Simple model of spiking neurons., 2003, 14(6): 1569–1572.
[10] McCutcheon JP, Moran NA. Extreme genome reduction in symbiotic bacteria., 2011, 10(1): 13–26.
[11] Moran NA. Accelerated evolution and Muller's rachet in endosymbiotic bacteria., 1996, 93(7): 2873–2878.
[12] Mira A, Ochman H, Moran NA. Deletional bias and the evolution of bacterial genomes., 2001, 17(10): 589–596.
[13] Nilsson AI, Koskiniemi S, Eriksson S, Kugelberg E, Hinton JCD, Andersson DI. Bacterial genome size reduction by experimental evolution., 2005, 102(34): 12112–12116.
[14] Hebb DO. The Organization of behavior: a neuropsy-chological theory. John Wiley, Chapman & Hall, 2013.
[15] Mccutcheon JP, Moran NA. Extreme genome reduction in symbiotic bacteria., 2011, 10(1): 13–26.
[16] Moran NA, Mira A. The process of genome shrinkage in the obligate symbiont Buchnera aphidicola., 2001, 2(12): h51–h54.
[17] Bennett GM, Moran NA. Small, smaller, smallest: the origins and evolution of ancient dual symbioses in a phloem-feeding insect., 2013, 5(9): 1675–1688.
[18] Mao C, Labean TH, Relf JH, Seeman NC. Logical computation using algorithmic self-assembly of DNA triple-crossover molecules., 2000, 407(6803): 493–496.
[19] Seelig G, Soloveichik D, Zhang DY, Winfree E. Enzyme-free nucleic acid logic circuits., 2006, 314(5805): 1585–1588.
[20] Zhang BT, Jang H. Molecular programming: evolving genetic programs in a test tube., 2005, 1761–1768.
[21] Zhang BT, Kim JK. DNA hypernetworks for information storage and retrieval[C]. 12th International Meeting on DNA Computing, 2006, 298–307.
[22] Benenson Y, Paz-Elizur T, Adar R, Keinan E, Livneh Z, Shapiro E. Programmable and autonomous computing machine made of biomolecules.,2001, 414(6862): 430–434.
[23] Yurke B, Turberfield AJ, Mills Jr AP, Simmel FC, Neumann JL. A DNA-fuelled molecular machine made of DNA., 2000, 406(6796): 605–608.
[24] Stojanovic MN, Stefanovic D. A deoxyribozyme-based molecular automaton., 2003, 21(9): 1069–1074.
[25] Pei RJ, Matamoros E, Liu MH, Stefanovic D, Stojanovic MN. Training a molecular automaton to play a game., 2010, 5(11): 773–777.
[26] Katz E, Privman V. Enzyme-based logic systems for information processing., 2010, 39(5): 1835–1857.
[27] Abbott LF, Nelson SB. Synaptic plasticity: taming the beast., 2000, 3 Suppl.: 1178–1183.
[28] Lichtsteiner P, Posch C, Delbruck T. A 128× 128 120 dB 15 μs latency asynchronous temporal contrast vision sensor., 2008, 43(2): 566–576.
[29] Liu SC, Delbruck T. Neuromorphic sensory systems., 2010, 20(3): 288–295.
[30] Maher MAC, Deweerth SP, Mahowald MA, Mead CA. Implementing neural architectures using analog vlsi circuits., 1989, 36: 643–652.
[31] Mead C. Neuromorphic electronic systems., 1990, 78(10): 1629–1636.
[32] Mead CA. Neural hardware for vision., 1987, 50(5).
[33] Huang YY, He L. DNA computing research progress and application. 2011 6th International Conference on Computer Science & Education (ICCSE), 2011, 232– 235.
[34] Seeman NC. DNA in a material world., 2003, 421(6921): 427–431.
[35] Steele G, Stojkovic V. Agent-oriented approach to DNA computing. 2004 IEEE Computational Systems Bioin-formatics Conference, 2004.
[36] Greengard S. Cracking the code on DNA storage., 2017, 60(7): 16–18.
[37] Heckel R, Shomorony I, Ramchandran K, Tse DNC. Fundamental limits of DNA storage systems. 2017.
[38] Ghatak S, King ZA, Sastry A, Palsson BO. The y-ome defines the 35% of Escherichia coli genes that lack experimental evidence of function., 2019, 47(5): 2446–2454.
[39] Riley M, Abe T, Arnaud MB, Berlyn MKB, Blattner FR, Chaudhuri RR, Glasner JD, Horiuchi T, Keseler IM, Kosuge T, Mori H, Perna NT, Plunkett G, Rudd KE, Serres MH, Thomas GH, Thomson NR, Wishart D, Wanner BL. Escherichia coli K-12: a cooperatively developed annotation snapshot--2005., 2006, 34(1): 1–9.
[40] Baba T, Ara T, Hasegawa M, Takai Y, Okumura Y, Baba M, Datsenko KA, Tomita M, Wanner BL, Mori H. Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection., 2006, 2: 2006.0008.
[41] Moya A, Gil R, Latorre A, Peretó J, Garcillán-Barcia MP, de la Cruz F. Toward minimal bacterial cells: evolution vs. design., 2009, 33(1): 225–235.
[42] Williams KP, Sobral BW, Dickerman AW. A robust species tree for the Alphaproteobacteria., 2007, 189(13): 4578–4586.
[43] Gray MW. Mitochondrial evolution., 2012, 4(9): a11403.
[44] Boussau B, Karlberg EO, Frank AC, Legault BA, Andersson SGE. Computational inference of scenarios for α-proteobacterial genome evolution., 2004, 101(26): 9722–9727.
[45] Mizoguchi H, Sawano Y, Kato JI, Mori H. Super-positioning of deletions promotes growth ofwith a reduced genome., 2008, 15(5): 277–284.
[46] Stewart GC. Taking shape: control of bacterial cell wall biosynthesis., 2005, 57(5): 1177–1181.
[47] Silverman DJ, Wisseman Jr CL, Waddell A.studies of Rickettsia-host cell interactions: ultrastructural study of Rickettsia prowazekii-infected chicken embryo fibroblasts., 1980, 29(2): 778–790.
[48] Tully JG, Taylor-Robinson D, Cole RM, Rose DL. A newly discovered mycoplasma in the human urogenital tract., 1981, 1(8233): 1288–1291.
[49] Schr?der D, Deppisch H, Obermayer M, Krohne G, Stackebrandt E, H?lldobler B, Goebel W, Gross R. Intracellular endosymbiotic bacteria of Camponotus species (carpenter ants): systematics, evolution and ultrastructural characterization., 1996, 21(3): 479–489.
[50] Aksoy S. Wigglesworthia gen. nov. and Wigglesworthia glossinidia sp. nov., Taxa consisting of the mycetocyte- associated, primary endosymbionts of tsetse flies., 1995, 45(4): 848–851.
[51] Moran NA, Dale C, Dunbar H, Smith WA, Ochman H. Intracellular symbionts of sharpshooters (insecta: hemiptera: cicadellinae) form a distinct clade with a small genome., 2003, 5(2): 116–126.
[52] Griffiths GW, Beck SD. Effects of antibiotics on intracellular symbiotes in the pea aphid, Acyrthosiphon pisum., 1974, 148(3): 287–300.
[53] von Dohlen CD, Kohler S, Alsop ST, McManus WR. Mealybug beta-proteobacterial endosymbionts contain gamma-proteobacterial symbionts., 2001, 412(6845): 433–436.
[54] Kopylova NV, Mikha?lova ZM, Fokina TV, Rybakova EP. Dynamics of the humoral immunity indices in children with phenylketonuria against a background of diet therapy and after its discontinuance., 1979, (6): 57–59.
[55] Oike M, Kitamura K, Kuriyama H. Histamine H3-receptor activation augments voltage-dependent Ca2+current via GTP hydrolysis in rabbit saphenous artery., 1992, 448: 133–152.
[56] Zarrin F, Bornhop DJ, Dovichi NJ. Laser Doppler velocimetry for particle size determination by light scatter within the sheath flow cuvette., 1987, 59(6): 854–860.
[57] Nakabachi A, Yamashita A, Toh H, Ishikawa H, Dunbar H E, Moran NA, Hattori M. The 160-Kilobase genome of the bacterial endosymbiont carsonella., 2006, 314(5797): 267.
[58] Ashby J. SCE induction by CCNU and pregnancy., 1989, 222(4): 299.
[59] Mushegian AR, Koonin EV. A minimal gene set for cellular life derived by comparison of complete bacterial genomes., 1996, 93(19): 10268–10273.
[60] Brown JR, Douady CJ, Italia MJ, Marshall WE, Stanhope MJ. Universal trees based on large combined protein sequence data sets., 2001, 28(3): 281–285.
[61] Harris JK, Kelley ST, Spiegelman GB, Pace NR. The genetic core of the universal ancestor., 2003, 13(3): 407–412.
[62] Koonin EV. Comparative genomics, minimal gene-sets and the last universal common ancestor., 2003, 1(2): 127–136.
[63] Charlebois RL, Doolittle WF. Computing prokaryotic gene ubiquity: rescuing the core from extinction., 2004, 14(12): 2469–2477.
[64] Hutchison CA, Peterson SN, Gill SR, Cline RT, White O, Fraser CM, Smith HO, Venter JC. Global transposon mutagenesis and a minimal Mycoplasma genome., 1999, 286(5447): 2165–2169.
[65] Itaya M. An estimation of minimal genome size required for life., 1995, 362(3): 257–260.
[66] Kobayashi K, Ehrlich SD, Albertini A, Amati G, Andersen KK, Arnaud M, Asai K, Ashikaga S, Aymerich S, Bessieres P, Boland F, Brignell SC, Bron S, Bunai K, Chapuis J, Christiansen LC, Danchin A, Débarbouille M, Dervyn E, Deuerling E, Devine K, Devine SK, Dreesen O, Errington J, Fillinger S, Foster SJ, Fujita Y, Galizzi A, Gardan R, Eschevins C, Fukushima T, Haga K, Harwood CR, Hecker M, Hosoya D, Hullo MF, Kakeshita H, Karamata D, Kasahara Y, Kawamura F, Koga K, Koski P, Kuwana R, Imamura D, Ishimaru M, Ishikawa S, Ishio I, Le Coq D, Masson A, Mau?l C, Meima R, Mellado RP, Moir A, Moriya S, Nagakawa E, Nanamiya H, Nakai S, Nygaard P, Ogura M, Ohanan T, O'Reilly M, O'Rourke M, Pragai Z, Pooley HM, Rapoport G, Rawlins JP, Rivas LA, Rivolta C, Sadaie A, Sadaie Y, Sarvas M, Sato T, Saxild HH, Scanlan E, Schumann W, Seegers JFML, Sekiguchi J, Sekowska A, Séror SJ, Simon M, Stragier P, Studer R, Takamatsu H, Tanaka T, Takeuchi M, Thomaides HB, Vagner V, van Dijl JM, Watabe K, Wipat A, Yamamoto H, Yamamoto M, Yamamoto Y, Yamane K, Yata K, Yoshida K, Yoshikawa H, Zuber U, Ogasawara N. Essential Bacillus subtilis genes., 2003, 100(8): 4678–4683.
[67] Baba T, Ara T, Hasegawa M, Takai Y, Okumura Y, Baba M, Datsenko KA, Tomita M, Wanner BL, Mori H. Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection., 2006, 2: 2006.0008.
[68] Glass JI, Assad-Garcia N, Alperovich N, Yooseph S, Lewis MR, Maruf M, Hutchison CA, Smith HO, Venter JC. Essential genes of a minimal bacterium., 2006, 103(2): 425–430.
[69] Hutchison CA, Peterson SN, Gill SR, Cline RT, White O, Fraser CM, Smith HO, Venter JC. Global transposon mutagenesis and a minimal Mycoplasma genome., 1999, 286(5447): 2165–2169.
[70] Ji Y, Zhang B, Van SF, Warren HP, Woodnutt G, Burnham MK, Rosenberg M. Identification of critical staphylococcal genes using conditional phenotypes generated by antisense RNA., 2001, 293(5538): 2266–2269.
[71] Gerdes SY, Scholle MD, Campbell JW, Balázsi G, Ravasz E, Daugherty MD, Somera AL, Kyrpides NC, Anderson I, Gelfand MS, Bhattacharya A, Kapatral V, D'Souza M, Baev MV, Grechkin Y, Mseeh F, Fonstein MY, Overbeek R, Barabási AL, Oltvai ZN, Osterman AL. Experimental determination and system level analysis of essential genes inMG1655., 2003, 185(19): 5673–5684.
[72] Qi LS, Larson MH, Gilbert LA, Doudna JA, Weissman JS, Arkin AP, Lim WA. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression., 2013, 152(5): 1173–1183.
[73] Rousset F, Cui L, Siouve E, Becavin C, Depardieu F, Bikard D, Blokesch M. Genome-wide CRISPR-dCas9 screens in E. coli identify essential genes and phage host factors., 2018, 14(11): e1007749.
[74] Shalem O, Sanjana NE, Hartenian E, Shi X, Scott DA, Mikkelson T, Heckl D, Ebert BL, Root DE, Doench JG, Zhang F. Genome-scale CRISPR-Cas9 knockout screening in human cells., 2014, 343(6166): 84–87.
[75] Wang T, Wei JJ, Sabatini DM, Lander ES. Genetic screens in human cells using the CRISPR-Cas9 system., 2014, 343(6166): 80–84.
[76] Yu BJ, Kim C. Minimization of the Escherichia coli genome using the Tn5-targeted Cre/loxP excision system., 2008, 416: 261–277.
[77] Nijman SMB. Synthetic lethality: General principles, utility and detection using genetic screens in human cells., 2011, 585(1): 1–6.
[78] Kolisnychenko V, Plunkett G, Herring CD, Fehér T, Pósfai J, Blattner FR, Pósfai G. Engineering a reducedgenome., 2015, 12(4): 640–647.
[79] Pósfai G, Plunkett G, Fehér T, Frisch D, Keil GM, Umenhoffer K, Kolisnychenko V, Stahl B, Sharma SS, de Arruda M, Burland V, Harcum SW, Blattner FR. Emergent properties of reduced-genome Escherichia., 2006, 312(5776): 1044–1046.
[80] Lee JH, Sung BH, Kim MS, Blattner FR, Yoon BH, Kim JH, Kim SC. Metabolic engineering of a reduced- genome strain offor L-threonine production., 2009, 8: 2.
[81] Park MK, Lee SH, Yang KS, Jung SC, Lee JH, Kim SC. Enhancing recombinant protein production with an Escherichia coli host strain lacking insertion sequences., 2014, 98(15): 6701–6713.
[82] Hashimoto M, Ichimura T, Mizoguchi H, Tanaka K, Fujimitsu K, Keyamura K, Ote T, Yamakawa T, Yamazaki Y, Mori H, Katayama T, Kato JI. Cell size and nucleoid organization of engineeredcells with a reduced genome., 2005, 55(1): 137–149.
[83] Westers H, Dorenbos R, van Dijl JM, Kabel J, Flanagan T, Devine KM, Jude F, Seror SJ, Beekman AC, Darmon E, Eschevins C, de Jong A, Bron S, Kuipers OP, Albertini AM, Antelmann H, Hecker M, Zamboni N, Sauer U, Bruand C, Ehrlich DS, Alonso JC, Salas M, Quax WJ. Genome engineering reveals large dispensable regions in bacillus subtilis., 2003, 20(12): 2076–2090.
[84] Biswas I, Gruss A, Ehrlich SD, Maguin E. High- efficiency gene inactivation and replacement system for gram-positive bacteria., 1993, 175(11): 3628–3635.
[85] Choe D, Lee JH, Yoo M, Hwang S, Sung BH, Cho S, Palsson B, Kim SC, Cho BK. Adaptive laboratory evolution of a genome-reduced., 2019, 10(1): 935.
[86] Reuβ DR, Altenbuchner J, M?der U, Rath H, Ischebeck T, Sappa PK, Thürmer A, Guérin C, Nicolas P, Steil L, Zhu BY, Feussner I, Klumpp S, Daniel R, Commichau FM, V?lker U, Stülke J. Large-scale reduction of the Bacillus subtilis genome: consequences for the transcriptional network, resource allocation, and metabolism., 2017, 27(2): 289–299.
[87] Ara K, Ozaki K, Nakamura K, Yamane K, Sekiguchi J, Ogasawara N. Bacillus minimum genome factory: effective utilization of microbial genome information., 2007, 46(Pt 3): 169–178.
[88] Morimoto T, Kadoya R, Endo K, Tohata M, Sawada K, Liu SG, Ozawa T, Kodama T, Kakeshita H, Kageyama Y, Manabe K, Kanaya S, Ara K, Ozaki K, Ogasawara N. Enhanced recombinant protein productivity by genome reduction in bacillus subtilis., 2008, 15(2): 73–81.
[89] Komatsu M, Uchiyama T, Omura S, Cane DE, Ikeda H. Genome-minimized Streptomyces host for the hetero-logous expression of secondary metabolism., 2010, 107(6): 2646–2651.
[90] Giga-Hama Y, Tohda H, Takegawa K, Kumagai H. Schizosaccharomyces pombe minimum genome factory., 2007, 46(Pt 3): 147–155.
[91] Gibson DG, Glass JI, Lartigue C, Noskov VN, Chuang RY, Algire MA, Benders GA, Montague MG, Ma L, Moodie MM, Merryman C, Vashee S, Krishnakumar R, Assad-Garcia N, Andrews-Pfannkoch C, Denisova EA, Young L, Qi ZQ, Segall-Shapiro TH, Calvey CH, Parmar PP, Hutchison CA, Smith HO, Venter JC. Creation of a bacterial cell controlled by a chemically synthesized genome., 2010, 329(5987): 52–56.
[92] Hutchison CA, Chuang RY, Noskov VN, Assad-Garcia N, Deerinck TJ, Ellisman MH, Gill J, Kannan K, Karas BJ, Ma L, Pelletier JF, Qi ZQ, Richter RA, Strychalski EA, Sun LJ, Suzuki Y, Tsvetanova B, Wise KS, Smith HO, Glass JI, Merryman C, Gibson DG, Venter JC. Design and synthesis of a minimal bacterial genome., 2016, 351(6280): aad6253.
[93] Sleator RD. The story of Mycoplasma mycoides JCVI-syn1.0: the forty million dollars microbe., 2010, 1(4): 229–230.
[94] Lajoie MJ, Kosuri S, Mosberg JA, Gregg CJ, Zhang D, Church GM. Probing the limits of genetic recoding in essential genes., 2013, 342(6156): 361–363.
[95] Fredens J, Wang KH, de la Torre D, Funke LFH, Robertson WE, Christova Y, Chia T, Schmied WH, Dunkelmann DL, Beránek V, Uttamapinant C, Llamazares AG, Elliott TS, Chin JW. Total synthesis ofwith a recoded genome., 2019, 569(7757):514–518.
[96] Benosman R, Ieng SH, Clercq C, Bartolozzi C, Srinivasan M. Asynchronous frameless event-based optical flow., 2012, 27: 32–37.
[97] Wongsuphasawat K, Gotz D. Exploring flow, factors, and outcomes of temporal event sequences with the outflow visualization., 2012, 18(12): 2659–2668.
[98] Rogister P, Benosman R, Ieng SH, Lichtsteiner P, Delbruck T. Asynchronous event-based binocular stereo matching., 2012, 23(2): 347–353.
[99] Osswald M, Ieng SH, Benosman R, Indiveri G. A spiking neural network model of 3D perception for event-based neuromorphic stereo vision systems., 2017, 7: 40703.
[100] Hinton GE, Srivastava N, Krizhevsky A, Sutskever I, Salakhutdinov RR. Improving neural networks by preventing co-adaptation of feature detectors., 2012, 3(4): 212–223.
[101] Deng J, Dong W, Socher R, Li LJ, Li FF. ImageNet: a large-scale hierarchical image database[C]. 2009 IEEE Conference on Computer Vision and Pattern Recognition, 2009, 248–255
[102] Van Rullen R, Thorpe SJ. Rate coding versus temporal order coding: what the retinal ganglion cells tell the visual cortex., 2001, 13(6): 1255–1283.
[103] Mao C, Labean TH, Relf JH, Seeman NC. Logical computation using algorithmic self-assembly of DNA triple-crossover molecules., 2000, 407(6803): 493–496.
[104] Hu YH, Liu HJ, Pfeiffer M, Delbruck T. DVS benchmark datasets for object tracking, action recognition, and object recognition., 2016, 10: 405.
[105] Qian JF, Ferguson TM, Shinde DN, Ramírez-Borrero AJ, Hintze A, Adami C, Niemz A. Sequence dependence of isothermal DNA amplification via EXPAR., 2012, 40(11): e87.
[106] Geiger A, Lenz P, Stiller C, Urtasun R. Vision meets robotics: The KITTI dataset., 2013, 32(11): 1231–1237.
[107] Barranco F, Fermuller C, Aloimonos Y, Delbruck T. A dataset for visual navigation with neuromorphic methods., 2016, 10: 49.
[108] Adleman LM. Molecular computation of solutions to combinatorial problems., 1994, 266(5187): 1021–1024.
[109] Ogihara M, Ray A. DNA-based parallel computation by “counting”., 1997, 255–264.
[110] Deaton R, Murphy RC, Rose JA, Garzon M, Franceschetti DR, Stevens SE. A DNA based implementation of an evolutionary search for good encodings for DNA computation. 1997.
[111] Parker J. Computing with DNA - although DNA clearly outclasses any silicon-based computer when it comes to information storage and processing speed, a DNA-based PC is still a long way off., 2003, 4(1): 7–10.
[112] Arkin A. Setting the standard in synthetic biology., 2008, 26(7): 771–774.
[113] Seeman N, Wang H, Liu B, Qi J, Li X, Yang X, Liu F, Sun WQ, Shen ZY, Wang Y, Sha RJ, Mao C, Zhang S, Fu TJ, Du SM, Mueller JE, Zhang Y, Chen J. The perils of polynucleotides: The experimental gap between the design and assembly of unusual DNA structures. 1998.
[114] LIANG QF, WANG Q, QI QS. Synthetic biology and rearrangements of microbial genetic material., 2011, 33(10): 1102–1112.梁泉峰,王倩,祁慶生. 合成生物學(xué)與微生物遺傳物質(zhì)的重構(gòu). 遺傳, 2011, 33(10): 1102–1112.
[115] Xu HM, Xie ZX, Liu D, Wu Y, Li BZ, Yuan YJ. Design and synthesis of yeast chromosomes., 2017, 39(10): 865–876.徐赫鳴, 謝澤雄, 劉奪, 吳毅, 李炳志, 元英進(jìn). 釀酒酵母染色體設(shè)計(jì)與合成研究進(jìn)展. 遺傳, 2017, 39(10): 865–876.
Research progress of bacterial minimal genome
Jinyu Li1,2,3, Shan Yang2,3, Yujun Cui2,3, Tao Wang1, Yue Teng2,3
,,,,,,,,
Bacteria with the smallest genome contain genes necessary for self-sustaining replication only, giving the organisms advantages to serve as a potential industrial production platform. Many strains with reduced genomes have been constructed, owing to the development of high-throughput DNA sequencing and synthesis technology. This review first describes the concept of minimal genomes, summarizes the relevant research progress of bacterial essential genes, then systematically lists the work related to artificial reduction and synthesis of bacterial genomes, finally discusses the technical obstacles and limitations encountered in the process of designing and constructing reduced genomes, hoping to provide a theoretical basis for the experiment and application of artificially synthesized genomes.
bacteria; minimal genome; essential genes; synthetic biology; artificial design
2020-11-23;
2021-01-04
國家科技重大專項(xiàng)(編號:2018ZX10101003-002-011)和“艾滋病和病毒性肝炎等重大傳染病防治”科技重大專項(xiàng)(編號:2018ZX10712- 001-003)資助[Supported by the National Science and Technology Major Project (No. 2018ZX10101003-002-011) , and the Major Infectious Diseases Such as AIDS and Viral Hepatitis Prevention and Control Technology Major Projects (No. 2018ZX10712001-003)]
李金玉,在讀碩士研究生,專業(yè)方向:生物學(xué)。E-mail: jyli1996@163.com
滕越,博士,副研究員,研究方向:合成生物學(xué)。E-mail: yueteng@sklpb.org
10.16288/j.yczz.20-301
2021/2/1 15:12:50
URI: https://kns.cnki.net/kcms/detail/11.1913.R.20210201.1343.010.html
(責(zé)任編委: 謝建平)