葉超,徐楠,陳修來,劉立明
應(yīng)用代謝網(wǎng)絡(luò)模型解析工業(yè)微生物胞內(nèi)代謝
葉超1,2,徐楠3,陳修來1,2,劉立明1,2
1 江南大學(xué) 食品科學(xué)與技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫 214122 2 江南大學(xué) 工業(yè)生物技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫 214122 3 揚(yáng)州大學(xué) 生物科學(xué)與技術(shù)學(xué)院,江蘇 揚(yáng)州 225009
為了快速、高效地理解工業(yè)微生物胞內(nèi)代謝特征,尋找潛在的代謝工程改造靶點(diǎn),基因組規(guī)模代謝網(wǎng)絡(luò)模型(GSMM) 作為一種系統(tǒng)生物學(xué)工具越來越受到人們的關(guān)注。文中在回顧GSMM 20年發(fā)展歷程的基礎(chǔ)上,分析了當(dāng)前GSMM的研究現(xiàn)狀,總結(jié)了GSMM的構(gòu)建及分析方法,從預(yù)測細(xì)胞表型和指導(dǎo)代謝工程兩個(gè)方面闡述了GSMM在解析工業(yè)微生物胞內(nèi)代謝中的應(yīng)用,并展望了GSMM未來的發(fā)展趨勢。
微生物胞內(nèi)代謝,生產(chǎn)性能,基因組規(guī)模代謝網(wǎng)絡(luò)模型,系統(tǒng)生物學(xué)
基因組規(guī)模代謝網(wǎng)絡(luò)模型 (Genome-scale metabolic model, GSMM) 作為一種數(shù)學(xué)模型,其本質(zhì)是用于表征基因-蛋白-反應(yīng) (GPR) 三者之間的關(guān)系。GSMM包括一系列化學(xué)計(jì)量平衡的生化反應(yīng),通過形成一個(gè)矩陣S,將其轉(zhuǎn)化成一個(gè)數(shù)學(xué)模型。矩陣S的每行代表代謝物,每列代表反應(yīng)。GSMM已經(jīng)廣泛應(yīng)用在分析網(wǎng)絡(luò)特性、預(yù)測細(xì)胞表型、指導(dǎo)菌株設(shè)計(jì)、驅(qū)動(dòng)模型發(fā)現(xiàn)、研究進(jìn)化過程和分析相互作用等6個(gè)方面(圖1)[1-2]。
工業(yè)微生物胞內(nèi)代謝活動(dòng)具有較高的復(fù)雜性,單一的研究手段難以系統(tǒng)地理解其調(diào)控機(jī)制,且無法高效地獲取所需表型。目前利用GSMM分析工業(yè)微生物胞內(nèi)的代謝調(diào)控,尤其是篩選代謝工程改造靶點(diǎn),提高目標(biāo)產(chǎn)物產(chǎn)量方面已經(jīng)取得了一定的進(jìn)展。例如,Nocon等利用MOMA算法鑒定出乙醇脫氫酶是畢赤酵母中過量生成胞質(zhì)人超氧化物歧化酶(hSOD) 基因敲除靶點(diǎn),實(shí)驗(yàn)證實(shí)的敲除使得hSOD產(chǎn)量增加了20%[3]。Song等利用流量響應(yīng)分析方法,篩選出擴(kuò)增磷酸烯醇丙酮酸羧化酶() 使富馬酸產(chǎn)量提高了2.8倍[4]。這些基于GSMM預(yù)測和實(shí)驗(yàn)結(jié)合的方法,在乙醇[5-6]、丁醇[7-8]、琥珀酸[9-10]、乳酸[11]、番茄紅素[12]、氨基酸[13-14]、香蘭素[15]和1,4-丁二醇[16]等產(chǎn)品生產(chǎn)中展現(xiàn)了巨大的應(yīng)用前景。
本文綜述了目前GSMM的研究進(jìn)展,比較了目前常見的模型構(gòu)建及評價(jià)標(biāo)準(zhǔn),總結(jié)出流量平衡類和遺傳擾動(dòng)類模型分析方法的應(yīng)用范圍。進(jìn)一步結(jié)合這些模型分析工具,系統(tǒng)地闡述GSMM在工業(yè)微生物表型預(yù)測、代謝改造等胞內(nèi)代謝研究中的應(yīng)用。同時(shí)展望了GSMM的未來發(fā)展趨勢,以期能夠利用系統(tǒng)生物學(xué)工具,為“濕實(shí)驗(yàn)”提供理論指導(dǎo)。
自1999年完成流感嗜血桿菌GSMM的構(gòu)建以來,GSMM經(jīng)歷了20年的發(fā)展,截至2019年3月,已經(jīng)有超過153種微生物,348個(gè)GSMMs完成了構(gòu)建(圖2)[1-17]。其中一些模式菌株的GSMMs,如大腸桿菌K12和釀酒酵母S288c,經(jīng)過不斷的修正和完善,分別構(gòu)建了6個(gè)和12個(gè)GSMMs[17-18]。改進(jìn)后的GSMMs,不僅增加了模型規(guī)模(基因、反應(yīng)、代謝物),而且提高了模型預(yù)測結(jié)果的準(zhǔn)確性。如最新.模型ML1515預(yù)測基因敲除表型的準(zhǔn)確率為93.4%,相較JO1366準(zhǔn)確率89.8%提高了3.6%[19]。
圖1 GSMM在工業(yè)微生物中的應(yīng)用
圖2 已發(fā)表代謝網(wǎng)絡(luò)模型的統(tǒng)計(jì)
由于傳統(tǒng)的GSMM主要是通過對底物的利用作為約束條件進(jìn)行模擬分析,魯棒性分析碳源吸收速率與細(xì)胞生長之間的關(guān)系通常呈線性相關(guān)。表明隨著碳源吸收速率的增加,細(xì)胞比生長速率可以一直增加,最終遠(yuǎn)大于菌株的最大比生長速率。因此,為了提高模型預(yù)測結(jié)果的準(zhǔn)確性,需要在傳統(tǒng)GSMM的基礎(chǔ)上整合其他方法。目前的改進(jìn)方法主要有4個(gè)方面:1) 整合組學(xué)數(shù)據(jù)[20-22]:如通過整合轉(zhuǎn)錄組學(xué)數(shù)據(jù),得到基因表達(dá)模型(ME-model),預(yù)測結(jié)果的準(zhǔn)確性從91.2%提高至92.3%[20];2) 添加各種約束條件[23-26]:將動(dòng)力學(xué)參數(shù)整合至.核心GSMM中,模擬結(jié)果與實(shí)驗(yàn)數(shù)據(jù)的皮爾森相關(guān)系數(shù)達(dá)到了0.84[23];3) 整合多種生物模型:在GSMM基礎(chǔ)上整合基因表達(dá)數(shù)據(jù)、轉(zhuǎn)錄調(diào)控模型、信號轉(zhuǎn)導(dǎo)網(wǎng)絡(luò),得到.整合模型,皮爾森相關(guān)系數(shù)提高了2倍[27];4) 構(gòu)建微生物全細(xì)胞模型:利用生殖支原體全細(xì)胞模型不僅可以從單細(xì)胞水平描述一個(gè)細(xì)胞周期內(nèi)個(gè)體分子及其相互作用,而且實(shí)現(xiàn)了一系列可觀察到的細(xì)胞行為的準(zhǔn)確預(yù)測[28]。
1.2.1 互作網(wǎng)絡(luò)模型
自然界中的微生物相互作用關(guān)系主要存在互生、共生、競爭和寄生。通過構(gòu)建微生物群體互作模型,模擬不同物種之間的代謝物交換,已經(jīng)被用于鑒定微生物之間的相互作用關(guān)系。通過構(gòu)建維生素C混菌發(fā)酵模型WZ-KV-663-BM-1055,共培養(yǎng)條件下,生酮基古龍酸菌和巨大芽孢桿菌的最大比生長速率分別比單獨(dú)培養(yǎng)提高了1.5倍和6.6倍,表明兩菌之間存在共生關(guān)系,并且是通過代謝物交換實(shí)現(xiàn)的:.能為.提供6種氨基酸、3種核苷酸、6種維生素和輔因子、3種有機(jī)酸以及甘油等營養(yǎng)物質(zhì);而.通過分泌苯丙氨酸、富馬酸和甲酸促進(jìn).生長[29]。類似地,通過分別構(gòu)建木質(zhì)纖維素生產(chǎn)丁醇菌株丙酮丁醇梭菌和解纖維梭菌的GSMMs,模擬共培養(yǎng)條件下丁醇發(fā)酵過程,發(fā)現(xiàn).和.之間也是代謝物交換而實(shí)現(xiàn)共生(圖3)[30]。
1.2.2 泛基因組模型
泛基因組(Pan-genome) 是指某一物種全部基因的總稱,包括核心基因組(Core genome) 和附加基因組(Dispensable genome)。通過構(gòu)建泛基因組模型,對核心基因和附加基因進(jìn)行組合分析,比較同一物種不同菌株之間的表型差異,從而分析菌株特異性。目前已經(jīng)完成構(gòu)建的泛基因組模型主要有:包含了55株.的泛基因組模型[31]、64株金黃色葡萄球菌泛基因組模型[32]以及410株沙門氏菌屬[33]的泛基因組模型。由于涉及的菌株都是致病性菌株,主要是利用泛基因組模型預(yù)測不同菌株之間的代謝能力差異,從而鑒定致病性。例如,在泛基因組模型中,通過預(yù)測410株在530種環(huán)境中的生長能力,鑒定出這些存在顯著差異的代謝途徑包括碳代謝和細(xì)胞壁合成,并且代謝特異性與每個(gè)菌株的血清型和分離宿主相對應(yīng)[33]。
1.2.3 宏基因組模型
宏基因組 (Meta-genome) 是指特定環(huán)境中全部微生物的總DNA。物種豐富度(用來描述和量化微生物群落,反映特定區(qū)域物種的數(shù)量),是宏基因組數(shù)據(jù)的重要評價(jià)指標(biāo)。在單個(gè)微生物GSMM的基礎(chǔ)上,通過構(gòu)建宏基因組網(wǎng)絡(luò)模型,一方面可以結(jié)合模型分析菌群在不同環(huán)境中的代謝特征,另一方面可以預(yù)測不同微生物之間的相互作用關(guān)系。目前已經(jīng)構(gòu)建完成的宏基因組模型是包含773個(gè)腸道微生物的宏基因組模型[34]和包含1 562個(gè)人類相關(guān)微生物的宏基因組模型[35]??紤]到宏基因組數(shù)據(jù)的物種豐富度,需要批量構(gòu)建成百上千個(gè)GSMMs,因此在構(gòu)建宏基因組模型的過程中需要開發(fā)特定的方法,如AGORA[34]和MOMBO[35]。這些算法的特點(diǎn)在于實(shí)現(xiàn)模型批量構(gòu)建的過程中,建立了特定的模型質(zhì)量評價(jià)體系,從而滿足模擬分析。
根據(jù)Palsson實(shí)驗(yàn)室發(fā)表在上的GSMM構(gòu)建教程[36-37],GSMM的構(gòu)建主要包括4個(gè)部分:粗模型的構(gòu)建、模型的精煉、模型的數(shù)學(xué)轉(zhuǎn)換、模型的調(diào)試和驗(yàn)證,涉及102個(gè)具體步驟。而GSMM的構(gòu)建方式有3種:手動(dòng)構(gòu)建、自動(dòng)構(gòu)建和半自動(dòng)構(gòu)建。手動(dòng)構(gòu)建方法依賴于基因組注釋結(jié)果,結(jié)合KEGG中的pathway map,對每個(gè)代謝途徑涉及的基因-蛋白-反應(yīng)進(jìn)行收集與整理,這種方法的優(yōu)勢在于模型的準(zhǔn)確性較高,缺點(diǎn)則是模型構(gòu)建過程耗時(shí)。自動(dòng)構(gòu)建方法則是通過已有的工具,提交相關(guān)的信息,如基因組序列,從而自動(dòng)得到目的菌株的GSMM,目前已經(jīng)開發(fā)了許多工具,如COBRA[37]、RAVEN[38]、Model SEED[39]和IMGMD[17],用于GSMM的自動(dòng)化構(gòu)建。這種方式的優(yōu)勢在于可以實(shí)現(xiàn)模型的快速、批量構(gòu)建,缺點(diǎn)則是構(gòu)建得到的模型準(zhǔn)確性低。半自動(dòng)構(gòu)建的方法則是先通過一些自動(dòng)化構(gòu)建工具得到GSMM,然后在該模型的基礎(chǔ)上進(jìn)行手動(dòng)精煉,得到精確的模型。
在完成模型的構(gòu)建后,需要進(jìn)行一系列的驗(yàn)證,從而判斷其覆蓋范圍是否完整,以及與現(xiàn)有的模型相比是否具有更好的預(yù)測能力。常見的模型評價(jià)指標(biāo)主要有:通用指標(biāo)、連通度指標(biāo)、生長指標(biāo)和基因敲除指標(biāo) (表1)。前兩個(gè)屬于描述模型的指標(biāo) (定量和定性),后兩個(gè)是預(yù)測生物行為的指標(biāo)[40]。通過將不同培養(yǎng)條件下的模擬結(jié)果與實(shí)驗(yàn)值進(jìn)行比較,從而判斷模型模擬結(jié)果的準(zhǔn)確性。
2.2.1 流量平衡分析類算法
代謝流量(Flux) 是胞內(nèi)分子通過代謝途徑的轉(zhuǎn)換率,受到代謝途徑中涉及的酶調(diào)控。流量平衡分析(FBA) 作為最基本的數(shù)學(xué)算法,目前已經(jīng)被廣泛應(yīng)用于計(jì)算最優(yōu)條件下的生長速率或者代謝產(chǎn)物合成速率[41]。然而由于FBA算法局限性是只能模擬穩(wěn)態(tài)條件下的流量分布,并且通過底物的吸收速率作為約束條件,限制了FBA預(yù)測流量分布的準(zhǔn)確性。因此,在FBA的基礎(chǔ)上開發(fā)了一系列的算法對代謝流量進(jìn)行額外的約束(表2)。這些算法一方面提高了模型預(yù)測流量分布結(jié)果的準(zhǔn)確性,例如,通過整合轉(zhuǎn)錄調(diào)控信息,開發(fā)了rFBA算法,根據(jù)培養(yǎng)基中的代謝物濃度對反應(yīng)流量添加布爾約束,能夠解釋、分析和預(yù)測轉(zhuǎn)錄調(diào)控在系統(tǒng)水平上對細(xì)胞代謝的影響[42]。在rFBA的基礎(chǔ)上,進(jìn)一步整合常微分方程(ODEs),開發(fā)了iFBA算法[43],模擬結(jié)果表明,相較于rFBA,iFBA對334個(gè)單基因擾動(dòng)和野生型的預(yù)測更準(zhǔn)確。另一方面拓展了模型的應(yīng)用,如dFBA算法將FBA擴(kuò)展至能夠考慮動(dòng)力學(xué)因素,實(shí)現(xiàn)代謝流量的動(dòng)態(tài)模擬。應(yīng)用該算法,準(zhǔn)確預(yù)測了.在葡萄糖分批補(bǔ)料條件下的二次生長情況[44]。cFBA則通過將反應(yīng)化學(xué)計(jì)量數(shù)、熱力學(xué)和生態(tài)系統(tǒng)作為約束條件,用于研究微生物群體的代謝行為[45]。
表1 用于評價(jià)代謝網(wǎng)絡(luò)模型的主要指標(biāo)
表2 常見的流量平衡分析方法
2.2.2 遺傳擾動(dòng)類算法
微生物遺傳改造主要是通過對微生物基因組進(jìn)行修飾,改變基因型,從而獲得不同表型微生物。結(jié)合GSMM,開發(fā)相應(yīng)的算法可以實(shí)現(xiàn)對這些擾動(dòng)的模擬(表3)。這些算法可以分為基因敲除、添加、上調(diào)/下調(diào)或者異源途徑導(dǎo)入等。Optknock是典型的基因敲除方法,是基于雙目標(biāo)方程,即分別對生物量方程和目標(biāo)產(chǎn)物求解,篩選出能夠提高目標(biāo)產(chǎn)物的基因敲除靶點(diǎn)[51]。在OptKnock的基礎(chǔ)上進(jìn)行改進(jìn),得到了ReacKnock 算法,能夠?qū)崿F(xiàn)多達(dá)20個(gè)基因敲除靶點(diǎn)的篩選[52]。OptSwap作為基因添加類唯一的算法,主要是一種確定氧化還原酶輔因子特異性(NAD(H)和NADP(H)) 的最佳修飾的方法,用于微生物生產(chǎn)菌株的設(shè)計(jì)[53]。在基因上調(diào)、下調(diào)方面,OptForce通過比較突變菌株和野生型的反應(yīng)流量差異,從而確定上調(diào)或下調(diào)的靶點(diǎn),實(shí)現(xiàn)目標(biāo)產(chǎn)物的過量合成[54]。而k-OptForce則是OptForce的擴(kuò)展,通過整合酶動(dòng)力學(xué)常數(shù),預(yù)測酶編碼基因的上調(diào)或下調(diào)[55]。異源表達(dá)相關(guān)的算法目前有OptStrain和SimOptStrain。前者通過在包含一系列酶催化反應(yīng)的反應(yīng)庫中檢索,篩選能夠滿足最大產(chǎn)物合成速率下的最小修飾路徑添加至宿主細(xì)胞中[56]。后者則是不僅能夠?qū)崿F(xiàn)異源途徑的添加,同時(shí)鑒定出宿主細(xì)胞中需要?jiǎng)h除的反應(yīng)[57]。
表3 常見的模擬菌株設(shè)計(jì)方法
在工業(yè)菌株生產(chǎn)過程中,微生物的表型是基因型和外部環(huán)境共同作用的結(jié)果。微生物的表型主要涉及細(xì)胞生長、能量利用、底物利用、產(chǎn)物合成和基因必需性等方面。利用GSMM對細(xì)胞表型進(jìn)行預(yù)測,從而理解微生物的表型潛力。
為了預(yù)測微生物的細(xì)胞生長,利用FBA算法,計(jì)算穩(wěn)態(tài)條件下的各個(gè)反應(yīng)的流量分布。通過設(shè)定不同底物的吸收速率,以生物量方程為目標(biāo)方程求解,從而計(jì)算出.的最大比生長速率()[41]。
通過改變目標(biāo)方程,探討微生物代謝在不同目標(biāo)方程下的流量分布,以檢驗(yàn)滿足細(xì)胞功能背后的驅(qū)動(dòng)力,進(jìn)而理解能量利用與細(xì)胞次優(yōu)行為之間的關(guān)系。通過評價(jià)11種目標(biāo)方程下的流量分布,模擬不同條件下的最大ATP得率,與6種環(huán)境下的C13標(biāo)記實(shí)驗(yàn)進(jìn)行比較,證實(shí)模型能夠準(zhǔn)確預(yù)測微生物胞內(nèi)能量利用[67]。
通過改變培養(yǎng)條件,模擬不同培養(yǎng)基中底物利用對微生物生長的影響,從而鑒定最優(yōu)培養(yǎng)基。利用維生素C生產(chǎn)菌株.WSH001模型WZ663,通過FBA模擬,發(fā)現(xiàn)從完全培養(yǎng)基中分別去除甘氨酸、半胱氨酸、甲硫氨酸、色氨酸、腺嘌呤、胸腺嘧啶、硫胺素和泛酸會(huì)導(dǎo)致細(xì)胞生長分別下降1%、21%、16%、1%、26%、57%、73%和24%?;谶@些結(jié)果開發(fā)了.最小合成培養(yǎng)基,不僅滿足了.的生長,而且2-酮基-L-古龍酸產(chǎn)量達(dá)到了完全培養(yǎng)基條件下的96.5%[68]。
利用魯棒性分析算法,對生物量方程進(jìn)行約束,以產(chǎn)物合成反應(yīng)作為目標(biāo)方程求解,能夠得到一個(gè)解空間,反映了不同生長速率下的產(chǎn)物合成能力。結(jié)合OptKnock算法,篩選.過量生成乳酸的靶點(diǎn),結(jié)合適應(yīng)性進(jìn)化策略,最終得到能夠在M9培養(yǎng)基中同時(shí)滿足快速生長和乳酸大量分泌的.菌株[11]。
利用單基因敲除程序,對微生物的必需基因鑒定。通過比較不同培養(yǎng)條件下的必需基因差異,從而理解基因的絕對必需性和相對必需性。在最小培養(yǎng)基中,高山被孢霉的模型CY1106中有86個(gè)基因被鑒定為必需基因;而在酵母提取物培養(yǎng)基中,只有49個(gè)基因是必需基因。進(jìn)一步分析,前者有36.05%的必需基因?qū)儆诎被岽x途徑,而后者有23.26%的必需基因參與核苷酸代謝[69]。表明在營養(yǎng)豐富的培養(yǎng)條件下,氨基酸可以通過從培養(yǎng)基中直接攝入,不需要從頭合成,因此氨基酸代謝相關(guān)的基因是相對必需的。
綜上所述,在細(xì)胞表型預(yù)測方面,GSMM展現(xiàn)了巨大的應(yīng)用前景。利用GSMM不僅可以模擬微生物在不同培養(yǎng)條件下的生長情況,為發(fā)酵過程優(yōu)化提供參考,而且實(shí)現(xiàn)了胞內(nèi)代謝流分布的定量分析,為代謝瓶頸的鑒定提供了理論依據(jù)。
代謝工程改造目標(biāo)菌株,提高產(chǎn)量是一種有效策略,已經(jīng)被廣泛地應(yīng)用[70]。但是由于缺乏對微生物整個(gè)代謝活動(dòng)的系統(tǒng)認(rèn)識,單一水平上的基因改造策略難以高效地實(shí)現(xiàn)目標(biāo)。利用GSMM,結(jié)合不同的遺傳改造方法,可以從全局水平模擬:1) 競爭路徑的消除;2) 合成路徑關(guān)鍵基因的強(qiáng)化;3) 反饋抑制的消除;4) 外源路徑的導(dǎo)入;5) 輔因子優(yōu)化等改造策略對目標(biāo)產(chǎn)物的影響,為系統(tǒng)代謝工程提供指導(dǎo)[71]。
為了消除競爭路徑,通過一系列的算法篩選基因敲除靶點(diǎn),對基因敲除結(jié)果的組合優(yōu)化,從而提高目標(biāo)產(chǎn)品的產(chǎn)量。利用OptCouple,鑒定出大腸桿菌分別過量生產(chǎn)丙酸、衣康酸的一系列基因敲除靶點(diǎn),這些靶點(diǎn)大多存在于其競爭途徑,此外還鑒定出甲基化修飾提高產(chǎn)量的靶點(diǎn)[61]。
在基因敲除菌株的基礎(chǔ)上,表達(dá)特定基因,模擬合成路徑關(guān)鍵基因的強(qiáng)化,分析基因表達(dá)對產(chǎn)物合成的影響。利用OptORF算法鑒定出敲除轉(zhuǎn)錄因子,同時(shí)敲除基因、和,在此基礎(chǔ)上過量表達(dá),使得乙醇得率從39.3%提高至86.2%[63]。
反饋抑制的消除主要是通過不同的算法模擬代謝路徑中某個(gè)基因的上調(diào)或下調(diào),從而使碳流更多地流向目標(biāo)產(chǎn)物。利用OptForce算法,對不同鏈長脂肪酸合成過程中的上調(diào)、下調(diào)、敲除靶點(diǎn)進(jìn)行了鑒定。發(fā)現(xiàn)上調(diào)和acyl-ACP硫酯酶,同時(shí)敲除,最小M9培養(yǎng)基中C14-16脂肪酸的產(chǎn)量達(dá)到了1.7 g/L,得率為0.14 g/g葡萄糖(最大理論得率的39%)[72]。同樣地,利用該方法鑒定出敲除和,同時(shí)上調(diào)ACC、PGK、GAPD和PDH的表達(dá),能夠使胞內(nèi)丙酰輔酶A的含量提高3.1倍[73]。
對于非天然產(chǎn)物的合成,通常涉及異源途徑的導(dǎo)入。利用SimOptStrain鑒定出在.中敲除、和的同時(shí),引入氧代戊二酸脫氫酶(EC: 1.2.1.52) 催化的反應(yīng)(2-酮戊二酸+ CoA+NADP+=琥珀酰輔酶A+CO2+NADPH),使得琥珀酸得率達(dá)到了最大理論得率的32.5%[57]。
通過改善產(chǎn)物合成路徑中關(guān)鍵酶的輔因子的偏好性,消除輔因子失衡所造成的負(fù)面效應(yīng),有助于構(gòu)建高效的產(chǎn)物合成路徑?;贠ptSwap算法設(shè)計(jì)和優(yōu)化光滑球擬酵母生產(chǎn)丙酮酸,得到了12種輔因子交換和敲除策略,導(dǎo)致丙酮酸合成速率從0最高增加至 20.42 mmol/(g DW·h)[74]。
綜上所述,基于GSMM,篩選不同代謝改造靶點(diǎn)并組合,用于指導(dǎo)代謝工程,進(jìn)而通過實(shí)驗(yàn)進(jìn)行驗(yàn)證。應(yīng)用這種策略,已經(jīng)成功地應(yīng)用在有機(jī)酸、氨基酸、醇類等化學(xué)品的生產(chǎn)中。模型與實(shí)驗(yàn)相結(jié)合,不僅實(shí)現(xiàn)了菌株改造的理性設(shè)計(jì),提高了代謝工程改造效率,而且能夠從全局水平考慮遺傳擾動(dòng)對整個(gè)微生物胞內(nèi)代謝的影響,有助于實(shí)現(xiàn)代謝流的精準(zhǔn)調(diào)控。
針對工業(yè)微生物胞內(nèi)代謝的研究,國內(nèi)外研究人員采用生化工程和代謝工程等策略,開展了卓有成效的研究。結(jié)合GSMM,可以將理性設(shè)計(jì)與實(shí)驗(yàn)操作結(jié)合,從而高效地獲得工業(yè)生產(chǎn)菌株。GSMM經(jīng)過20年的發(fā)展,一方面通過不斷添加約束條件,提高了模型預(yù)測結(jié)果的準(zhǔn)確性,另一方面從單一菌株的模型發(fā)展至宏基因組模型。隨著一系列模型構(gòu)建工具和分析方法的開發(fā),不僅實(shí)現(xiàn)了微生物GSMM的快速構(gòu)建,而且能夠從預(yù)測細(xì)胞表型、指導(dǎo)代謝工程這兩個(gè)方面對微生物胞內(nèi)代謝活動(dòng)進(jìn)行系統(tǒng)分析。
隨著GSMM構(gòu)建工具的不斷開發(fā)和完善,目前已經(jīng)可以實(shí)現(xiàn)GSMM的快速、批量構(gòu)建,但是受限于模型構(gòu)建方法及構(gòu)建團(tuán)隊(duì)自身水平的限制,導(dǎo)致構(gòu)建的GSMMs質(zhì)量參差不齊,此外,這些GSMMs中的反應(yīng)和代謝物列表中的展現(xiàn)形式也缺乏統(tǒng)一,限制了GSMM的進(jìn)一步應(yīng)用。雖然目前已有一些數(shù)據(jù)庫,如BIGG Models實(shí)現(xiàn)了已發(fā)表GSMMs的標(biāo)準(zhǔn)化,但是該數(shù)據(jù)庫目前僅收錄了85個(gè)模型[18]。因此亟需建立相應(yīng)的標(biāo)準(zhǔn)對模型進(jìn)行統(tǒng)一,并且搭建功能更全面的數(shù)據(jù)庫平臺,提供GSMMs的檢索和下載。
雖然GSMM已經(jīng)被廣泛地應(yīng)用在多個(gè)方面,但是這些模型的約束參數(shù)都是固定的。而最新發(fā)展的機(jī)器學(xué)習(xí)(Machine learning) 方法,基于黑箱理論(Black-box),不需要對約束參數(shù)進(jìn)行設(shè)定,只需要提供一系列的訓(xùn)練集(Training data),就能夠?qū)?shù)進(jìn)行自動(dòng)修正,從而實(shí)現(xiàn)模型的精確預(yù)測。此外,為了克服黑箱機(jī)器學(xué)習(xí)方法無法直接揭示生物分子與細(xì)胞表型之間的相互作用關(guān)系的不足,Yang等進(jìn)一步開發(fā)了白箱理論(White-box) 用于揭示抗生素作用機(jī)制[75]。機(jī)器學(xué)習(xí)方法,作為一種新興的技術(shù),在現(xiàn)代社會(huì)展現(xiàn)了巨大的應(yīng)用潛力,已經(jīng)廣泛地應(yīng)用在語言識別、視覺對象識別、物體檢測、藥物發(fā)現(xiàn)和基因組分析等方面[76-78]。因此,采用機(jī)器學(xué)習(xí)方法對GSMM進(jìn)行分析,除了進(jìn)一步實(shí)現(xiàn)代謝流調(diào)控的精準(zhǔn)預(yù)測,還可以用于復(fù)雜環(huán)境下相互作用關(guān)系的表征,則是未來GSMM的發(fā)展趨勢。
[1] Kim WJ, Kim HU, Lee SY. Current state and applications of microbial genome-scale metabolic models. Curr Opin Syst Biol, 2017, 2: 10–18.
[2] O'Brien EJ, Monk JM, Palsson BO. Using genome-scale models to predict biological capabilities. Cell, 2015, 161(5): 971–987.
[3] Nocon J, Steiger MG, Pfeffer M, et al. Model based engineering ofcentral metabolism enhances recombinant protein production. Metab Eng, 2014, 24: 129–138.
[4] Song CW, Kim DI, Choi S, et al. Metabolic engineering offor the production of fumaric acid. Biotechnol Bioeng, 2013, 110(7): 2025–2034.
[5] Dikicioglu D, Pir P, Onsan ZI, et al. Integration of metabolic modeling and phenotypic data in evaluation and improvement of ethanol production using respiration-deficient mutants of. Appl Environ Microbiol, 2008, 74(18): 5809–5816.
[6] Lee KY, Park JM, Kim TY, et al. The genome-scale metabolic network analysis ofZM4 explains physiological features and suggests ethanol and succinic acid production strategies. Microb Cell Fact, 2010, 9: 94.
[7] Lee J, Yun H, Feist AM, et al. Genome-scale reconstruction andanalysis of theATCC 824 metabolic network. Appl Microbiol Biotechnol, 2008, 80(5): 849–862.
[8] Ranganathan S, Maranas CD. Microbial 1-butanol production: identification of non-native production routes andengineering interventions. Biotechnol J, 2010, 5(7): 716–725.
[9] Lee SJ, Lee DY, Kim TY, et al. Metabolic engineering offor enhanced production of succinic acid, based on genome comparison andgene knockout simulation. Appl Environ Microbiol, 2005, 71(12): 7880–7887.
[10] Mienda BS, Shamsir MS, Illias RM. Model-guided metabolic gene knockout of gnd for enhanced succinate production infrom glucose and glycerol substrates. Comput Biol Chem, 2016, 61: 130–137.
[11] Fong SS, Burgard AP, Herring CD, et al.design and adaptive evolution offor production of lactic acid. Biotechnol Bioeng, 2005, 91(5): 643–648.
[12] Choi HS, Lee SY, Kim TY, et al.identification of gene amplification targets for improvement of lycopene production. Appl Environ Microbiol, 2010, 76(10): 3097–3105.
[13] Lee KH, Park JH, Kim TY, et al. Systems metabolic engineering offorL-threonine production. Mol Syst Biol, 2007, 3(1): 149.
[14] Park JH, Lee KH, Kim TY, et al. Metabolic engineering offor the production ofL-valine based on transcriptome analysis andgene knockout simulation. Proc Natl Acad Sci USA, 2007, 104(19): 7797–7802.
[15] Brochado AR, Matos C, M?ller BL, et al. Improved vanillin production in baker’s yeast throughdesign. Microb Cell Fact, 2010, 9: 84.
[16] Yim H, Haselbeck R, Niu W, et al. Metabolic engineering offor direct production of 1,4-butanediol. Nat Chem Biol, 2011, 7(7): 445–452.
[17] Ye C, Xu N, Dong C, et al. IMGMD: a platform for the integration and standardisation ofmicrobial genome-scale metabolic models. Sci Rep, 2017, 7(1): 727.
[18] King ZA, Lu J, Dr?ger A, et al. BiGG Models: a platform for integrating, standardizing and sharing genome-scale models. Nucleic Acids Res, 2016, 44(D1): D515–D522.
[19] Monk JM, Lloyd CJ, Brunk E, et al.ML1515, a knowledgebase that computestraits. Nat Biotechnol, 2017, 35(10): 904–908.
[20] O’Brien EJ, Lerman JA, Chang RL, et al. Genome-scale models of metabolism and gene expression extend and refine growth phenotype prediction. Mol Syst Biol, 2013, 9(1): 693.
[21] Yizhak K, Benyamini T, Liebermeister W, et al. Integrating quantitative proteomics and metabolomics with a genome-scale metabolic network model. Bioinformatics, 2010, 26(12): i255–i260.
[22] Feng XY, Zhao HM. Investigating xylose metabolism in recombinantvia13C metabolic flux analysis. Microb Cell Fact, 2013, 12: 114.
[23] Khodayari A, Maranas CD. A genome-scalekinetic metabolic model k-ecoli457 satisfying flux data for multiple mutant strains. Nat Commun, 2016, 7: 13806.
[24] Krumholz EW, Libourel IGL. Thermodynamic constraints improve metabolic networks. Biophys J, 2017, 113(3): 679–689.
[25] Sánchez BJ, Zhang C, Nilsson A, et al. Improving the phenotype predictions of a yeast genome-scale metabolic model by incorporating enzymatic constraints. Mol Syst Biol, 2017, 13(8): 935.
[26] Brunk E, Sahoo S, Zielinski DC, et al. Recon3D enables a three-dimensional view of gene variation in human metabolism. Nat Biotechnol, 2018, 36(3): 272–281.
[27] Carrera J, Estrela R, Luo J, et al. An integrative, multi-scale, genome-wide model reveals the phenotypic landscape of. Mol Syst Biol, 2014, 10(7): 735.
[28] Karr JR, Sanghvi JC, Macklin DN, et al. A whole-cell computational model predicts phenotype from genotype. Cell, 2012, 150(2): 389–401.
[29] Ye C, Zou W, Xu N, et al. Metabolic model reconstruction and analysis of an artificial microbial ecosystem for vitamin C production. J Biotechnol, 2014, 182–183: 61–67.
[30] Salimi F, Zhuang K, Mahadevan R. Genome-scale metabolic modeling of a clostridial co-culture for consolidated bioprocessing. Biotechnol J, 2010, 5(7): 726–738.
[31] Monk JM, Charusanti P, Aziz RK, et al. Genome-scale metabolic reconstructions of multiplestrains highlight strain-specific adaptations to nutritional environments. Proc Natl Acad Sci USA, 2013, 110(50): 20338–20343.
[32] Bosi E, Monk JM, Aziz RK, et al. Comparative genome-scale modelling ofstrains identifies strain-specific metabolic capabilities linked to pathogenicity. Proc Natl Acad Sci USA, 2016, 113(26): E3801–E3809.
[33] Seif Y, Kavvas E, Lachance JC, et al. Genome-scale metabolic reconstructions of multiplestrains reveal serovar-specific metabolic traits. Nat Commun, 2018, 9(1): 3771.
[34] Magnúsdóttir S, Heinken A, Kutt L, et al. Generation of genome-scale metabolic reconstructions for 773 members of the human gut microbiota. Nat Biotechnol, 2017, 35(1): 81–89.
[35] Garza DR, Van Verk MC, Huynen MA, et al. Towards predicting the environmental metabolome from metagenomics with a mechanistic model. Nat Microbiol, 2018, 3(4): 456–460.
[36] Schellenberger J, Que R, Fleming RMT, et al. Quantitative prediction of cellular metabolism with constraint-based models: the COBRA Toolbox v2.0. Nat Protoc, 2011, 6(9): 1290–1307.
[37] Heirendt L, Arreckx S, Pfau T, et al. Creation and analysis of biochemical constraint-based models using the COBRA Toolbox v.3.0. Nat Protoc, 2019, 14(3): 639–702.
[38] Wang H, Marci?auskas S, Sánchez BJ, et al. RAVEN 2.0: a versatile toolbox for metabolic network reconstruction and a case study on. PLoS Comput Biol, 2018, 14(10): e1006541.
[39] Alper HS. Systems Metabolic Engineering. New York: Humana Press, 2013: 17–45.
[40] Sanchez BJ, Nielsen J. Genome scale models of yeast: towards standardized evaluation and consistent omic integration. Integr Biol (Camb), 2015, 7(8): 846–858.
[41] Orth JD, Thiele I, Palsson B?. What is flux balance analysis? Nat Biotechnol, 2010, 28(3): 245–248.
[42] Covert MW, Schilling CH, Palsson B. Regulation of gene expression in flux balance models of metabolism. J Theor Biol, 2001, 213(1): 73–88.
[43] Covert MW, Xiao N, Chen TJ, et al. Integrating metabolic, transcriptional regulatory and signal transduction models in. Bioinformatics, 2008, 24(18): 2044–2050.
[44] Mahadevan R, Edwards JS, Doyle III FJ. Dynamic flux balance analysis of diauxic growth in. Biophys J, 2002, 83(3): 1331–1340.
[45] Khandelwal RA, Olivier BG, Roling WFM, et al. Community flux balance analysis for microbial consortia at balanced growth. PLoS ONE, 2013, 8(5): e64567.
[46] Lewis NE, Hixson KK, Conrad TM, et al. Omic data from evolved.are consistent with computed optimal growth from genome-scale models. Mol Syst Biol, 2010, 6(1): 390.
[47] Thiele I, Fleming RMT, Bordbar A, et al. Functional characterization of alternate optimal solutions of’s transcriptional and translational machinery. Biophys J, 2010, 98(10): 2072–2081.
[48] Benyamini T, Folger O, Ruppin E, et al. Flux balance analysis accounting for metabolite dilution. Genome Biol, 2010, 11(4): R43.
[49] Kelk SM, Olivier BG, Stougie L, et al. Optimal flux spaces of genome-scale stoichiometric models are determined by a few subnetworks. Sci Rep, 2012, 2: 580.
[50] Smallbone K, Simeonidis E. Flux balance analysis: a geometric perspective. J Theor Biol, 2009, 258(2): 311–315.
[51] Burgard AP, Pharkya P, Maranas CD. OptKnock: a bilevel programming framework for identifying gene knockout strategies for microbial strain optimization. Biotechnol Bioeng, 2003, 84(6): 647–657.
[52] Xu ZX, Zheng P, Sun JB, et al. ReacKnock: identifying reaction deletion strategies for microbial strain optimization based on genome-scale metabolic network. PLoS ONE, 2013, 8(12): e72150.
[53] King ZA, Feist AM. Optimizing cofactor specificity of oxidoreductase enzymes for the generation of microbial production strains—OptSwap. Ind Biotechnol, 2013, 9(4): 236–246.
[54] Ranganathan S, Suthers PF, Maranas CD. OptForce: an optimization procedure for identifying all genetic manipulations leading to targeted overproductions. PLoS Comput Biol, 2010, 6(4): e1000744.
[55] Chowdhury A, Zomorrodi AR, Maranas CD. k-OptForce: integrating kinetics with flux balance analysis for strain design. PLoS Comput Biol, 2014, 10(2): e1003487.
[56] Pharkya P, Burgard AP, Maranas CD. OptStrain: a computational framework for redesign of microbial production systems. Genome Res, 2004, 14(11): 2367–2376.
[57] Kim J, Reed JL, Maravelias CT. Large-scale bi-level strain design approaches and mixed-integer programming solution techniques. PLoS ONE, 2011, 6(9): e24162.
[58] Segrè D, Vitkup D, Church GM. Analysis of optimality in natural and perturbed metabolic networks. Proc Natl Acad Sci USA, 2002, 99(23): 15112–15117.
[59] Ren SG, Zeng B, Qian XN. Adaptive bi-level programming for optimal gene knockouts for targeted overproduction under phenotypic constraints. BMC Bioinformatics, 2013, 14(S2): S17.
[60] Tepper N, Shlomi T. Predicting metabolic engineering knockout strategies for chemical production: accounting for competing pathways. Bioinformatics, 2010, 26(4): 536–543.
[61] Jensen K, Broeken V, Hansen ASL, et al. OptCouple: joint simulation of gene knockouts, insertions and medium modifications for prediction of growth-coupled strain designs. Metab Eng Commun, 2019, 8: e00087.
[62] Patil KR, Rocha I, F?rster J, et al. Evolutionary programming as a platform formetabolic engineering. BMC Bioinformatics, 2005, 6: 308.
[63] Kim J, Reed JL. OptORF: optimal metabolic and regulatory perturbations for metabolic engineering of microbial strains. BMC Syst Biol, 2010, 4: 53.
[64] Gu DQ, Zhang C, Zhou SG, et al. IdealKnock: a framework for efficiently identifying knockout strategies leading to targeted overproduction. Comput Biol Chem, 2016, 61: 229–237.
[65] Pharkya P, Maranas CD. An optimization framework for identifying reaction activation/inhibition or elimination candidates for overproduction in microbial systems. Metab Eng, 2006, 8(1): 1–13.
[66] Rockwell G, Guido NJ, Church GM. Redirector: designing cell factories by reconstructing the metabolic objective. PLoS Comput Biol, 2013, 9(1): e1002882.
[67] Schuetz R, Kuepfer L, Sauer U. Systematic evaluation of objective functions for predicting intracellular fluxes in. Mol Syst Biol, 2007, 3(1): 119.
[68] Fan SC, Zhang ZY, Zou W, et al. Development of a minimal chemically defined medium forWSH001 based on its genome-scale metabolic model. J Biotechnol, 2014, 169: 15–22.
[69] Ye C, Xu N, Chen HQ, et al. Reconstruction and analysis of a genome-scale metabolic model of the oleaginous fungus. BMC Syst Biol, 2015, 9: 1.
[70] Chen XL, Gao C, Guo L, et al. DCEO Biotechnology: tools to design, construct, evaluate, and optimize the metabolic pathway for biosynthesis of chemicals. Chem Rev, 2018, 118(1): 4–72.
[71] Choi KR, Jang WD, Yang D, et al. Systems metabolic engineering strategies: integrating systems and synthetic biology with metabolic engineering. Trends Biotechnol, 2019, 37(8): 817–837.
[72] Ranganathan S, Tee TW, Chowdhury A, et al. An integrated computational and experimental study for overproducing fatty acids in. Metab Eng, 2012, 14(6): 687–704.
[73] Xu P, Ranganathan S, Fowler ZL, et al. Genome-scale metabolic network modeling results in minimal interventions that cooperatively force carbon flux towards malonyl-CoA. Metab Eng, 2011, 13(5): 578–587.
[74] Xu N, Ye C, Chen XL, et al. Genome-scale metabolic modelling common cofactors metabolism in microorganisms. J Biotechnol, 2017, 251: 1–13.
[75] Yang JH, Wright SN, Hamblin M, et al. A white-box machine learning approach for revealing antibiotic mechanisms of action. Cell, 2019, 177(6): 1649–1661.e9.
[76] LeCun Y, Bengio Y, Hinton G. Deep learning. Nature, 2015, 521(7553): 436–444.
[77] Moen E, Bannon D, Kudo T, et al. Deep learning for cellular image analysis. Nat Methods, 2019, doi: 10.1038/s41592-019-0403-1.
[78] Gazestani VH, Lewis NE. From genotype to phenotype: augmenting deep learning with networks and systems biology. Curr Opin Syst Biol, 2019, 15: 68–73.
Application of metabolic network model to analyze intracellular metabolism of industrial microorganisms
Chao Ye1,2, Nan Xu3, Xiulai Chen1,2, and Liming Liu1,2
1 State Key Laboratory of Food Science and Technology, Jiangnan University, Wuxi 214122, Jiangsu, China 2 Key Laboratory of Industrial Biotechnology, Ministry of Education, Jiangnan University, Wuxi 214122, Jiangsu, China 3 College of Bioscience and Biotechnology, Yangzhou University, Yangzhou 225009,Jiangsu, China
To quickly and efficiently understand the intracellular metabolic characteristics of industrial microorganisms, and to find potential metabolic engineering targets, genome-scale metabolic network models (GSMMs) as a systems biology tool, are attracting more and more attention. We review here the 20-year history of metabolic network model, analyze the research status and development of GSMMs, summarize the methods for model construction and analysis, and emphasize the applications of metabolic network model for analyzing intracellular metabolic activity of microorganisms from cellular phenotypes, and metabolic engineering. Furthermore, we indicate future development trend of metabolic network model.
intracellular metabolic activity of microorganisms, production performance, genome-scale metabolic model, systems biology
10.13345/j.cjb.190257
劉立明 博士、教授、博士生導(dǎo)師,教育部長江學(xué)者特聘教授。研究方向?yàn)楣I(yè)生物技術(shù)、代謝工程、生物轉(zhuǎn)化和生物催化。在,、、、、、《生物工程學(xué)報(bào)》《微生物學(xué)報(bào)》等國內(nèi)外生物工程類主流學(xué)術(shù)期刊上以第一或責(zé)任作者身份發(fā)表學(xué)術(shù)論文120余篇,其中SCI論文100余篇。出版科技著作2部。獲得授權(quán)發(fā)明專利28項(xiàng),申請或公開發(fā)明專利20余項(xiàng)。研究成果近5年來獲國家技術(shù)發(fā)明二等獎(jiǎng)、教育部科技進(jìn)步一等獎(jiǎng)、中國石油與化學(xué)工業(yè)聯(lián)合會(huì)科技進(jìn)步一等獎(jiǎng)等5項(xiàng)科技獎(jiǎng)勵(lì)。
葉超, 徐楠, 陳修來, 等. 應(yīng)用代謝網(wǎng)絡(luò)模型解析工業(yè)微生物胞內(nèi)代謝. 生物工程學(xué)報(bào), 2019, 35(10): 1901–1913.
Ye C, Xu N, Chen XL, et al. Application of metabolic network model to analyze intracellular metabolism of industrial microorganisms. Chin J Biotech, 2019, 35(10): 1901–1913.
June 16, 2019;
August 19, 2019
Supported by:National Key Research and Development Program of China (No. 2018YFA0901401), the Scientific and Technological Innovation Leading Talents of National “Ten Thousand Talent Program” (2018), the National Natural Science Foundation of China (No. 21808083), the Key Technologies Research and Development Program of Jiangsu Province (Nos. BE2018623, BE2017622), the Key Field Research and Development Program of Guangdong Province (No. 2019B020218001).
Liming Liu. Tel/Fax: +86-510-85197875; E-mail: mingll@jiangnan.edu.cn
國家重點(diǎn)研發(fā)計(jì)劃 (No. 2018YFA0901401),2018年“萬人計(jì)劃”科技創(chuàng)新領(lǐng)軍人才支持經(jīng)費(fèi),國家自然科學(xué)基金 (No. 21808083),江蘇省科技支撐計(jì)劃社會(huì)發(fā)展項(xiàng)目 (Nos. BE2018623, BE2017622),廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目 (No. 2019B020218001) 資助。
(本文責(zé)編 陳宏宇)