劉立明,陳堅
江南大學 食品科學與技術國家重點實驗室,無錫 214122
代謝工程
基因組規(guī)模代謝網(wǎng)絡模型構建及其應用
劉立明,陳堅
江南大學 食品科學與技術國家重點實驗室,無錫 214122
微生物制造產業(yè)的發(fā)展迫切需要進一步提高認識、設計和改造微生物細胞代謝的能力,以推動工業(yè)生物技術快速發(fā)展。隨著微生物全基因組序列等高通量數(shù)據(jù)的不斷積聚和生物信息學策略的持續(xù)涌現(xiàn),使全局性、系統(tǒng)化地解析、設計、調控微生物生理代謝功能成為可能。而基于基因組序列注釋和詳細生化信息整合的基因組規(guī)模代謝網(wǎng)絡模型 (GSMM) 構建為全局理解和理性調控微生物生理代謝功能提供了最佳平臺。以下在詳述GSMM的應用基礎上,描述了如何構建一個高精確度的GSMM,并展望了未來的發(fā)展方向。
基因組規(guī)模代謝網(wǎng)絡,微生物制造,構建,應用
Abstract:The exploitation of microbial manufacture process (MMP) in industrial biotechnology requires a comprehensive understanding and an efficient modification of microorganism physiology. The availability of genome sequences and accumulation of-omics data allow us to understand of microbial physiology at the systems level, and genome-scale metabolic model (GSMM)represents a valuable framework for integrative analysis of metabolism of microorganisms. Genome scale metabolic models are reconstructed based on a combination of genome sequence and the more detailed biochemical knowledge, and these reconstructed models can be used for analyzing and simulating the operation of metabolism in response to different perturbations. Here we describe the reconstruction protocols for GSMM in further detail and provide the perspective of GSMM.
Keywords:genome scale metabolic model, microbial manufacture process, reconstruction, application
面對石油等不可再生的化石資源嚴重短缺并日漸枯竭,以及化學加工對環(huán)境污染日益加深的現(xiàn)實,世界經濟發(fā)展模式逐漸從不計消耗、犧牲環(huán)境的化石經濟模式轉向以可再生的碳水化合物為原料、利用生物細胞或酶的生物催化功能進行大規(guī)模物質加工與轉化的生物經濟模式,從而在源頭上解決資源短缺與環(huán)境污染問題[1]。生物經濟的重要支柱之一是微生物制造。然而,由于微生物細胞或酶具有為自身服務的本能,其代謝過程處于最經濟的狀態(tài),使得其工作效率成為制約微生物制造產業(yè)發(fā)展的瓶頸。因此,迫切需要通過代謝工程等策略以進一步提高認識、設計和改造微生物細胞代謝功能的能力,推動微生物制造技術的進步,支持工業(yè)可持續(xù)發(fā)展。但是,以往一系列的代謝工程改造策略,包括減弱反饋抑制、消除競爭途徑、過量表達主要合成途徑、提升細胞轉運能力、引入全新代謝途徑以修飾微生物代謝途徑中的某一個或幾個基因,不一定能獲得預期的代謝通量增大或降低的效果[2]。出現(xiàn)這一狀況的原因在于缺乏對微生物代謝網(wǎng)絡全局調控和表達調控網(wǎng)絡的充分理解。
另一方面,隨著基因組及其相關技術的發(fā)展,幾乎所有重要工業(yè)微生物模式種的全基因組都已經或即將公布,微生物制造研究進入了后基因組時代。后基因組時代的微生物制造具有以下特點:1) 源于微生物基因組的蛋白質組數(shù)據(jù)的積聚,使認識、理性設計、定向改變酶的性能更為容易;2) 轉錄組學、代謝組學等數(shù)據(jù)的積聚有助于理解、提高工業(yè)微生物抵御微生物制造過程中的惡劣環(huán)境;3) 從對微生物中個別基因或蛋白質功能的局部性研究,轉移到以細胞內全部基因、mRNA、蛋白質以及代謝產物為研究對象的工業(yè)微生物生理研究;4) 基于生物信息學的基因組規(guī)模基因調控網(wǎng)絡、信號轉導網(wǎng)絡、蛋白質相互作用網(wǎng)絡和代謝網(wǎng)絡的構建、模擬與分析,逐步將代謝工程推入更為理性的系統(tǒng)代謝工程時代[3];5) 采用合成生物學的技術精確控制代謝途徑、合成目的蛋白,構建“人工細胞”,顯著提高微生物制造效率。前已述及,由于基因與蛋白質傾向于成組地通過網(wǎng)狀相互作用而影響微生物細胞功能,因此對工業(yè)微生物生理功能的理解和全局調控的研究必須構建并分析其相互作用的網(wǎng)絡。這些分子和基因相互作用網(wǎng)絡包括基因調控網(wǎng)絡、信號轉導網(wǎng)絡、蛋白質相互作用網(wǎng)絡和代謝網(wǎng)絡等。其中,基于基因組注釋的代謝網(wǎng)絡把微生物細胞內所有生化反應構建為一個網(wǎng)絡模型,反映了所有參與代謝過程的化合物之間以及所有催化酶之間的相互作用?;诨蚪M數(shù)據(jù)構建的特定微生物代謝網(wǎng)絡,及其結構和功能的分析,為從全局規(guī)模上深刻認識和高效、定向調控微生物生理功能奠定了堅實基礎,從而為代謝工程的發(fā)展創(chuàng)造了前所未有的機遇[4-5]。
基因組規(guī)模代謝網(wǎng)絡模型 (Genome scale of metabolic network model,GSMM) 包含了其所給定微生物內部發(fā)生的絕大部分生化反應。BIGG (http://bigg.ucsd.edu/) 數(shù)據(jù)庫表明,原核微生物的代謝網(wǎng)絡包含了1 000多個代謝物、1 200多個基因和2 000多個生化反應 (以E. coli為例);而真核微生物代謝網(wǎng)絡模型包括1 200多個代謝物、1 000多個基因和1 500多個生化反應 (以S. cerevisiae為例)。基因組規(guī)模代謝網(wǎng)絡模型一般能注釋約 6%~15% (真核微生物) 和25% (原核微生物)的開放閱讀框 (ORF)。因此,基因組規(guī)模代謝網(wǎng)絡模型能提供一個高效平臺以全局理解微生物生理代謝功能 (圖 1)。主要應用于以下4個方面[6](表1):1) 分析代謝網(wǎng)絡屬性;2) 預測和分析微生物生長表型;3) 基于模型的組學數(shù)據(jù)闡釋[7];4) 系統(tǒng)代謝工程。
通過GSMM,可以從代謝物和代謝流兩個水平上充分理解微生物的代謝特性。在代謝物水平上,將基因組規(guī)模代謝網(wǎng)絡模型中的代謝物濃度范圍與GC-MS實驗所測定的S. cerevisiae中間代謝產物真實濃度進行比較,發(fā)現(xiàn)有52種代謝物濃度存在差異,并結合轉錄組數(shù)據(jù)的分析,找到了調控S. cerevisiae代謝功能的關鍵因子[31]。另一方面,整合 C13同位素標記實驗數(shù)據(jù),GSMM用以預測難以測定的中間代謝物濃度范圍、反應進行方向、Gibbs自由能范圍和潛在的調控反應等[32]。此外,GSMM還可預測代謝反應的中間代謝物之間的共生與保守關系[33]。在代謝流水平上[34-35],通過分析不同環(huán)境下不同代謝反應上代謝流分布的情況,發(fā)現(xiàn)微生物細胞是由少數(shù)承擔著絕大部分代謝通量的骨干代謝途徑和大量附屬代謝途徑組成。與此相類似,借助GSMM還可發(fā)現(xiàn)不同代謝反應之間的關系和依賴性,鑒別新代謝途徑,發(fā)現(xiàn)任何狀態(tài)下不承擔任何代謝流的生化反應,研究必需代謝途徑等。
表1 基因組規(guī)模代謝網(wǎng)絡模型的應用Table 1 Application of genome scale metabolic model
續(xù)表1
圖1 基因組規(guī)模代謝網(wǎng)絡模型是系統(tǒng)理解微生物代謝功能的平臺Fig.1 GSMM offer a platform to globally and comprehensive understanding the microbial physiology.
微生物細胞內的代謝調控發(fā)生在基因-基因、基因-蛋白質、蛋白質-蛋白質、蛋白質-代謝物以及物理間相互作用等水平上。通過與其他組學數(shù)據(jù),如轉錄組、蛋白質組等的整合,GSMM用以充分理解微生物細胞內的調控機制。通過比較不同碳源下恒化培養(yǎng)時S. cerevisiae的代謝流分布和轉錄組數(shù)據(jù),研究人員重構了一個由348個代謝基因和55個調節(jié)子組成的代謝調節(jié)網(wǎng)絡,揭示了S. cerevisiae的代謝調節(jié)機制[36]。借助代謝流分析,研究人員深度解析了E. coli全局代謝調控蛋白ArcA、ArcB、Cra、Crp、Cya、Fnr和Mlc對葡萄糖代謝的影響[37]。pckA和pps的表達水平因csrA的刪除而受到抑制,從而導致氨基酸合成前體磷酸烯醇式丙酮酸的胞內濃度不斷下降[38]。相反,若過量表達pps則能有效提高苯丙氨酸的產量[39]。進一步深入比較分析E. coli基因組規(guī)模代謝網(wǎng)絡模型的代謝通量和轉錄組數(shù)據(jù)發(fā)現(xiàn),代謝相關基因的表達水平及通過酶節(jié)點的代謝通量不僅具有相同的表達模式,還受相同的轉錄調控子所調控。
由于 GSMM 是由一系列用于合成微生物生長所必需的能量和前體代謝物的生化反應所組成,因此,GSMM廣泛應用于定性與定量預測不同代謝或環(huán)境攪動條件下細胞生長的表型。包括:1) 采用代謝流平衡分析 (Flux balance analysis,F(xiàn)BA),預測不同營養(yǎng)物吸收速率、代謝副產物合成速率和細胞生長速率之間的全局性關系;2) 預測不同類型培養(yǎng)基上細胞產率和生長比速率;3) 基于基因-蛋白質-反應 (Gene-protein-reaction,GPR) 原則預測基因刪除對細胞生長表型的影響;4) 預測并構建微生物生長 (或合成目標代謝產物) 必需基因集;5) 定量預測不同環(huán)境或代謝攪動下微生物生長表型。
建立在充分理解微生物細胞代謝功能基礎之上,借助重組DNA技術有目的地設計和改造微生物細胞內代謝網(wǎng)絡和表達網(wǎng)絡,以提高微生物代謝效率的代謝工程技術,有效地克服了傳統(tǒng)育種手段的突變非定向性和設計非理性的缺點,廣泛應用于微生物制造領域以提高目標代謝產物生產效率。隨著基因組規(guī)模技術的發(fā)展,代謝工程逐漸轉移到系統(tǒng)代謝工程,也即從全局的角度研究和調控微生物細胞的代謝與調控網(wǎng)絡?;诖?,GSMM為代謝工程提供了研究目標微生物代謝功能的有效工具:1)根據(jù)代謝能力或最大理論轉化率選擇宿主菌;2) 根據(jù)代謝流分布確定微生物細胞內瓶頸反應,確定代謝工程目標,發(fā)展代謝工程策略;3) 預測和評價代謝改造后突變株的代謝表型。
3.1 GSMM構建所需數(shù)據(jù)庫與軟件
基因組規(guī)模代謝網(wǎng)絡模型構建過程是建立基因-蛋白質-生化反應之間聯(lián)系的過程,涉及到基因組、蛋白質和酶、中間代謝產物、生化反應、代謝途徑等諸多方面的數(shù)據(jù)。所需數(shù)據(jù)庫和計算工具的介紹發(fā)表在每年的“Nucleic Acids Research”(NAR database issue) 第1期上。構建過程所需的數(shù)據(jù)庫和工具詳細列于表 2,主要分為以下幾類:1) 基因組數(shù)據(jù)庫。收集了來自全球的核酸序列主要包括EMBL數(shù)據(jù)庫 (由歐洲生物信息學研究所管理)、GenBank (由美國國家生物技術信息中心管理) 和DDBJ (由日本三島信息生物學中心管理)。上述3個數(shù)據(jù)庫雖然格式有所不同,但內容完全相同。一般而言,能從上述3個數(shù)據(jù)庫獲得所給定微生物的全基因組序列 (核酸或蛋白質)。此外,一些已經測序的微生物建立了自己特有的數(shù)據(jù)庫,不斷更新經注釋的基因組信息,如黑曲霉 (http://genome.jgi-psf.org/Aspni1/Aspni1.home.html) 的基因組數(shù)據(jù)庫。這些專業(yè)數(shù)據(jù)庫收集的是與明確功能類別或分類學標準相關的生物學數(shù)據(jù)。由于是經過修正和分析后產生的注釋數(shù)據(jù)庫,數(shù)據(jù)的精確度和驗證能力更勝一籌。2) 蛋白質數(shù)據(jù)庫。蛋白質數(shù)據(jù)庫收集了蛋白質序列、分類、功能、結構域、蛋白質模體 (Motif)、亞細胞定位等信息,而酶學數(shù)據(jù)庫則收集了酶的分類、功能、催化反應、標準命名以及酶相關特性,如溫度、Km值、pH等以及與之相關的事實文獻。3) 代謝物數(shù)據(jù)庫。GSMM構建中所涉及的中間代謝產物的信息,如代謝物名稱、化學式、InChI、化學結構、生物學功能等從ChEBI、PubChem和KEGG等3個數(shù)據(jù)庫中獲得。4) 代謝途徑數(shù)據(jù)庫。代謝途徑數(shù)據(jù)庫提供了微生物細胞內代謝反應的名稱、代謝物、輔因子、反應方向、代謝途徑等信息。最為典型的代謝途徑數(shù)據(jù)庫是 EcoCyc Ontology和KEGG。EcoCyc Ontology收錄了E. coli基因和其他一些相關微生物代謝途徑,同時通過途徑/基因組的用戶界面可視化地展現(xiàn)了細菌染色體內的基因輪廓、單個生化反應和整個生化代謝途徑。KEGG收錄了所有與途徑相關的數(shù)據(jù),包括途徑中相關的基因和化合物的目錄[40]。KEGG還提供了途徑圖譜、直系族表、分子目錄、基因組圖譜和基因目錄等數(shù)據(jù)。這些數(shù)據(jù)不僅相互之間互為鏈接并與其他相關數(shù)據(jù)庫進行鏈接,且能通過整合的數(shù)據(jù)庫進行檢索。5) 文獻事實數(shù)據(jù)庫[41]。隨著高通量技術手段的不斷發(fā)展,生物學實驗手段和研究方法均發(fā)生了巨大變化,由此帶來實驗數(shù)據(jù)以指數(shù)方式增長。以隸屬于美國國家生物技術信息中心的 MEDLINE為例,該數(shù)據(jù)庫收集了全世界 4 800多種生物學及醫(yī)學雜志所發(fā)表的1.3億余篇文獻,并以每月幾萬篇的速度增長。文獻事實數(shù)據(jù)庫為 GSMM構建提供以下信息[42-43]:(I) 給定基因的名稱、序列、亞細胞位置、轉錄調節(jié)以及相應生理功能;(II) 蛋白質序列、結構域、功能模塊、結構特性和功能;(III) 酶的名稱、EC號、生理與功能參數(shù)、結構特征、穩(wěn)定性、抑制劑或激活劑、應用以及與特定微生物相關的信息;(IV) 生化反應底物與產物、輔因子、單個生化反應和代謝途徑;(V) 代謝網(wǎng)絡與蛋白質相互作用網(wǎng)絡;(VI) 轉錄調控、底物和代謝產物的跨膜轉運、代謝產物的種類;(VII) 細胞組成成分、生理參數(shù)和特定微生物的相關生化參數(shù) (如培養(yǎng)基組分等)。6) 模型構建的軟件:構建過程使用的軟件主要是 Matlab,需要構建者熟悉Matlab編程;另一類是模型可視化軟件,主要是Illustrator和CellDesigner。后者可與其他組學數(shù)據(jù)如轉錄組進行交互闡釋。
表2 基因組規(guī)模代謝網(wǎng)絡模型構建所需數(shù)據(jù)庫Table 2 Database and software for reconstruction of genome scale metabolic network
續(xù)表2
圖2 基于基因組注釋的粗略代謝網(wǎng)絡構建步驟Fig.2 Elements and reconstruction protocol of the draft model based on the genome annotation.
GSMM構建一般分為5個階段[44]:1) 基因組注釋與粗略模型的獲得;2) 構建精細代謝模型;3) 數(shù)學模型的轉換;4) 識別與填補代謝空洞 (Metabolic gaps);5) 模擬與可視化。
3.2 基于基因組注釋的粗略代謝模型構建
構建 GSMM 需要從基因組數(shù)據(jù)庫獲取目標微生物的全基因組序列,再通過 Blastp、KAAS等方法對全基因組進行注釋,以建立基因-蛋白質反應之間的關系。從基因組注釋到構建粗略模型過程中需要收集的信息詳列于圖 2中。在將基因組序列注釋為蛋白質 (酶的名稱和EC號) 進而到生化反應的過程中需要注意以下問題:1) 有些蛋白質雖能注釋為酶的催化活性但沒有EC號;2) 有些蛋白質功能注釋過程中僅提供GO,而沒有分配系統(tǒng)的EC號;3)同一個酶能催化不同底物為不同的產物;4) 同工酶雖由不同基因編碼,但只能催化同一個反應;5) 不同基因編碼復合酶所催化的不同反應,但其所處的亞細胞位置不盡相同。上述問題的解決依賴于進一步的文獻挖掘。
3.3 基于手工修正的精細代謝網(wǎng)絡
通過基因組注釋得到粗略代謝網(wǎng)絡(以Excel形式存儲)的基礎上,需要添加一系列基因組注釋過程中無法提供的生化反應以降低dead-end代謝物的數(shù)量 (圖3):自發(fā)反應 (Spontaneous reactions);跨膜運輸反應;胞內細胞器間運輸反應;交換反應(Exchange reactions)。但若代謝網(wǎng)絡模型中包含過多的運輸反應,會導致很多無效循環(huán)的發(fā)生。因此,在基于文獻挖掘添加上述反應的基本原則是:添加確實需要的生化反應。同時,評價一個基因組規(guī)模代謝網(wǎng)絡模型成功與否的標準是該模型能否在給定培養(yǎng)條件下真實預測細胞生長,因此,GSMM需包括與細胞生長的相關反應:蛋白質合成反應;細胞壁組分合成反應;脂類合成反應;核苷酸類物質合成反應;脫氧核苷酸類物質合成反應;細胞生長和細胞維持所需ATP等。緊隨其后,需采用人工核查的方式檢查每一個生化反應,包括:單個反應所需底物、產物、輔因子的種類、分子式、化學計量學平衡等;基于吉布斯自由能的生化反應方向;生化反應的亞細胞定位、子系統(tǒng);源自文獻挖掘的實驗證據(jù)。
3.4 轉換為數(shù)學模型
GSMM構建的第3個階段是在安裝COBRA和SBML工具箱后,利用Matlab將精細代謝網(wǎng)絡轉換為數(shù)學模型,以供后續(xù)驗證和模擬使用。然而,采用 GSMM 模擬細胞生長或目標代謝產物的合成始終與實驗數(shù)據(jù)存在一定的差距,其原因在于模擬代謝流的分布缺乏一定的約束條件。為了使GSMM模擬結果更接近微生物真實的代謝,在GSMM模擬過程中通常添加一定的約束條件:物理-化學約束;拓撲約束;環(huán)境條件約束;代謝調控約束。GSMM中最常用的約束條件是物理-化學約束和環(huán)境條件約束 (圖 4):代謝通量平衡 (S?v=0);能量平衡 (ΔE=0);酶催化或細胞轉運的能力 (vi≤vmax) 以及熱動力學參數(shù) (0≤vmin)。
3.5 評估基因組規(guī)模代謝網(wǎng)絡模型
圖3 精細GSMM需要添加的反應與示例Fig.3 Added reactions to GSMM during the manual reconstruction refinement.
圖4 GSMM模擬的約束條件Fig.4 Physic-chemical and environmental conditions constraints for GSMM simulation.
將代謝網(wǎng)絡模型轉換為數(shù)學模型后,隨后的工作是采取一系列步驟評估與修正所構建的代謝網(wǎng)絡模型:1) 從碳、氮、硫、磷、氫和電荷等方面查找和修補物質或電子不平衡的生化反應;2) 查找代謝末端 (Metabolic dead ends) 以鑒定代謝漏洞(Metabolic gaps),進而通過基因注釋和文獻挖掘尋找相應生化反應修補相應的代謝漏洞;3) 添加缺失的交換反應(Exchange reactions) 以及設置交換反應的約束條件;4) 基于熱力學特性、ATP和 NADH合成與利用調整生化反應方向;5) 鑒定孤兒反應(Orphan reaction),調整或刪除引起代謝冗余的生化反應。在填補代謝漏洞的過程中,需要注意的事項是新添加到代謝網(wǎng)絡中的生化反應可能會導致新漏洞出現(xiàn)。因此,當加入新的反應時,應確保所有代謝物能連接到已構建好的代謝網(wǎng)絡。評價GSMM構建精確性還包括以下指標:是否在不同培養(yǎng)基和給定的培養(yǎng)條件下合成細胞生長所需的前體物質;典型培養(yǎng)基上能否生長;不同培養(yǎng)基上的細胞濃度和生長速度的比較;合成目標代謝產物的能力及其合成速率。
3.6 GSMM模擬和可視化
通過GSMM構建與模擬,研究人員能在不同組學水平上全局性、定量化理解微生物細胞的生理代謝功能,進而設計代謝工程策略,獲取所需的生理表型,提高微生物制造的效率。然而,由于難以全面獲取微生物細胞酶動力學相關數(shù)據(jù)和相關的調控機制,導致不能全面正確地解析和調控微生物細胞的代謝功能,進而提高工業(yè)生物過程的效率。為了更好地理解和整合微生物細胞內代謝調節(jié)機制和酶動力學知識,因此需要設計和應用更為新穎的生物信息學工具與方法。因此,為了更好地在全局性解析微生物生理功能的基礎上,發(fā)展高效代謝工程策略,定向改造微生物菌株為工業(yè)生物技術服務,今后的研究應注重以下兩個方面:構建更為全面、準確的包含調控機制和動態(tài)動力學參數(shù)的GSMM;發(fā)展新的模擬計算方法和約束條件,以更加準確地模擬真實的微生物細胞代謝。
REFERENCES
[1] Otero JM, Nielsen J. Industrial systems biology.Biotechnol Bioeng, 2009, 105: 439?460.
[2] Feist AM, Palsson BO. The growing scope of applications of genome-scale metabolic reconstructions usingEscherichia coli.Nat Biotechnol, 2008, 26: 659?667.
[3] Park JH, Lee SY. Towards systems metabolic engineering of microorganisms for amino acid production.Curr Opin Biotechnol, 2008, 19: 454?460.
[4] Patil KR, Akesson M, Nielsen J. Use of genome-scalemicrobial models for metabolic engineering.Curr Opin Biotechnol, 2004, 15: 64?69.
[5] Feist AM, Palsson BO. The growing scope of applications of genome-scale metabolic reconstructions usingEscherichia coli.Nat Biotechnol, 2008, 26: 659?667.
[6] Durot M, Bourguignon PY, Schachter V. Genome-scale models of bacterial metabolism: reconstruction and applications.FEMS Microbiol Rev, 2009, 33: 164?190.
從2003年的孫志剛案最終導致廢除收容審查制度,到如今于海明案讓我們對長期處于“認定模糊地帶”的法律概念——正當防衛(wèi),有了更深刻的理解,我們相信,每一位有著最樸素正義觀的人民群眾,在一起起個案中共同提升了法律素養(yǎng)和法治意識;我們更相信,法律從來不是冰冷的,而中國司法也必將在追求法律效果和社會效果的統(tǒng)一中,溫暖而堅定地前行!如同習近平總書記說,“努力讓人民群眾在每一個司法案件中都感受到公平正義”!
[7] Hanisch D, Zien A, Zimmer R,et al. Co-clustering of biological networks and gene expression data.Bioinformatics, 2002, 18(suppl 1): S145?S154.
[8] Reed JL, Palsson BO. Genome-scalein silicomodels ofE. colihave multiple equivalent phenotypic states:assessment of correlated reaction subsets that comprise network states.Genome Res, 2004, 14: 1797?1805.
[9] Mahadevan R, Schilling CH. The effects of alternate optimal solutions in constraint-based genome-scale metabolic models.Metab Eng, 2003, 5: 264?276.
[10] Schilling CH, Palsson BO. Assessment of the metabolic capabilities ofHaemophilus influenzaeRd through a genome-scale pathway analysis.J Theor Biol, 2000, 203:249?283.
[11] Klamt S, Stelling J. Two approaches for metabolic pathway analysis?Trends Biotechnol, 2003, 21: 64?69.
[12] Burgard AP, Nikolaev EV, Schilling CH,et al. Flux coupling analysis of genome-scale metabolic network reconstructions.Genome Res, 2004, 14: 301?312.
[13] Nikolaev EV, Burgard AP, Maranas CD. Elucidation and structural analysis of conserved pools for genome-scale metabolic reconstructions.Biophys J, 2005, 88: 37?49.
[14] Imielinski M, Belta C, Halasz A,et al. Investigating metabolite essentiality through genome-scale analysis ofEscherichia coliproduction capabilities.Bioinformatics,2005, 21: 2008?2016.
[15] Varma A, Palsson BO. Stoichiometric flux balance models quantitatively predict growth and metabolic byproduct secretion in wild-typeEscherichia coliW3110.Appl Environ Microb, 1994, 60: 3724?3731.
[16] Segre D, Vitkup D, Church GM. Analysis of optimality in natural and perturbed metabolic networks.Proc Natl Acad Sci USA, 2002, 99: 15112?15117.
[17] Shlomi T, Berkman O, Ruppin E. Regulatory on/off minimization of metabolic flux changes after genetic perturbations.Proc Natl Acad Sci USA, 2005, 102:7695?7700.
[18] Imielinski M, Belta C. Exploiting the pathway structure of metabolism to reveal high-order epistasis.BMC Syst Biol,2008, 2: 40.
[19] Sauer U. Metabolic networks in motion: 13C-based flux analysis.Mol Syst Biol, 2006, 2: 6.
[20] Herrgard MJ, Fong SS, Palsson B?. Identification of genome-scale metabolic network models using experimentally measured flux profiles.PLoS Comput Biol,2006, 2: e72.
[21] Schuetz R, Kuepfer L, Sauer U. Systematic evaluation of objective functions for predicting intracellular fluxes inEscherichia coli.Mol Syst Biol, 2007, 3: 119.
[22] Oh YK, Palsson BO, Park SM,et al. Genome-scale reconstruction of metabolic network inBacillus subtilisbased on high-throughput phenotyping and gene essentiality data.J Biol Chem, 2007, 282: 28791?28799.
[23] Henry CS, Broadbelt LJ, Hatzimanikatis V.Thermodynamics-based metabolic flux analysis.Biophys J, 2007, 92: 1792?1805.
[24] Patil KR, Nielsen J. Uncovering transcriptional regulation of metabolism by using metabolic network topology.Proc Natl Acad Sci USA, 2005, 102: 2685?2689.
[25] Akesson M, Forster J, Nielsen J. Integration of gene expression data into genome-scale metabolic models.Metab Eng, 2004, 6: 285?293.
[26] Becker SA, Palsson BO. Context-specific metabolic networks are consistent with experiments.PLoS Comput Biol, 2008, 4: e1000082.
[27] Barrett CL, Palsson BO. Iterative reconstruction of transcriptional regulatory networks: an algorithmic approach.PLoS Comput Biol, 2006, 2: e52.
[28] Alper H, Miyaoku K, Stephanopoulos G. Construction of lycopene-overproducingE. colistrains by combining systematic and combinatorial gene knockout targets.Nat Biotechnol, 2005, 23: 612?616.
[29] Pharkya P, Burgard AP, Maranas CD. OptStrain: a computational framework for redesign of microbial production systems.Genome Res, 2004, 14: 2367?2376.
[30] Lee KH, Park JH, Kim TY,et al. Systems metabolic engineering ofEscherichia colifor L-threonine production.Mol Syst Biol, 2007, 3: 149.
[31] Imielinski M, Belta C, Rubin H,et al. Systematic analysis of conservation relations inEscherichia coligenome-scale metabolic network reveals novel growth media.Biophys J,2006, 90: 2659?2672.
[32] Kummel A, Panke S, Heinemann M. Putative regulatory sites unraveled by network-embedded thermodynamic analysis of metabolome data.Mol Sys Biol, 2006, 2: 10.
[33] Becker SA, Price ND, Palsson BO. Metabolite coupling in genome-scale metabolic networks.BMC Bioinformatics,2006, 7: 14.
[34] Braunstein A, Mulet R, Pagnani A. Estimating the size of the solution space of metabolic networks.BMC Bioinformatics, 2008, 9: 13.
[35] Teusink B, Wiersma A, Molenaar D,et al. Analysis of growth ofLactobacillus plantarumWCFS1 on a complex medium using a genome-scale metabolic model.J Biolog Chem, 2006, 281: 40041?40048.
[36] Herrgard MJ, Lee BS, Portnoy V,et al. Integrated analysis of regulatory and metabolic networks reveals novel regulatory mechanisms inSaccharomyces cerevisiae.Genome Res, 2006, 16: 627?635.
[37] Perrenoud A, Sauer U. Impact of global transcriptional regulation byArcA,ArcB,Cra,Crp,Cya,Fnr, andMlcon glucose catabolism inEscherichia coli.J Bacteriol, 2005,187: 3171?3179.
[38] Tatarko M, Romeo T. Disruption of a global regulatory gene to enhance central carbon flux into phenylalanine biosynthesis inEscherichia coli.Curr Microbiol, 2001,43: 26?32.
[39] Wahl A, El Massaoudi M, Schipper D,et al. Serial13C-based flux analysis of an L-phenylalanine-producingE. colistrain using the sensor reactor.Biotech Prog, 2004,20: 706?714.
[40] Okuda S, Yamada T, Hamajima M,et al. KEGG Atlas mapping for global analysis of metabolic pathways.Nucleic Acids Res, 2008, 36: W423?W426.
[41] Jensen LJ, Saric J, Bork P. Literature mining for the biologist: from information retrieval to biological discovery.Nat Rev Gene, 2006, 7: 119?129.
[42] Ananiadou S, Kell DB, Tsujii J. Text mining and its potential applications in systems biology.Trends in Biotech, 2006, 24: 571?579.
[43] Leitner F, Valencia A. A text-mining perspective on the requirements for electronically annotated abstracts.FEBS Lett, 2008, 582: 1178?1181.
[44] Thiele I, Palsson BO. A protocol for generating a high-quality genome-scale metabolic reconstruction.Nat Protoc, 2010, 5: 93?121.
Reconstruction and application of genome-scale metabolic network model
Liming Liu, and Jian Chen
State Key Laboratory of Food Science and Technology,Jiangnan University,Wuxi214122,China
Received:May 9, 2010;Accepted:August 3, 2010
Supported by:National Outstanding Youth Foundation of China (No. 20625619), Foundation for the Author of National Excellent Doctoral Dissertation of China (No. 200962).
Corresponding author:Liming Liu. Tel: +86-510-85918307; E-mail: mingll@jiangnan.edu.cn
Jian Chen. E-mail: jchen@jiangnan.edu.cn
國家杰出青年基金 (No. 20625619),全國優(yōu)秀博士學位論文作者專項資金 (No. 200962) 資助。