趙權(quán)宇,于水燕,史吉平
中國科學(xué)院上海高等研究院生物煉制實(shí)驗(yàn)室,上海 201210
與生物代謝網(wǎng)絡(luò)相關(guān)的系統(tǒng)生物學(xué)計(jì)算方法包括有約束代謝通量分析(Constraint-based metabolic flux analysis)和代謝途徑分析(Metabolic pathway analysis)等[1-3]。代謝途徑分析研究代謝網(wǎng)絡(luò)中從底物到產(chǎn)物的可能途徑或內(nèi)部代謝產(chǎn)物的循環(huán)。代謝途徑分析的多數(shù)算法都是以凸分析為基礎(chǔ)的,主要包括基元模式(Elementary mode)和極端途徑(Extreme pathway)[4]?;J椒治鲈试S代謝網(wǎng)絡(luò)模型中同時(shí)存在可逆和不可逆反應(yīng)或傳遞過程;極端途徑分析需要把代謝網(wǎng)絡(luò)內(nèi)部的可逆反應(yīng)拆分成兩個(gè)不可逆反應(yīng)。關(guān)于基元模式和極端途徑的關(guān)系曾經(jīng)有過爭論,目前較為一致的看法是極端途徑為基元模式的子集[5]?;J椒治鍪菓?yīng)用最多的代謝途徑分析方法。文中綜述了基元模式分析的最新進(jìn)展,并探討了未來的重要發(fā)展方向。
基元模式是代謝網(wǎng)絡(luò)中所有可能代謝途徑的集合,基元模式的數(shù)目隨著代謝網(wǎng)絡(luò)規(guī)模的擴(kuò)大急劇增加,將會(huì)引發(fā)組合爆炸(Combinatorial explosion)。對(duì)中等規(guī)模代謝網(wǎng)絡(luò),基元模式數(shù)就可能超過200萬,而基因組尺度代謝網(wǎng)絡(luò)的基元模式很容易就超過2600萬[6]。這給基元模式的計(jì)算和分析都帶來了困難。Terzer 等[7]提出位模式樹算法加快基元模式的計(jì)算速度。其顯著特征是在正常變量中區(qū)分極端線,引入隨機(jī)排序方法加強(qiáng)并行計(jì)算,提出余數(shù)方法改善求秩,在硬件上使用多核技術(shù)。該算法用Java 開發(fā),可以在Matlab 中運(yùn)行,成功計(jì)算了大腸桿菌中心碳代謝網(wǎng)絡(luò)(106個(gè)反應(yīng))的2638萬個(gè)基元模式,以及基因組尺度幽門螺桿菌(381個(gè)反應(yīng))的500萬個(gè)基元模式。Jevremovic 等用C++開發(fā)的算法先對(duì)代謝網(wǎng)絡(luò)進(jìn)行壓縮,再用并行計(jì)算的方法計(jì)算釀酒酵母(80個(gè)反應(yīng))的1332萬個(gè)基元模式,可以在0.5 h 左右完成[8]。這些算法還有待進(jìn)一步改進(jìn),比如繼續(xù)優(yōu)化數(shù)據(jù)結(jié)構(gòu)和改善求秩等。已經(jīng)證明,基元模式的計(jì)算是NP-Complete 問題(多項(xiàng)式復(fù)雜程度的完全非確定性問題,Non-deterministic polynomial-complete problem)[9-10]。雖然提高計(jì)算速度可以縮短計(jì)算時(shí)間,對(duì)多數(shù)研究者來說,分析1000萬個(gè)基元模式仍舊是困難的。KEGG (Kyoto Encyclopedia of Genes and Genomes,KEGG)數(shù)據(jù)庫根據(jù)功能不同將代謝網(wǎng)絡(luò)分解成若干的子單元并提供代謝途徑圖,如糖酵解和三羧酸循環(huán)等。這些子單元包括的代謝反應(yīng)或過程一般不會(huì)超過300個(gè),計(jì)算子單元的基元模式是相對(duì)容易的。Schwartz等[11]最早嘗試從這些子單元分析基因組尺度釀酒酵母代謝網(wǎng)絡(luò)模型的基元模式,并結(jié)合基因表達(dá)數(shù)據(jù)分析了不同壓力條件下的代謝功能?;J阶疃嗟淖訂卧俏焯橇姿峄緩剑矁H有206個(gè)基元模式,給基元模式分析帶來很大方便。該方法雖然無法將子單元與全網(wǎng)絡(luò)尺度的基元模式建立有效的聯(lián)系,但已經(jīng)初步獲得了基因組尺度的基元模式與轉(zhuǎn)錄的關(guān)系。Kaleta 等同樣希望通過分析子系統(tǒng)來獲得基因組尺度代謝網(wǎng)絡(luò)的潛在代謝途徑[12]。他們的出發(fā)點(diǎn)是在子網(wǎng)絡(luò)分析中如果外部代謝物選擇不當(dāng),可能丟失一些關(guān)鍵的基元模式。因而提出基元通量趨勢(shì)(Elementary flux patterns)的概念,這些基元通量趨勢(shì)是一個(gè)子系統(tǒng)中反應(yīng)的子集,代表大網(wǎng)絡(luò)每個(gè)穩(wěn)態(tài)通量分布在子系統(tǒng)上的可能途徑。目前可以考察最小培養(yǎng)基,計(jì)算最小剪切組和考察魯棒性等,進(jìn)一步的研究還在進(jìn)行中。另外一種策略是開發(fā)新的算法,避免計(jì)算全部的基元模式。de Figueiredo 等[13]提出的是K 次最短基元模式的算法,這里的K 不是路徑長度,而是代謝網(wǎng)絡(luò)中基元模式的路徑長度排序。比如,三羧酸循環(huán)的1次最短基元模式(K=1)的路徑長度是2。應(yīng)用K次最短基元模式算法可以挑選基因組尺度大腸桿菌和谷氨酸棒桿菌代謝網(wǎng)絡(luò)模型中與賴氨酸生產(chǎn)相關(guān)的基元模式的子集,如何建立K 次最短基元模式與代謝行為的關(guān)系還有待深入研究。Song 等[14]用產(chǎn)率分析算法計(jì)算基元模式的子集。將包含38個(gè)反應(yīng)的重組釀酒酵母的基元模式數(shù)從369個(gè)降低到35個(gè)。他們的新算法基于凸包分析,難以用于多維體系,僅對(duì)小規(guī)模的代謝網(wǎng)絡(luò)適用。Rezola 等[15]使用了類似的策略,他們提出了產(chǎn)生通量模式(Generating flux mode)的概念,計(jì)算構(gòu)成通量空間的邊。對(duì)基因組尺度(2082個(gè)反應(yīng),1668個(gè)代謝物)的大腸桿菌代謝網(wǎng)絡(luò),該算法可以計(jì)算K 等于100的賴氨酸產(chǎn)生途徑的產(chǎn)生通量模式。該算法基于優(yōu)化方法求取凸基,缺陷是產(chǎn)生通量模式并不唯一。在隨機(jī)選定產(chǎn)生通量模式時(shí),可能忽略關(guān)鍵的基元模式,影響對(duì)代謝網(wǎng)絡(luò)結(jié)構(gòu)的解析。即使基元模式只有幾千個(gè),手動(dòng)分析這些基元模式仍是困難的。借助普通模體集聚(ACoM)可對(duì)基元模式進(jìn)行聚類分析[16],不過也僅適用于小型網(wǎng)絡(luò)。依據(jù)具體基因型和環(huán)境條件,約束代謝網(wǎng)絡(luò)空間,有助于減少基元模式數(shù)目。如Ferreira 等開發(fā)了集成環(huán)境組學(xué)數(shù)據(jù)的隱途徑投影算法(Projection to latent pathways),整合環(huán)境組數(shù)據(jù)求取BHK 細(xì)胞的有效基元模式[17]。這仍需要先計(jì)算所有的基元模式,再進(jìn)行簡化。應(yīng)用環(huán)境實(shí)驗(yàn)數(shù)據(jù)在基元模式上進(jìn)行多變量回歸時(shí),原則上實(shí)驗(yàn)變量數(shù)要高于顯著的基元模式數(shù),可對(duì)于大規(guī)模網(wǎng)絡(luò)來說很難實(shí)現(xiàn)。
軟件在系統(tǒng)生物學(xué)的研究中有著重要的作用,性能良好的軟件需要具有功能豐富、界面友好、計(jì)算速度快和方便調(diào)用等特點(diǎn)。目前,CellNetAnalyzer[18]、OptFlux[19]、YANAsquare[20]、EFMtool[7]和Tools-4-Metatool (T4M)[21]等都可以計(jì)算基元模式。CellNetAnalyzer 是基于Matlab的圖形界面軟件,可以計(jì)算基元模式以及分析相關(guān)的代謝網(wǎng)絡(luò)拓?fù)湫再|(zhì),同時(shí)還可以研究信號(hào)傳導(dǎo)網(wǎng)絡(luò)。為解析高通量數(shù)據(jù),CellNetAnalyzer 也開發(fā)了可以獨(dú)立于圖形用戶界面的應(yīng)用程序界面[22]。YANAsquare為Java開發(fā)的圖形界面軟件,調(diào)用Metatool 作為計(jì)算基元模式的工具,提出的基元模式活性與酶活的轉(zhuǎn)換關(guān)系缺乏理論基礎(chǔ),在應(yīng)用中需要注意。YANAsquare 的優(yōu)點(diǎn)是可以實(shí)現(xiàn)代謝網(wǎng)絡(luò)模型SBML 格式和Metatool 格式的轉(zhuǎn)換,但是計(jì)算速度慢,數(shù)據(jù)格式還有待改進(jìn)。比如,目前化學(xué)計(jì)量系數(shù)只能為整數(shù),而很多代謝網(wǎng)絡(luò)的生物質(zhì)合成反應(yīng)系數(shù)并非整數(shù)。T4M 是基于網(wǎng)絡(luò)的基元模式分析平臺(tái),既可進(jìn)行基元模式分析,也可以進(jìn)行比較,其代謝網(wǎng)絡(luò)及基元模式的圖形自動(dòng)輸出還有待優(yōu)化。還需要注意的是,T4M 的輸入和輸出是Metatool 格式,并非SBML 格式,需要先用YANAsquare 等軟件將SMBL 格式轉(zhuǎn)化為Metatool 文件。EFMtool 在Matlab 中運(yùn)行,可以計(jì)算基因組尺度代謝網(wǎng)絡(luò)模型,但不是圖形界面文件,略顯不便。OptFlux也是用Java 開發(fā)的軟件,可以計(jì)算基元模式,然而其他的代謝途徑分析功能不多。COBRA 中也有了計(jì)算基元模式的模塊,但是其主要功能還是進(jìn)行代謝網(wǎng)絡(luò)構(gòu)建與代謝通量分析[23]。
基元模式分析在代謝工程與生物過程工程等領(lǐng)域的應(yīng)用可以歸納為以下6個(gè)方面(圖1)。
圖1 基元模式分析的應(yīng)用Fig.1 Applications of elementary mode analysis.
構(gòu)建代謝網(wǎng)絡(luò),計(jì)算基元模式僅是基元模式分析的第一步。還要通過這些基元模式分析代謝途徑的功能。Klamt 等建立了紫色非硫菌紅螺菌電子傳遞鏈的動(dòng)態(tài)網(wǎng)絡(luò)模型[24]。該模型在穩(wěn)態(tài)下包含9條基元模式,分別對(duì)應(yīng)光合成和呼吸過程中的ATP 合成與可逆電子流動(dòng)以及延胡索酸還原。一般情況下,三羧酸循環(huán)、糖酵解和糖異生途徑中沒有將乙酰輔酶A 轉(zhuǎn)化為葡萄糖的基元模式[25]。如果插入異檸檬酸裂合酶和蘋果酸合酶相關(guān)基因,就可以實(shí)現(xiàn)脂肪到葡萄糖的合成?;J娇梢苑治龌蚝铜h(huán)境擾動(dòng)對(duì)微生物的影響。通過基元模式分析發(fā)現(xiàn),厭氧條件下戊糖磷酸化途徑對(duì)克雷伯氏肺炎桿菌以甘油為底物生成1,3-丙二醇有重要影響,而在好氧條件下三羧酸循環(huán)的影響更大;降低氧的消耗速率有利于1,3-丙二醇的合成[26]。Taffs 等將基元模式的概念用于微生物群落中物質(zhì)和能量流動(dòng)的分析[27]。具體分析了美國黃石公園熱泉中光合細(xì)菌、不產(chǎn)氧光合細(xì)菌(綠曲撓菌等)和硫還原細(xì)菌間在白天和夜晚的相互作用,包括生物質(zhì)合成和能量產(chǎn)生以及固氮效率等。通量平衡分析(Flux balance analysis,F(xiàn)BA)是在選擇特定目標(biāo)函數(shù)后通過線性規(guī)劃求取通量平衡分布。如果目標(biāo)函數(shù)是目標(biāo)代謝物最大產(chǎn)率,F(xiàn)BA 預(yù)測得到的目標(biāo)代謝產(chǎn)物產(chǎn)率往往都偏高,而通過基元模式分析可以解釋植物乳桿菌的實(shí)驗(yàn)室適應(yīng)性進(jìn)化[28]。除了應(yīng)用到細(xì)菌和酵母的代謝途徑分析,基元模式分析在微藻生物燃料的分析中也可以發(fā)揮作用[29-30]。小球藻先進(jìn)行自養(yǎng)固定CO2,再進(jìn)行異養(yǎng)產(chǎn)油。其中包括Rubisco 途徑的基元模式得到強(qiáng)化,可以解釋為何產(chǎn)油效率的提高[29]。Rugen 等根據(jù)文獻(xiàn)上的目標(biāo)函數(shù)對(duì)代謝通量進(jìn)行分解,分析了萊茵衣藻光合自養(yǎng)條件下的代謝,結(jié)果表明光輸入在代謝響應(yīng)中有重要作用[30]。
代謝網(wǎng)絡(luò)具有魯棒性(Robustness)或健壯性(Redundancy)。大量的實(shí)驗(yàn)數(shù)據(jù)證明,除個(gè)別關(guān)鍵基因的敲除會(huì)引發(fā)嚴(yán)重后果,多數(shù)的單基因敲除操作僅會(huì)明顯改變代謝網(wǎng)絡(luò)的局部代謝通量分布,而對(duì)網(wǎng)絡(luò)整體的影響不大。生命體可以通過調(diào)控來降低基因敲除的影響,維持自身的穩(wěn)定。這也是生命體在長期進(jìn)化發(fā)展中逐步形成的。代謝網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性是其魯棒性的基礎(chǔ)之一。代謝網(wǎng)絡(luò)的魯棒性可以由網(wǎng)絡(luò)結(jié)構(gòu)及其動(dòng)力學(xué)、基于優(yōu)化的方法和代謝途徑分析等計(jì)算[31]。在代謝網(wǎng)絡(luò)中,由某底物到某產(chǎn)物的基元模式通常有很多,這就保證其特定的功能不會(huì)被輕易地破壞。在特定生理?xiàng)l件下,只有少量基元模式具有顯著活性。多數(shù)基元模式看似冗余,卻有可能在基因和環(huán)境擾動(dòng)情況下被激活,是生物體維護(hù)自身穩(wěn)定的需要。基元模式數(shù)目可以作為標(biāo)度網(wǎng)絡(luò)魯棒性的一個(gè)指標(biāo),隨著基因[32]或路徑[33]敲除數(shù)目的增加,魯棒性自然降低。最小切割子集也可以表示網(wǎng)絡(luò)的冗余性。Haus 等最早開發(fā)的算法是先計(jì)算基元模式,再計(jì)算最小切割子集,計(jì)算步驟多[34]。在新算法中由代謝網(wǎng)絡(luò)結(jié)構(gòu)信息直接計(jì)算最小切割子集,耗時(shí)大大減少[35]。生物或催化系統(tǒng)的冗余性和穩(wěn)定性聯(lián)系緊密。在一個(gè)簡單的自維持系統(tǒng)中,三個(gè)基元模式有不同的意義,刪除一個(gè)都無法維持系統(tǒng)的穩(wěn)定[36]。
代謝通量可以分解在基元模式上,并表示為基元模式的線性集合。代謝通量分解是代謝網(wǎng)絡(luò)分析的一種重要手段,可以由實(shí)測的代謝通量分布求取基元模式系數(shù),從而判斷該實(shí)驗(yàn)條件下的主要基元模式,并分析代謝網(wǎng)絡(luò)的復(fù)雜行為。根據(jù)熱力學(xué)原理,代謝網(wǎng)絡(luò)內(nèi)部的循環(huán)對(duì)代謝通量沒有貢獻(xiàn)。代謝通量是基元模式的非負(fù)線性組合。
如果矩陣Pexp的秩接近基元模式數(shù),不同目標(biāo)函數(shù)的計(jì)算結(jié)果差別不大;反之,就會(huì)得到差別顯著的解,這就需要目標(biāo)函數(shù)有好的生物學(xué)或者物理學(xué)意義,才能具有良好的適用性。線性規(guī)劃求取基元模式系數(shù)與FBA 相似,最大生物量作為目標(biāo)函數(shù)未必適合所有生物及其生理?xiàng)l件。最小范數(shù)和最小基元模式數(shù)并沒有明確的生物意義。最大基元模式數(shù)假設(shè)在外界擾動(dòng)后代謝網(wǎng)絡(luò)趨向冗余,但是在非零基元模式數(shù)相同的條件下,沒有確定基元模式系數(shù)如何分配。最大信息熵原理廣泛應(yīng)用于物理、化學(xué)和生態(tài)領(lǐng)域,以及生物信息學(xué)中的基因表達(dá)與序列分析。應(yīng)用最大生物量增長、最小范數(shù)和最大信息熵等目標(biāo)函數(shù)一起比較分析中國倉鼠卵巢癌細(xì)胞、大腸桿菌和釀酒酵母的代謝通量分布,最大信息熵原理算法得到最可行的基元模式系數(shù)分布,在酶控通量算法中也可以得到更準(zhǔn)確的代謝通量分布[37]。基元模式系數(shù)的優(yōu)化算法[38-40]見表1。除選擇優(yōu)化中合適的目標(biāo)函數(shù),添加熱力學(xué)信息作為優(yōu)化的附加限制條件,也可以消除不可行的基元模式[40-41]。
熵是系統(tǒng)非均勻性的標(biāo)度,和系統(tǒng)的變化趨勢(shì)相關(guān)。Walschin 等率先分析了代謝途徑熱力學(xué),并關(guān)聯(lián)了基元模式系數(shù)及其燃燒熵[42]。該文的缺陷之一是無法計(jì)算所有胞內(nèi)代謝通量。另外,為得到簡單線性關(guān)系,該文用基元模式家族(Family of elementary mode)的概念簡化了代謝網(wǎng)絡(luò),忽略了生物質(zhì)的合成,用化合物理想狀態(tài)燃燒熵計(jì)算基元途徑集總反應(yīng)的熵,未進(jìn)行生物體系溶液非理想性修正,結(jié)論為大腸桿菌厭氧過程趨向熵最小。之后,該文作者重新進(jìn)行了分析,認(rèn)為代謝網(wǎng)絡(luò)及其進(jìn)化趨向最大化學(xué)熵[43]。最近,他們又對(duì)適應(yīng)進(jìn)化后的最大熵變化進(jìn)行了討論[44-45]。
表1 基元模式系數(shù)優(yōu)化算法Table 1 Optimization algorithms of elementary mode coefficients
本文作者引入最大信息熵(Shannon entropy)優(yōu)化基元模式系數(shù)[37],與酶控通量算法結(jié)合,成功預(yù)測大腸桿菌基因和環(huán)境擾動(dòng)后的代謝通量分布。在欠定和不確定條件下,通過胞外13C 同位素標(biāo)記代謝通量數(shù)據(jù)估算雜交瘤細(xì)胞、枯草芽胞桿菌和大腸桿菌胞內(nèi)代謝通量分布。與其他目標(biāo)函數(shù)相比,可以更為可靠和可行的估算胞內(nèi)代謝通量分布[46]。再應(yīng)用拉格朗日算子來最大化基于熵的目標(biāo)函數(shù),分析求解基元模式系數(shù)[47]。用最大熵原理優(yōu)化基元模式系數(shù)闡明了基元模式與代謝通量的關(guān)系,基元模式反映了代謝網(wǎng)絡(luò)的微觀性質(zhì),代謝通量反映了代謝網(wǎng)絡(luò)的宏觀性質(zhì),宏觀性質(zhì)是微觀性質(zhì)的加合,而且這種加合服從最大信息熵原理。最大熵原理作為目標(biāo)函數(shù)優(yōu)化基元模式系數(shù)為基于基元模式的代謝通量預(yù)測提供了可靠基礎(chǔ)。信息熵與化學(xué)熵的關(guān)系有待深入探索。
圖2是用線性規(guī)劃和最大熵原理求得的釀酒酵母代謝網(wǎng)絡(luò)的基元模式系數(shù)[37]。圖中顏色表示對(duì)應(yīng)基元模式系數(shù)的絕對(duì)偏差。在原文獻(xiàn)中以柱狀圖表示取得的基元模式系數(shù),而圖2可以反映這些基元模式系數(shù)的差異。可以看出兩個(gè)目標(biāo)函數(shù)求取的多數(shù)基元模式系數(shù)值很低,因此偏差也小,表現(xiàn)為白色。最大熵原理求得的第31條基元模式的系數(shù)最大,而二次規(guī)劃求得的第28條基元模式的系數(shù)最大,但是這兩個(gè)基元模式系數(shù)差別較大,在圖中表現(xiàn)為深色條帶。
圖2 最大熵原理(MEP)和二次規(guī)劃(QP)求取基元模式系數(shù)(釀酒酵母,μ=0.3)Fig.2 Elementary mode coefficients calculated by Maximum Entropy Principle (MEP) and Quadratic Programming(QP) for S.cerevisiae (μ=0.3).
在系統(tǒng)生物學(xué)中,有約束代謝通量分析用以考察代謝產(chǎn)物分布以及代謝網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)等。代謝通量可以通過動(dòng)態(tài)或穩(wěn)態(tài)模型計(jì)算。動(dòng)態(tài)模型需要大量實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)動(dòng)態(tài)模型參數(shù),一般來說包括的生化反應(yīng)數(shù)少。代謝控制分析被用于關(guān)聯(lián)酶活和代謝通量的關(guān)系。代謝控制分析的缺點(diǎn)是需要大量、準(zhǔn)確的實(shí)驗(yàn)數(shù)據(jù)或者代謝網(wǎng)絡(luò)內(nèi)部所有生化反應(yīng)的動(dòng)力學(xué)方程。因此,目前局限在簡單代謝途徑或小尺度的代謝網(wǎng)絡(luò)分析中。
有約束代謝通量分析是常用的代謝網(wǎng)絡(luò)穩(wěn)態(tài)分析方法,特別是FBA。在基因組尺度的代謝網(wǎng)絡(luò)分析中,F(xiàn)BA 成功地用于大腸桿菌、釀酒酵母、枯草芽胞桿菌等微生物,中國倉鼠卵巢癌細(xì)胞(CHO)和幼鼠腎細(xì)胞(BHK)等動(dòng)物細(xì)胞和小球藻等植物細(xì)胞的代謝網(wǎng)絡(luò)分析。FBA 計(jì)算簡單,應(yīng)用廣泛,問題是必須事先指定目標(biāo)函數(shù),再通過線性規(guī)劃求取代謝通量分布。最大生物量增長可以作為目標(biāo)函數(shù)計(jì)算大腸桿菌等微生物的代謝通量分布,并能與實(shí)驗(yàn)數(shù)據(jù)基本符合。但是這個(gè)目標(biāo)函數(shù)不能適用于全部的生命體,以及一些生物體的不同生長階段。比如,人的紅細(xì)胞本身就不進(jìn)行生物質(zhì)合成,無法選擇最大生物量作為目標(biāo)函數(shù)。微藻在正常培養(yǎng)和氮缺乏條件下的生物質(zhì)中糖、蛋白質(zhì)和脂類等主要組成發(fā)生顯著變化,特別是氮脅迫后生物質(zhì)合成受到抑制。以最大生物量增長為目標(biāo)函數(shù)顯然不適合確定微藻不同調(diào)控狀態(tài)下其生物質(zhì)內(nèi)糖、蛋白質(zhì)和脂類的具體分配。另外,最大ATP 利用等基于生物學(xué)假設(shè)的目標(biāo)函數(shù)的通用性還要考察。
基于基元模式分析的代謝通量算法研究是目前代謝工程領(lǐng)域的新增長點(diǎn)。酶控通量算法(Enzyme control flux)[48]集成酶活數(shù)據(jù)和野生株代謝通量數(shù)據(jù)預(yù)測突變體的代謝通量分布。與FBA 不同,不需事先指定目標(biāo)函數(shù),可以集成實(shí)驗(yàn)數(shù)據(jù)對(duì)代謝網(wǎng)絡(luò)進(jìn)行分析?;蚋淖兺克惴?Genetic modification of flux)[49]聯(lián)系代謝網(wǎng)絡(luò)結(jié)構(gòu)、功能和調(diào)控,對(duì)酶活改變后的代謝通量分布進(jìn)行預(yù)測,與實(shí)驗(yàn)報(bào)道符合良好?;蚋淖兺克惴ǖ暮诵氖怯梢吧旰屯蛔凅w的相對(duì)基因表達(dá)和野生株基元模式系數(shù)預(yù)測突變體的基元模式系數(shù),進(jìn)而預(yù)測突變體的代謝通量分布。該算法可在基元模式水平上定量理解由于基因或環(huán)境擾動(dòng)造成的代謝或生理狀態(tài)的變化[47]。同時(shí)也說明了酶控通量算法是集成酶活數(shù)據(jù)預(yù)測代謝通量分布的可行框架。
疫苗和基因重組藥物主要來自于微生物和動(dòng)物細(xì)胞的生物反應(yīng)器培養(yǎng)。生物過程的動(dòng)態(tài)模擬是過程分析、檢測和控制的重要工具。生物過程是復(fù)雜的,除了受外界環(huán)境因素的影響,生命體本身也具有自我調(diào)節(jié)作用。經(jīng)驗(yàn)?zāi)P屯荒軌蚍从成镞^程的內(nèi)部規(guī)律。目前的檢測技術(shù)測定的代謝物有限,在線測定胞內(nèi)代謝物的變化也有困難。隨著基因組技術(shù)的完善,對(duì)生物代謝過程的了解不斷深入?;J揭彩巧镞^程建模的手段之一。
除了內(nèi)部循環(huán),每個(gè)基元模式都有一個(gè)集總反應(yīng)來表示該條基元模式從外源底物到外源產(chǎn)物的計(jì)量關(guān)系。這些集總反應(yīng)從基因水平描述了生物過程的可能途徑,為建立代謝網(wǎng)絡(luò)動(dòng)態(tài)模型和生物過程模型提供了基礎(chǔ)[50]。建立生物過程模型需要有準(zhǔn)確的計(jì)量學(xué)代謝網(wǎng)絡(luò)模型,通過基元模式分析確定外部代謝物構(gòu)成的集總反應(yīng),再經(jīng)過簡化建立宏觀反應(yīng)模型,最后由實(shí)驗(yàn)數(shù)據(jù)擬合動(dòng)力學(xué)參數(shù),得到動(dòng)力學(xué)模型。目前,基于基元模式的生物過程動(dòng)態(tài)模型已成功應(yīng)用于CHO 細(xì)胞[51]、雜交瘤細(xì)胞[52]和BHK 細(xì)胞[53]等的反應(yīng)器培養(yǎng)過程,用以生產(chǎn)單克隆抗體或重組融合糖蛋白。目前這些基于基元模式的生物過程模型都是單細(xì)胞模型,也未考慮細(xì)胞周期的影響。
普度大學(xué)Ramkrishna 教授建立了基元模式和控制論變量的混合模型[54-59]。這類模型的特點(diǎn)是通過控制論描述外部代謝物的動(dòng)態(tài)變化,而由基元模式估算穩(wěn)態(tài)下的胞內(nèi)代謝通量分布。他們首先用包含23個(gè)反應(yīng)的代謝網(wǎng)絡(luò)模型分析了大腸桿菌GJT001的厭氧代謝,與通量平衡分析比較可以更好地預(yù)測琥珀酸的生產(chǎn)[54]。并預(yù)測了大腸桿菌pta-ackA 基因敲除突變株YBS121的厭氧發(fā)酵過程,以及基因擾動(dòng)對(duì)3株表達(dá)外源基因的大腸桿菌突變體的影響(表達(dá)博伊丁假絲酵母Candida boidinii 的fdh1基因、pta-ackA 敲除同時(shí)外源插入枯草芽胞桿菌 alsS 基因,以及adhE-idhA 敲除同時(shí)外源插入乳酸乳球菌pyc 基因),可以與實(shí)驗(yàn)結(jié)果較好吻合,問題是所用的大腸桿菌模型僅有12個(gè)反應(yīng)[55]。由于采用的大腸桿菌模型過于簡單,他們又分析了釀酒酵母在葡萄糖和木糖雙底物條件下的發(fā)酵[56],與宏觀反應(yīng)模型(MBMs)和動(dòng)態(tài)通量平衡分析(dFBA)相比,混合控制論模型(HCM)可更清晰地闡述代謝控制機(jī)制。釀酒酵母的代謝網(wǎng)絡(luò)包含38個(gè)反應(yīng),反應(yīng)數(shù)增加一般來說基元模式數(shù)也會(huì)增加,會(huì)造成過參數(shù)化的問題。他們用產(chǎn)率分析算法[14]對(duì)基元模式做簡化,降低需要擬合的參數(shù)。之后他們又開發(fā)了集總混合控制論模型(L-HCM),將經(jīng)典的集總控制論模型和HCM 結(jié)合在一起,從有限的數(shù)據(jù)預(yù)測釀酒酵母(代謝網(wǎng)絡(luò)模型包含53個(gè)反應(yīng))的好氧發(fā)酵[57]。進(jìn)一步修改集總權(quán)重的計(jì)算方式并將L-HCM 推廣到大腸桿菌(代謝網(wǎng)絡(luò)模型包含67個(gè)反應(yīng))的厭氧生長[58]。最近,該模型又研究了真氧產(chǎn)堿桿菌(代謝網(wǎng)絡(luò)模型包含36個(gè)反應(yīng))合成聚羥基丁脂的情況,認(rèn)為多穩(wěn)態(tài)在實(shí)際中發(fā)生的可能性很小[59]。這類基于基元模式的混合模型在預(yù)測代謝行為上有一定的優(yōu)越性,但是和dFBA 相比還無法用到基因組尺度的代謝網(wǎng)絡(luò)模型上,主要原因還是基元模式的組合爆炸問題。
生物網(wǎng)絡(luò)結(jié)構(gòu)、功能、調(diào)控間存在緊密的聯(lián)系??刂朴行?Control effective flux)是基于基元模式的算法,僅僅需要代謝網(wǎng)絡(luò)結(jié)構(gòu)信息就可以關(guān)聯(lián)環(huán)境條件擾動(dòng)(如底物由葡萄糖換成乙酸、乳酸或乙醇)后轉(zhuǎn)錄水平的變化[60]。本文作者將控制有效通量算法用于基因擾動(dòng),比如大腸桿菌的基因敲除,同樣可以得到較滿意的關(guān)聯(lián)結(jié)果[49]。為提高關(guān)聯(lián)精度還可以改進(jìn)算法,如使用更大規(guī)模的代謝網(wǎng)絡(luò)、根據(jù)不同的培養(yǎng)條件選擇主要的基元模式等[60]??刂朴行克惴ǖ木窒夼c代謝網(wǎng)絡(luò)結(jié)構(gòu)有關(guān),比如仍無法區(qū)分同工酶。Schuster 等首先否定了代謝網(wǎng)絡(luò)向分子產(chǎn)率最大的方向進(jìn)化[61]。Jens Nielsen 和合作者提出應(yīng)用基于化學(xué)熵的算法選擇釀酒酵母代謝過程中控制通量的關(guān)鍵酶[62]。最大化學(xué)熵和最大信息熵有相似的形式。信息熵在沒有足夠信息的情況下適用,而化學(xué)熵要對(duì)含生物體系溶液進(jìn)行非理想性修正,否則可能會(huì)影響預(yù)測結(jié)果的準(zhǔn)確性。代謝途徑的熵分析已經(jīng)引起很多專家的重視,值得深入研究。
環(huán)境因子對(duì)生物的影響也是顯著的。大量研究專注于基因功能和基因-基因相互作用,而基因和環(huán)境的相互作用研究卻不多。這些影響可以從多方面進(jìn)行考慮。比如,細(xì)胞培養(yǎng)過程中存在不同生理狀態(tài),而這樣的狀態(tài)與培養(yǎng)基中細(xì)胞分泌的代謝物濃度等存在一定聯(lián)系。環(huán)境組引導(dǎo)的潛在途徑投影算法(Envirome-guided projection to latent pathways)用基元模式描述細(xì)胞功能,關(guān)聯(lián)BHK 細(xì)胞在不同培養(yǎng)條件的27個(gè)動(dòng)態(tài)環(huán)境數(shù)據(jù)(溫度、pH,滲透壓和24個(gè)胞外代謝物濃度)可以獲得在統(tǒng)計(jì)學(xué)上最顯著的基元模式[63]。而Carlson 探討了每個(gè)基元模式的成本效益與大腸桿菌復(fù)雜行為的關(guān)系[64]。這里的成本效益主要是指生成1摩爾生物質(zhì)消耗的葡萄糖(電子供體)和生成1摩爾生物質(zhì)消耗的氧(電子配體)。Wessely 等組合基元通量趨勢(shì)、網(wǎng)絡(luò)推斷和動(dòng)態(tài)優(yōu)化等方法,集成基因組和蛋白質(zhì)組等數(shù)據(jù),發(fā)現(xiàn)大腸桿菌的轉(zhuǎn)錄調(diào)控與每條基元模式上的蛋白投資相關(guān)并且存在不同的調(diào)控機(jī)制[65]。集合基因序列信息和基元模式,萊茵衣藻氮代謝的生理周期代謝調(diào)控機(jī)制最近也取得了進(jìn)展[66]。探索代謝調(diào)控機(jī)理,綜合反映基因和環(huán)境擾動(dòng)對(duì)代謝網(wǎng)絡(luò)的影響,也可以為菌株和藻株的突變體設(shè)計(jì)提供參考。
突變體構(gòu)建的策略包括敲除副產(chǎn)物的合成基因、構(gòu)建新的代謝途徑、調(diào)控代謝通量在關(guān)鍵節(jié)點(diǎn)的分布等。可以通過分子生物學(xué)手段實(shí)現(xiàn)單基因敲除、多基因敲除、基因的過量表達(dá)等。以往的研究通常把代謝途徑上的第一個(gè)酶作為關(guān)鍵或限速步驟,比如過量表達(dá)微藻油脂合成中的乙酰輔酶A 羧化酶卻又效果不大。基元模式分析為菌株改造提供了理論框架,利用系統(tǒng)生物學(xué)原理,從代謝網(wǎng)絡(luò)整體出發(fā),計(jì)算基因工程改造與目標(biāo)代謝產(chǎn)物產(chǎn)率的關(guān)系,尋找基因工程改造的目的基因。已成功應(yīng)用大腸桿菌、枯草芽胞桿菌和克雷伯氏肺炎桿菌的改造[67-73]。敲除乳酸脫氫酶和丙酮酸脫氫酶復(fù)合體的枯草芽胞桿菌突變體,其異丁醇的產(chǎn)率可以達(dá)到理論值的61%,是野生株的2.3倍[68];大腸桿菌多基因敲除突變體以甘油為底物,每升可產(chǎn)乙醇40 g,是理論值的90%[70];大腸桿菌多基因敲除突變體的類胡蘿卜素產(chǎn)率是野生株的4倍[71]。這些實(shí)例都說明,基元模式菌株設(shè)計(jì)是有效的(詳見表2)。
基于基元模式分析的菌株設(shè)計(jì)策略有兩類。一類是先構(gòu)筑代謝網(wǎng)絡(luò)模型,計(jì)算基元模式;再對(duì)基元模式進(jìn)行分類,保留能夠進(jìn)行生物質(zhì)合成同時(shí)生產(chǎn)目標(biāo)產(chǎn)物的基元模式,敲除其他副產(chǎn)物的基元模式。如果代謝網(wǎng)絡(luò)模型很大,代謝產(chǎn)物很多,按照這種方法需要敲除的基因過多。而且一般來說,這類策略敲除的是代謝副產(chǎn)物合成基因。另一類就不僅僅關(guān)注副產(chǎn)物的合成基因。通過分析每條基元模式的目標(biāo)產(chǎn)物產(chǎn)率,以提高目標(biāo)產(chǎn)物整體產(chǎn)率和保證生物質(zhì)合成為目標(biāo),在全網(wǎng)絡(luò)范圍內(nèi)搜索目的基因。文獻(xiàn)[74]提出了一種基于整數(shù)算法的優(yōu)化策略,敲除目的基因提高大腸桿菌生產(chǎn)乙醇的產(chǎn)率(5010個(gè)基元模式)。Flux Design 通過統(tǒng)計(jì)關(guān)聯(lián),尋找目的代謝產(chǎn)物高表達(dá)的過量表達(dá)或敲除基因,并以谷氨酸棒桿菌(60個(gè)反應(yīng))和黑曲霉(220個(gè)反應(yīng))為例分別考察了賴氨酸和酶的生產(chǎn)[75]。CASOP 通過基元模式評(píng)價(jià)反應(yīng)重要性來選擇過量表達(dá)和敲除的目的基因來提高產(chǎn)率,該文以107個(gè)反應(yīng)的大腸桿菌模型為例考察了琥珀酸的過量生產(chǎn)[76]。Flux Design 和CASOP 僅能提供定性的描述,而本文作者開發(fā)的基因改變通量算法可以定量地描述基因過量表達(dá)、部分或完全失活后的代謝通量分布[49]。優(yōu)化菌株設(shè)計(jì)準(zhǔn)則,提高突變體代謝通量的定量預(yù)測能力,是下一步要研究的內(nèi)容。建議綜合多個(gè)軟件或算法的優(yōu)化結(jié)果選擇改造的候選目的基因。
表2 基元模式分析菌株設(shè)計(jì)實(shí)例Table 2 Examples of Strain Design by EMA
最初,基元模式和極端途徑主要用于代謝網(wǎng)絡(luò)的分析,并且有了廣泛的應(yīng)用。將代謝網(wǎng)絡(luò)的分析方法拓展到基因調(diào)控網(wǎng)絡(luò)和信號(hào)傳導(dǎo)網(wǎng)絡(luò),也是系統(tǒng)生物學(xué)的最新進(jìn)展。如果用有向圖來描述基因調(diào)控網(wǎng)絡(luò),其節(jié)點(diǎn)是基因,而邊是基因間的相互作用;對(duì)信號(hào)傳導(dǎo)網(wǎng)絡(luò),節(jié)點(diǎn)是信號(hào)分子,而邊是布爾邏輯關(guān)系,表達(dá)激活或抑制;代謝網(wǎng)絡(luò)中的節(jié)點(diǎn)是代謝物,而邊是生化反應(yīng)。代謝網(wǎng)絡(luò)的顯著特點(diǎn)是質(zhì)量平衡,而信號(hào)傳導(dǎo)是信息的流動(dòng)。在CellNetAnzlyzer 中,就可以構(gòu)建和分析T 細(xì)胞的信號(hào)傳導(dǎo)網(wǎng)絡(luò)[18,22]。信號(hào)傳導(dǎo)網(wǎng)絡(luò)較代謝網(wǎng)絡(luò)復(fù)雜,還需要設(shè)計(jì)新的算法計(jì)算信息流分布,并集成信號(hào)傳導(dǎo)網(wǎng)絡(luò)和代謝網(wǎng)絡(luò)系統(tǒng)分析信號(hào)傳導(dǎo)與代謝的關(guān)系。
基元模式已經(jīng)成為系統(tǒng)生物學(xué)研究的重要平臺(tái)工具。研究對(duì)象從代謝網(wǎng)絡(luò)發(fā)展到信號(hào)傳導(dǎo)網(wǎng)絡(luò);研究尺度從基因到生物過程以及生態(tài)系統(tǒng);數(shù)學(xué)描述從穩(wěn)態(tài)分解到動(dòng)態(tài)解析;研究領(lǐng)域從微生物代謝到人類疾病。
基元模式分析的基礎(chǔ)是準(zhǔn)確、完備的代謝網(wǎng)絡(luò)信息。代謝網(wǎng)絡(luò)模型越充實(shí),相對(duì)而言可以更準(zhǔn)確的描述生命系統(tǒng),基元模式的組合爆炸問題也會(huì)更突出,這也是限制基元模式分析應(yīng)用的主要因素。通過改進(jìn)算法可以提高計(jì)算速度,但分析這些基元模式仍是困難的。根據(jù)研究體系的需要,選擇適當(dāng)規(guī)模的代謝網(wǎng)絡(luò)模型,或者根據(jù)添加限制條件,選擇最關(guān)鍵的基元模式加以分析是較為可行的方法。以基元模式為基礎(chǔ),結(jié)合組學(xué)數(shù)據(jù)和熱力學(xué)等限制條件,可以深入理解代謝調(diào)控規(guī)律和構(gòu)建新的代謝途徑。基于基元模式的菌株設(shè)計(jì)算法取得了一定進(jìn)展。集成野生株實(shí)驗(yàn)數(shù)據(jù)可以簡化代謝網(wǎng)絡(luò)結(jié)構(gòu),更有針對(duì)性地尋找基因工程改造的目的基因,提高菌株設(shè)計(jì)效率。相信基元模式分析在生物網(wǎng)絡(luò)和途徑分析中將會(huì)有更多的應(yīng)用。
[1]Hao T,Ma HW,Zhao XM.Progress in automatic reconstruction and analysis tools of genome-scale metabolic network.Chin J Biotech,2012,28(6):661?670(in Chinese).郝彤,馬紅武,趙學(xué)明.基因組尺度代謝網(wǎng)絡(luò)自動(dòng)重構(gòu)及分析工具研究進(jìn)展.生物工程學(xué)報(bào),2012,28(6):661?670.
[2]Wang H,Ma HW,Zhao XM.Progress in genome-scale metabolic network:a review.Chin J Biotech,2010,26(10):1340?1348(in Chinese).王暉,馬紅武,趙學(xué)明.基因組尺度代謝網(wǎng)絡(luò)研究進(jìn)展.生物工程學(xué)報(bào),2010,26(10):1340?1348.
[3]Liu LM,Chen J.Reconstruction and application of genome-scale metabolic network model.Chin J Biotech 2010,26(9):1176?1186(in Chinese).劉立明,陳堅(jiān).基因組規(guī)模代謝網(wǎng)絡(luò)模型構(gòu)建及其應(yīng)用.生物工程學(xué)報(bào),2010,26(9):1176?1186.
[4]Llaneras F,Pico J.Which metabolic pathways generate and characterize the flux space? A comparison among elementary modes,extreme pathways and minimal generators.J Biomed Biotechnol,2010,753904.
[5]Trinh CT,Wlaschin A,Srienc F.Elementary mode analysis:a useful metabolic pathway analysis tool for characterizing cellular metabolism.Appl Microbiol Biotechnol,2009,81(5):813?826.
[6]Ip K,Colijn C,Lun DS.Analysis of complex metabolic behavior through pathway decomposition.BMC Syst Biol,2011,5:91.
[7]Terzer M,Stelling J.Large-scale computation of elementary flux modes with bit pattern trees.Bioinformatics,2008,24(19):2229?2235.
[8]Jevremovic D,Trinh CT,Srienc F,et al.Parallelization of nullspace algorithm for the computation of metabolic pathways.Parallel Comput,2011,37(6/7):261?278.
[9]Acuna V,Chierichetti F,Lacroix V,et al.Modes and cuts in metabolic networks:Complexity and algorithms.Biosystems,2009,95(1):51?60.
[10]Acuna V,Marchetti-Spaccamela A,Sagot MF,et al.A note on the complexity of finding and enumerating elementary modes.Biosystems,2010,99(3):210?214.
[11]Schwartz JM,Gaugain C,Nacher JC,et al.Observing metabolic functions at the genome scale.Genome Biol,2007,8(6):R123.
[12]Kaleta C,de Figueiredo LF,Schuster S.Can the whole be less than the sum of its parts? Pathway analysis in genome-scale metabolic networks using elementary flux patterns.Genome Res,2009,19(10):1872?1883.
[13]de Figueiredo LF,Podhorski A,Rubio A,et al.Computing the shortest elementary flux modes in genome-scale metabolic networks.Bioinformatics,2009,25(23):3158?3165.
[14]Song HS,Ramkrishna D.Reduction of a set of elementary modes using yield analysis.Biotechnol Bioeng,2009,102(2):554?568.
[15]Rezola A,de Figueiredo LF,Brock M,et al.Exploring metabolic pathways in genome-scale networks via generating flux modes.Bioinformatics,2011,27(4):534?540.
[16]Peres S,Vallee F,Beurton-Aimar M,et al.ACoM:A classification method for elementary flux modes based on motif finding.Biosystems,2011,103(3):410?419.
[17]Ferreira AR,Dias JM,Teixeira AP,et al.Projection to latent pathways (PLP):a constrained projection to latent variables (PLS) method for elementary flux modes discrimination.BMC Syst Biol,2011,5:181.
[18]Klamt S,Saez-Rodriguez J,Gilles ED.Structural and functional analysis of cellular networks with CellNetAnalyzer.BMC Syst Biol,2007,1:2.
[19]Rocha I,Maia P,Evangelista P,et al.OptFlux:an open-source software platform for in silico metabolic engineering.BMC Syst Biol,2010,4:45.
[20]Schwarz R,Liang C,Kaleta C,et al.Integrated network reconstruction,visualization and analysis using YANAsquare.BMC Bioinformatics,2007,8:313.
[21]Xavier D,Vazquez S,Higuera C,et al.Tools-4-Metatool (T4M):online suite of web-tools to process stoichiometric network analysis data from Metatool.Biosystems,2011,105(2):169-172.
[22]Klamt S,von Kamp A.An application programming interface for CellNetAnalyzer.Biosystems,2011,105(2):162?168.
[23]Lewis NE,Nagarajan H,Palsson BO.Constraining the metabolic genotype-phenotype relationship using a phylogeny of in silico methods.Nat Rev Microbiol,2012,10(4):291?305.
[24]Klamt S,Grammel H,Straube R,et al.Modeling the electron transport chain of purple non-sulfur bacteria.Mol Syst Biol,2008,4:156.
[25]de Figueiredo LF,Schuster S,Kaleta C,et al.Can sugars be produced from fatty acids? A test case for pathway analysis tools.Bioinformatics,2008,24(22):2615?2621.
[26]Zhang Q,Xiu Z.Metabolic pathway analysis of glycerol metabolism in Klebsiella pneumoniae incorporating oxygen regulatory system.Biotechnol Prog,2009,25(1):103?115.
[27]Taffs R,Aston JE,Brileya K,et al.In silico approaches to study mass and energy flows in microbial consortia:a syntrophic case study.BMC Syst Biol,2009,3:114.
[28]Teusink B,Wiersma A,Jacobs L,et al.Understanding the adaptive growth strategy of Lactobacillus plantarum by in silico optimisation.PLoS Comput Biol,2009,5(6):e1000410.
[29]Xiong W,Gao C,Yan D,et al.Double CO2fixation in photosynthesis-fermentation model enhances algal lipid synthesis for biodiesel production.Bioresour Technol,2010,101(7):2287?2293.
[30]Rugen M,Bockmayr A,Legrand J,et al.Network reduction in metabolic pathway analysis:elucidation of the key pathways involved in the photoautotrophic growth of the green alga Chlamydomonas reinhardtii.Metab Eng,2012,14(4):458?467.
[31]Larhlimi A,Blachon S,Selbig J,et al.Robustness of metabolic networks:a review of existing definitions.Biosystems,2011,106(1):1?8.
[32]Behre J,Wilhelm T,von Kamp A,et al.Structural robustness of metabolic networks with respect to multiple knockouts.J Theor Biol,2008,252(3):433?441.
[33]Min Y,Jin X,Chen M,et al.Pathway knockout and redundancy in metabolic networks.J Theor Biol,2011,270(1):63?69.
[34]Haus UU,Klamt S,Stephen T.Computing knock-out strategies in metabolic networks.J Comput Biol,2008,15(3):259?268.
[35]Ballerstein K,von Kamp A,Klamt S,et al.Minimal cut sets in a metabolic network are elementary modes in a dual network.Bioinformatics,2012,28(3):381?387.
[36]Piedrafita G,Montero F,Moran F,et al.A simple self-maintaining metabolic system:robustness,autocatalysis,bistability.PLoS Comput Biol,2010,6(8):e1000872.
[37]Zhao QY,Kurata H.Maximum entropy decomposition of flux distribution at steady state to elementary modes.J Biosci Bioeng,2009,107(1):84?89.
[38]Orman MA,Berthiaume F,Androulakis IP,et al.Pathway analysis of liver metabolism under stressed condition.J Theor Biol,2011,272(1):131?140.
[39]Chan SHJ,Ji P.Decomposing flux distributions into elementary flux modes in genome-scale metabolic networks.Bioinformatics,2011,27(16):2256?2262.
[40]Orman MA,Androulakis IP,Berthiaume F,et al.Metabolic network analysis of perfused livers under fed and fasted states:incorporating thermodynamic and futile-cycle-associated regulatory constraints.J Theor Biol,2012,293:101?110.
[41]Jol SJ,Kummel A,Terzer M,et al.System-level insights into yeast metabolism by thermodynamic analysis of elementary flux modes.PLoS Comput Biol,2012,8(3):e1002415.
[42]Wlaschin AP,Trinh CT,Carlson R,et al.The fractional contributions of elementary modes to the metabolism of Escherichia coli and their estimation from reaction entropies.Metab Eng,2006,8(4):338?352.
[43]Srienc F,Unrean P.A statistical thermodynamical interpretation of metabolism.Entropy,2010,12(8):1921?1935.
[44]Unrean P,Srienc F.Metabolic networks evolve towards states of maximum entropy production.Metab Eng,2011,13(6):666?673.
[45]Unrean P,Srienc F.Predicting the adaptive evolution of Thermoanaerobacterium saccharolyticum.J Biotechnol,2012,158(4):259?266.
[46]Zhao QY,Kurata H.Estimation of intracellular flux distribution under underdetermined and uncertain conditions by maximum entropy principle.Chin J Biotech,2008,24(12):2135?2136(in Chinese).趙權(quán)宇,倉田博之.欠定和不確定條件下胞內(nèi)代謝通量的最大熵原理估算.生物工程學(xué)報(bào),2008,24(12):2135?2136.
[47]Zhao QY,Kurata H.Use of maximum entropy principle with Lagrange multipliers extends the feasibility of elementary mode analysis.J Biosci Bioeng,2010,110(2):254?261.
[48]Kurata H,Zhao Q,Okuda R,et al.Integration of enzyme activities into metabolic flux distributions by elementary mode analysis.BMC Syst Biol,2007,1:31.
[49]Zhao Q,Kurata H.Genetic modification of flux for flux prediction of mutants.Bioinformatics 2009,25(13):1702?1708.
[50]Rohwer JM.Kinetic modelling of plant metabolic pathways.J Exp Bot,2012,63(6):2275?2292.
[51]Gao J,Gorenflo VM,Scharer JM,et al.Dynamic metabolic modeling for a MAB bioprocess.Biotechnol Prog,2007,23(1):168?181.
[52]Dorka P,Fischer C,Budman H,et al.Metabolic flux-based modeling of mAb production during batch and fed-batch operations.Bioprocess Biosyst Eng,2008,32(2):183?196.
[53]Teixeira AP,Alves C,Alves PM,et al.Hybrid elementary flux analysis/nonparametric modeling:application for bioprocess control.BMC Bioinformatics,2007,8:30.
[54]Kim JI,Varner JD,Ramkrishna D.A hybrid model of anaerobic E.coli GJT001:combination of elementary flux modes and cybernetic variables.Biotechnol Prog,2008,24(5):993?1006.
[55]Young JD,Henne KL,Morgan JA,et al.Integrating cybernetic modeling with pathway analysis provides a dynamic,systems-level description of metabolic control.Biotechnol Bioeng,2008,100(3):542?559.
[56]Song HS,Morgan JA,Ramkrishna D.Systematic development of hybrid cybernetic models:Application to recombinant yeast co-consuming glucose and xylose.Biotechnol Bioeng,2009,103(5):984?1002.
[57]Song HS,Ramkrishna D.Prediction of metabolic function from limited data:Lumped hybrid cybernetic modeling (L-HCM).Biotechnol Bioeng,2010,106(2):271?284.
[58]Song HS,Ramkrishna D.Cybernetic models based on lumped elementary modes accurately predict strain-specific metabolic function.Biotechnol Bioeng,2011,108(1):127?140.
[59]Franz A,Song HS,Ramkrishna D,et al.Experimental and theoretical analysis of poly(beta-hydroxybutyrate)formation and consumption in Ralstonia eutropha.Biochem Eng J,2011,55(1):49?58.
[60]Cakir T,Kirdar B,Onsan ZI,et al.Effect of carbon source perturbations on transcriptional regulation of metabolic fluxes in Saccharomyces cerevisiae.BMC Syst Biol,2007,1:18.
[61]Schuster S,Pfeiffer T,Fell DA.Is maximization of molar yield in metabolic networks favoured by evolution? J Theor Biol,2008,252(3):497?504.
[62]Bordel S,Nielsen J.Identification of flux control in metabolic networks using non-equilibrium thermodynamics.Metab Eng,2010,12(4):369?377.
[63]Teixeira AP,Dias JML,Carinhas N,et al.Cell functional enviromics:unravelling the function of environmental factors.BMC Syst Biol,2011,5:92.
[64]Carlson RP.Decomposition of complex microbial behaviors into resource-based stress responses.Bioinformatics,2009,25(1):90?97.
[65]Wessely F,Bartl M,Guthke R,et al.Optimal regulatory strategies for metabolic pathways in Escherichia coli depending on protein costs.Mol Syst Biol,2011,7:515.
[66]Schauble S,Heiland I,Voytsekh O,et al.Predicting the physiological role of circadian metabolic regulation in the green alga Chlamydomonas reinhardtii.PLoS ONE,2011,6(8):e23026.
[67]Trinh CT.Elucidating and reprogramming Escherichia coli metabolisms for obligate anaerobic n-butanol and isobutanol production.Appl Microbiol Biotechnol,2012,95(4):1083?1094.
[68]Li S,Huang D,Li Y,et al.Rational improvement of the engineered isobutanol-producing Bacillus subtilis by elementary mode analysis.Microb Cell Fact,2012,11(1):101.
[69]Chen Z,Liu H,Liu D.Metabolic pathway analysis of 1,3-propanediol production with a genetically modified Klebsiella pneumoniae by overexpressing an endogenous NADPH-dependent alcohol dehydrogenase.Biochem Eng J,2011,54(3):151?157.
[70]Trinh CT,Srienc F.Metabolic engineering of Escherichia coli for efficient conversion of glycerol to ethanol.Appl Environ Microbiol,2009,75(21):6696?6705.
[71]Unrean P,Trinh CT,Srienc F.Rational design and construction of an efficient E.coli for production of diapolycopendioic acid.Metab Eng,2010,12(2):112?122.
[72]Kenanov D,Kaleta C,Petzold A,et al.Theoretical study of lipid bio-synthesis in wild-type Escherichia coli and in a protoplast-type L-form using elementary flux mode analysis.FEBS J,2010,277(4):1023?1034
[73]Trinh CT,Li J,Blanch HW,et al.Redesigning Escherichia coli metabolism for anaerobic production of isobutanol.Appl Environ Microbiol,2011,77(14):4894?4904.
[74]Jungreuthmayer C,Zanghellini J.Designing optimal cell factories:integer programing couples elementary mode analysis with regulation.BMC Syst Biol,2012,6:103.
[75]Melzer G,Esfandabadi ME,Franco-Lara E,et al.Flux design:in silico design of cell factories based on correlation of pathway fluxes to desired properties.BMC Syst Biol,2009,3:120.
[76]Haedicke O,Klamt S.CASOP:A computational approach for strain optimization aiming at high productivity.J Biotechnol,2010,147(2):88?101.