卞星晨, 劉笑芬, 馮美卿, 張 菁,*
基因組規(guī)模代謝模型( genome-scale metabolic model,GSMM) 是通過整合基因組學(xué)、轉(zhuǎn)錄組學(xué)、文獻(xiàn)組學(xué)、蛋白質(zhì)組學(xué)以及代謝組學(xué)等多組學(xué)數(shù)據(jù),建立基因-蛋白質(zhì)(酶)-生化反應(yīng)關(guān)聯(lián)組成的特定微生物代謝網(wǎng)絡(luò)[1]。GSMM將從基因組獲得的生化反應(yīng)信息與代謝表型進(jìn)行橋接,為從系統(tǒng)上理解微生物生理代謝功能模型提供一個(gè)高效平臺(tái)[2]。GSMM最初主要應(yīng)用于工業(yè)微生物制造領(lǐng)域,具體包括①分析代謝網(wǎng)絡(luò)屬性;②預(yù)測和分析微生物生長表型;③基于模型的組學(xué)數(shù)據(jù)闡釋;④系統(tǒng)代謝工程[2]。近幾年,GSMM逐漸應(yīng)用于細(xì)菌感染治療領(lǐng)域,Oberhardt等[3-4]通過GSMM的建立,闡釋了病原菌的感染過程和致病機(jī)制,提出該建模方法不僅可創(chuàng)新性用于新靶標(biāo)抗菌藥物的發(fā)現(xiàn),還有助于更好地理解疾病的發(fā)病機(jī)制,優(yōu)化治療策略。本文就基因組規(guī)模代謝網(wǎng)絡(luò)模型的構(gòu)建及其在抗感染治療領(lǐng)域的應(yīng)用進(jìn)行綜述,以期為抗感染治療及新藥開發(fā)提供參考。
GSMM構(gòu)建通常包括以下4個(gè)部分[5]。
首先需通過基因組測序和數(shù)據(jù)庫比對(duì),獲得所研究微生物的基因組注釋信息,結(jié)合生化反應(yīng)或代謝通路信息的數(shù)據(jù)庫,如KEGG (Kyoto Encyclopedia of Genes and Genomes, https://www.genome.jp/kegg/),MetaCyc (Metabolic Pathway Database, https://metacyc.org/),構(gòu)建初步的代謝網(wǎng)絡(luò)。應(yīng)予注意的是,僅僅依據(jù)基因組信息構(gòu)建的代謝網(wǎng)絡(luò)往往是不完整和不全面的,需要后續(xù)的手工修正以完善代謝網(wǎng)絡(luò)。
由于并非所有來源于數(shù)據(jù)庫的基因注釋可信度都很高,且用于獲得注釋信息的數(shù)據(jù)庫并不具有種屬特異性,基因組數(shù)據(jù)注釋過程中往往包含了許多非目標(biāo)微生物的信息,而缺失了部分實(shí)際存在的代謝物及代謝反應(yīng),需根據(jù)文獻(xiàn)檢索結(jié)果對(duì)代謝網(wǎng)絡(luò)進(jìn)行補(bǔ)充修正,該過程稱為模型的手工修正。手工修正對(duì)于后期模型的準(zhǔn)確預(yù)測十分必要,經(jīng)完善的模型對(duì)于代謝物之間相互關(guān)系的描述更為準(zhǔn)確和細(xì)致。
粗略的GSMM的重構(gòu)依賴于流平衡分析(flux balanced analysis, FBA)[6],F(xiàn)BA的目標(biāo)就是獲得基于約束的最優(yōu)解空間。該分析借助Matlab軟件中的COBRA (constraint-based reconstruction and analysis)工具包[7],將代謝反應(yīng)用計(jì)量學(xué)矩陣表示,代謝流用向量表示,模型的約束條件通常是物質(zhì)守恒與能量守恒。為了解微生物在不同生理?xiàng)l件或外界因素干擾下(微生物生長的不同生命周期,生長所需營養(yǎng)物質(zhì)是否充足,疾病的不同階段,藥物對(duì)微生物的作用)的代謝調(diào)控,通?;谄湓诓煌瑮l件下的基因表達(dá)水平,定義代謝流的邊界,用以對(duì)模型進(jìn)一步約束,從而縮小解空間,提高數(shù)學(xué)模型在真實(shí)情況下的預(yù)測能力 [8-9]。
整合基因表達(dá)數(shù)據(jù)的算法包括GIMME (gene inactivity moderated by metabolism and expression)、iMAT(integrative metabolic analysis tool)、MADE(metabolic adjustment by differential expression)、E-Flux、PROM(probabilistic regulation of metabolism)等[10],各有其優(yōu)缺點(diǎn),比如GIMME算法只需要一個(gè)基因表達(dá)數(shù)據(jù)集,但需要用戶設(shè)定閾值,判斷基因表達(dá)變化,MADE算法無需設(shè)定閾值,但需要多重基因差異表達(dá)數(shù)據(jù)集,因基因表達(dá)水平是一個(gè)連續(xù)的變量,E-Flux算法避免將表達(dá)數(shù)據(jù)分類為表達(dá)或不表達(dá)這種二進(jìn)制形式,更符合真實(shí)情況,可根據(jù)實(shí)際需求選用合適的算法[11]。
在模型評(píng)估過程中,通過重復(fù)1.2和1.3步驟,尋找重構(gòu)網(wǎng)絡(luò)中缺失的一些代謝反應(yīng),通過大量全面的文獻(xiàn)檢索補(bǔ)齊這些網(wǎng)絡(luò)漏洞。需要注意的是,在填補(bǔ)代謝漏洞的過程中,新添加到代謝網(wǎng)絡(luò)中的生化反應(yīng)可能會(huì)導(dǎo)致新漏洞出現(xiàn)。因此,當(dāng)加入新的反應(yīng)時(shí),應(yīng)確保所有代謝物能連接到已構(gòu)建好的代謝網(wǎng)絡(luò)。
除需要補(bǔ)齊網(wǎng)絡(luò)漏洞外,也應(yīng)對(duì)GSMM的實(shí)用性進(jìn)行評(píng)估,比如是否在不同培養(yǎng)基中合成細(xì)菌生長所需的前體物質(zhì);典型培養(yǎng)基上能否生長;能否反映單一基因敲除的細(xì)菌生長表型;已知的與預(yù)測的生理特性的比較;合成目標(biāo)代謝產(chǎn)物的能力及其合成速率[12]。
經(jīng)過模型的評(píng)估與修正,GSMM 構(gòu)建的最后一步則是將生化反應(yīng)可視化??梢暬浖ˋdobe Illustrator、Cell Designer (http://celldesigner.org/)等。
由于GSMM的構(gòu)建需要多達(dá)96個(gè)步驟,為加速新模型的建立,已開發(fā)出一些程序,使建模過程趨向于自動(dòng)化,如基于網(wǎng)絡(luò)資源的模型SEED(http://www.theseed.org/)[13],該模型的核心為一個(gè)模型重構(gòu)管線,它整合了基因組注釋技術(shù)、基因-蛋白反應(yīng)(gene-protein-reaction, GPR)構(gòu)建、生物量產(chǎn)生反應(yīng)、反應(yīng)網(wǎng)絡(luò)集、反應(yīng)可逆性的熱力學(xué)分析以及模型的優(yōu)化[14-15]。其他自動(dòng)化建模工具還包括有Path2Models (https://www.ebi.ac.uk/biomodels-main/path2models)[16]、CarveMe(https://pypi.org/project/carveme/)[17]等。
GSMM在工業(yè)微生物領(lǐng)域的應(yīng)用已較為廣泛,近年來才逐漸應(yīng)用于抗感染領(lǐng)域。Oberhardt等[3]在2008年建立了銅綠假單胞菌PAO1的代謝模型,從而對(duì)該病原菌的基因型和表型關(guān)系有了更深的理解。該課題組選取了囊性纖維化肺部感染患者,對(duì)銅綠假單胞菌在感染進(jìn)程中的代謝網(wǎng)絡(luò)加以分析,揭示了在囊性纖維化肺中,銅綠假單胞菌如何通過代謝改變以適應(yīng)環(huán)境[4],探討銅綠假單胞菌的致病機(jī)制,即在宿主的定植與感染機(jī)制。在模型構(gòu)建完成后,模擬每個(gè)基因的敲除,鑒定出不同感染進(jìn)程中顯著抑制細(xì)菌生長或致死的基因,由此可根據(jù)疾病進(jìn)程,針對(duì)特異性基因靶點(diǎn)選擇更合適的治療方案。
由于細(xì)菌在體內(nèi)的生存、感染與定植主要與生長必需基因和毒力因子的產(chǎn)生相關(guān),多數(shù)抗菌藥物的作用靶點(diǎn)通常作用于細(xì)菌生長過程,但這種靶向作用易產(chǎn)生耐藥。Bartell等[18]提出毒力相關(guān)通路可能成為治療靶點(diǎn),且不易產(chǎn)生適應(yīng)性耐藥。在預(yù)測的116個(gè)生長必需基因中,46個(gè)基因同時(shí)為毒力因子合成所必需,其中6個(gè)脂肪酸和磷脂代謝基因(aacA、aacB、aacC、aacD、fabD、fabG)對(duì)毒力因子的合成影響最為顯著。這種基于機(jī)制的模型定量分析揭示了基因?qū)?xì)菌生長和毒力的影響,不僅僅減少了實(shí)驗(yàn)成本和時(shí)間,也為開發(fā)新治療策略提供了思路和方向。
銅綠假單胞菌易在醫(yī)療植入物[19]以及囊性纖維化患者的肺部[20]形成生物膜,但其生物膜形成機(jī)制仍不清楚。Biggs等[21]借助GSMM,結(jié)合已有的基于Agent仿真建模(agent-based model, ABM)的生物膜形成模型,揭示銅綠假單胞菌生物膜形成活性是氧依賴性的,在氧缺乏時(shí),添加硝酸鹽可緩解這種氧依賴機(jī)制,促進(jìn)無氧呼吸進(jìn)而增加生物膜的形成,與實(shí)際情況相符[22]。Vital-Lopez等[23]在PAO1的GSMM基礎(chǔ)上構(gòu)建動(dòng)力學(xué)模型,結(jié)合基因表達(dá)譜,研究銅綠假單胞菌在形成生物膜狀態(tài)下的代謝,根據(jù)相關(guān)代謝物的濃度變化預(yù)測特異性的針對(duì)生物膜形成的目標(biāo)反應(yīng),進(jìn)而尋找特異性基 因。
在抗菌靶標(biāo)尋找中,Sigurdsson等[24]首次運(yùn)用系統(tǒng)生物學(xué)方法,通過模擬與生物膜形成相關(guān)的微環(huán)境,發(fā)掘清除銅綠假單胞菌生物膜的候選基因。由于病原菌可能在被清除之前就形成了生物膜,有必要對(duì)必需基因發(fā)生突變的菌株的生物膜形成能力進(jìn)行評(píng)估。只有當(dāng)必需基因的突變不誘導(dǎo)生物膜形成時(shí)方可將其作為藥物作用靶標(biāo),故Xu等[25]通過模型模擬對(duì)突變株生物膜形成進(jìn)行定量預(yù)測。有趣的是,通過系統(tǒng)水平的建模,發(fā)現(xiàn)必需基因的突變相比于非必需基因更易誘導(dǎo)生物膜形成,最終確定lysC、cysH、adk、galU這4個(gè)基因可作為銅綠假單胞菌的治療靶標(biāo),實(shí)驗(yàn)數(shù)據(jù)也證實(shí)這4個(gè)靶基因與銅綠假單胞菌的生存和毒力有 關(guān)[25]。
GSMM有助于從系統(tǒng)層面了解抗生素作用機(jī)制,反映在抗生素作用下,細(xì)菌的生化反應(yīng)發(fā)生哪些改變。以銅綠假單胞菌為例,多黏菌素類藥物發(fā)揮抗菌活性的機(jī)制與細(xì)菌應(yīng)答之間的關(guān)系仍然存在許多未知,需要借助系統(tǒng)藥理學(xué)的方法進(jìn)行更全面的研究。Zhu等[26]在建立了銅綠假單胞菌PAO1的代謝模型iPAO1的基礎(chǔ)上,將多黏菌素B作用下細(xì)菌的轉(zhuǎn)錄組學(xué)數(shù)據(jù)作為模型的約束條件,建立了基于多黏菌素B作用機(jī)制的模型,不僅揭示銅綠假單胞菌在多黏菌素B作用下發(fā)生的一系列代謝改變,包括生物量合成減少、氨基酸分解代謝上調(diào)、三羧酸循環(huán)的代謝流上調(diào)與氧化還原反應(yīng)的增加,與組學(xué)數(shù)據(jù)互為印證,也能夠預(yù)測環(huán)境或基因擾動(dòng)引起的代謝改變。模型模擬結(jié)果表明,脂質(zhì)A的修飾與多黏菌素B的耐藥相關(guān),這一修飾對(duì)細(xì)菌的生長影響不大,但顯著改變了外膜的生化特征,包括因4-氨基-4-脫氧-L-阿拉伯糖(4-amino-4-deoxy-L-arabinose, L-Ara4N)修飾導(dǎo)致的表面負(fù)電荷的中和,乙?;腿ヒ阴;^程帶來的極性和疏水作用改變,這些代謝改變都將影響多黏菌素類藥物與細(xì)菌的相互作用。
Presta等[27]基于多黏菌素E處理后的細(xì)菌轉(zhuǎn)錄組學(xué)數(shù)據(jù),建立了鮑曼不動(dòng)桿菌標(biāo)準(zhǔn)菌株ATCC 19606在多黏菌素E處理前后的GSMM。將未經(jīng)藥物處理和經(jīng)多黏菌素E 2 mg/L處理15 min和60 min的基因表達(dá)數(shù)據(jù)整合入鮑曼不動(dòng)桿菌ATCC 19606的GSMM中,結(jié)果表明在多黏菌素E的選擇性壓力下,細(xì)菌的必需基因發(fā)生改變。78個(gè)必需基因中,經(jīng)多黏菌素E處理15 min和60 min后66個(gè)基因仍被預(yù)測為生長必需基因,由此提出在多黏菌素類藥物作用下具有特異性的藥物作用靶標(biāo)基因,作用于這些靶標(biāo)基因的藥物可能與多黏菌素E產(chǎn)生協(xié)同作用。而事實(shí)上,除轉(zhuǎn)錄調(diào)控以外,代謝調(diào)控也將共同影響細(xì)菌的代謝網(wǎng)絡(luò)。Zhu等[28]進(jìn)一步將轉(zhuǎn)錄組學(xué)和代謝組學(xué)數(shù)據(jù)整合到鮑曼不動(dòng)桿菌ATCC 19606的GSMM中,探究鮑曼不動(dòng)桿菌在多黏菌素E處理后發(fā)生的代謝改變,其中糖異生、磷酸戊糖途徑、氨基酸和核苷酸的生物合成上調(diào),三羧酸循環(huán)、肽聚糖和脂多糖的生物合成下調(diào),呼吸鏈代謝流也發(fā)生改變,與代謝組學(xué)實(shí)驗(yàn)數(shù)據(jù)相一致,這些結(jié)果使我們產(chǎn)生思考:多黏菌素E聯(lián)合一些非抗生素如核苷酸抑制劑是否能產(chǎn)生協(xié)同作用。這種多黏菌素E處理下的代謝改變,從機(jī)制上為優(yōu)化多黏菌素類藥物聯(lián)合用藥方案的制定提供參考依據(jù)。
無論是對(duì)病原菌致病機(jī)制或是對(duì)藥物抗菌機(jī)制的揭示,其價(jià)值均在于發(fā)現(xiàn)特異性治療靶標(biāo),從機(jī)制上為新藥開發(fā)和治療策略的制定提供依據(jù)。必需基因的預(yù)測是發(fā)現(xiàn)潛在靶標(biāo)最常用的方法,編碼必需基因的酶通常被假定為藥物靶標(biāo)。若該必需基因或基因產(chǎn)物會(huì)影響某一個(gè)代謝反應(yīng),基因敲除就可能導(dǎo)致代謝流的重新分布[29]。在不同的疾病階段,病原菌的生長環(huán)境有所差異,其必需基因也會(huì)受到環(huán)境的影響,因此在不同生長條件下建立的模型適用于不同疾病階段藥物靶標(biāo)的發(fā)現(xiàn)[30]。除必需基因外,評(píng)估酶的穩(wěn)健性也能夠發(fā)掘代謝網(wǎng)絡(luò)中易受影響部分,將其作為潛在藥物靶標(biāo)。模擬反應(yīng)流部分抑制到完全抑制對(duì)目標(biāo)流如生物量產(chǎn)生的影響,揭示在酶催化反應(yīng)抑制的條件下代謝網(wǎng)絡(luò)的穩(wěn)健性[31]。若酶的失活引起某些毒性中間體累積,毒性中間體對(duì)病原菌有致死作用,那么這些酶也將會(huì)成為更具潛力的藥物靶標(biāo)[32]。由于一些藥物與天然代謝物高度相似,這些藥物可競爭或抑制酶的活性[33],因此預(yù)測必需代謝物也有助于發(fā)現(xiàn)藥物新靶標(biāo)。與必需基因的預(yù)測方法類似,對(duì)鮑曼不動(dòng)桿菌而言,預(yù)測出9個(gè)必需代謝物[34],這些必需代謝物合成或消耗所需的催化酶將成為可能的靶標(biāo)。
許多抗感染藥物是多靶點(diǎn)的,多靶點(diǎn)作用不易產(chǎn)生耐藥[35],運(yùn)用FBA能夠快速預(yù)測多個(gè)基因或代謝反應(yīng)擾動(dòng)的影響[36]。聯(lián)合用藥也相當(dāng)于是一種多靶點(diǎn)策略,為篩選得到具有協(xié)同作用的聯(lián)合用藥方案,選取已知或可能的藥物靶標(biāo),逐漸限制其代謝流,觀察相應(yīng)的發(fā)生流增加的代謝反應(yīng),在這些通路中尋找有協(xié)同作用的藥物新靶標(biāo)[32]。或者在GSMM的基礎(chǔ)上,整合藥物處理后病原菌的基因表達(dá)信息,建立特定條件下的代謝模型,據(jù)此預(yù)測的靶標(biāo)可能與該藥物產(chǎn)生協(xié)同作 用[27]。
綜上所述,GSMM的構(gòu)建有助于理解病原菌的致病機(jī)制、藥物的作用機(jī)制以及耐藥產(chǎn)生,在新藥研發(fā)中,將模型預(yù)測整合到新藥研發(fā)管線中,基于預(yù)測進(jìn)行實(shí)驗(yàn)驗(yàn)證,將大大加快抗感染治療藥物的研發(fā)和治療策略的制定。