徐天潤(rùn),劉心昱,許國(guó)旺
(1.中國(guó)科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室 中國(guó)科學(xué)院大連化學(xué)物理研究所,遼寧 大連 116023;2.中國(guó)科學(xué)院大學(xué),北京 100049)
代謝組學(xué)是研究生命體受到病理生理刺激或基因環(huán)境擾動(dòng)后,糖類、脂質(zhì)、核苷酸和氨基酸等內(nèi)源性小分子代謝物(分子量小于1 000)種類和數(shù)量的變化[1-2]。相比于其他組學(xué),代謝組學(xué)反映生命體已經(jīng)發(fā)生的生物學(xué)事件,因此能夠更準(zhǔn)確直接地反映生命體終端和表型信息[1]。目前,廣泛應(yīng)用于代謝組學(xué)數(shù)據(jù)采集的技術(shù)平臺(tái)有氫/碳核磁共振技術(shù)(1H,13C-NMR)、氣相色譜-質(zhì)譜技術(shù)(GC-MS)、液相色譜-質(zhì)譜技術(shù)(LC-MS)、毛細(xì)管電泳-質(zhì)譜技術(shù)(CE-MS)以及直接進(jìn)樣質(zhì)譜技術(shù)(DIMS)等。鑒于代謝物種類多樣且濃度差異大,代謝組學(xué)研究需要依托高靈敏度、高分辨率的分析技術(shù)。色譜-質(zhì)譜聯(lián)用技術(shù)具有靈敏度高、選擇性好、通量高等優(yōu)勢(shì)[3],能夠根據(jù)代謝物檢測(cè)的需求選擇不同的電離模式和質(zhì)量分析器。豐富的多級(jí)質(zhì)譜數(shù)據(jù)有助于代謝物的結(jié)構(gòu)鑒定,從而最大限度地獲取代謝物信息。圖1統(tǒng)計(jì)了2015年~2019年8月期間基于色譜-質(zhì)譜聯(lián)用的代謝組學(xué)論文發(fā)表數(shù)量,可以看出液相色譜-質(zhì)譜聯(lián)用技術(shù)(LC-MS)已成為代謝組學(xué)最常用的技術(shù)平臺(tái)[4],論文數(shù)量穩(wěn)步增長(zhǎng)。
圖1 基于GC-MS、LC-MS、CE-MS、NMR的代謝組學(xué)論文數(shù)量對(duì)比(A),以及基于LC-MS的代謝組學(xué)論文數(shù)目對(duì)比(B)
代謝組學(xué)研究的流程一般包括樣品采集、樣品前處理、代謝物的分離分析、數(shù)據(jù)處理(包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析及代謝物鑒定)和代謝物的生物學(xué)功能闡釋。目前,人類代謝組數(shù)據(jù)庫(kù)(Human metabolome database,HMDB)已給出超過11萬種代謝物,但對(duì)于生物體內(nèi)代謝物的總數(shù)仍不清楚。代謝物全面的定性、定量分析面臨較大挑戰(zhàn),在代謝組學(xué)方法上需要不斷創(chuàng)新。在預(yù)處理方法上,要盡可能充分地提取和富集低豐度代謝物;在檢測(cè)上,要不斷擴(kuò)大代謝物的檢測(cè)覆蓋度,并提高分析通量;在深入挖掘代謝組學(xué)數(shù)據(jù)的同時(shí)還需注重代謝組學(xué)與其他組學(xué)數(shù)據(jù)的整合,進(jìn)而深化對(duì)相關(guān)代謝途徑的解釋和認(rèn)知。唯有確保每一個(gè)環(huán)節(jié)均能創(chuàng)新發(fā)展,才能最終推動(dòng)代謝組學(xué)技術(shù)取得巨大進(jìn)步。本文將重點(diǎn)闡述近5年來基于LC-MS的代謝組學(xué)分析方法的研究進(jìn)展。
隨著高效固定相的研制和裝柱技術(shù)的改進(jìn),液相色譜(LC)的柱效不斷提高。高壓液流系統(tǒng)的應(yīng)用,使得細(xì)粒徑固定相的使用得以普及,大大提高了液相色譜的分離能力,也加快了分析速度。色譜固定相的選擇應(yīng)與被分離物的物化性質(zhì)相匹配,以實(shí)現(xiàn)高選擇性和良好分離度。目前應(yīng)用最多的液相色譜是反相液相色譜(RPLC),主要用于分離非極性或中等極性代謝物。Panopoulos等[5]利用反相液相色譜-四極桿-飛行時(shí)間質(zhì)譜(RPLC-Q-TOF-MS)分析胚胎干細(xì)胞中代謝物的相對(duì)豐度,檢測(cè)到超過5 000個(gè)代謝物特征,展現(xiàn)了反相液相色譜-質(zhì)譜聯(lián)用技術(shù)強(qiáng)大的分離與檢測(cè)能力。為提高分離效率,可在流動(dòng)相中添加改性劑以改善分離度[6]。Bertram等[7]評(píng)估了常用添加劑(如0.1%甲酸、乙酸銨、氟化銨等)對(duì)LC分離效果的影響,結(jié)果表明0.1%甲酸并不能提供最佳的分離效果。1 mmol/L乙酸是負(fù)離子模式下尿樣代謝組學(xué)研究的最佳添加劑,相比于0.1%甲酸,檢測(cè)到的峰數(shù)量和信號(hào)強(qiáng)度均有顯著提升。因此正、負(fù)電離模式下使用單一的添加劑往往不能獲得最佳的代謝物覆蓋,通常需要兩種不同的添加劑。
與RPLC互補(bǔ),親水相互作用色譜(HILIC)已成為強(qiáng)極性和親水性代謝物的替代選擇[8]。大量研究人員對(duì)不同HILIC固定相的柱效和保留行為進(jìn)行了評(píng)估,結(jié)果表明兩性離子柱ZIC-HILIC可提供最佳性能[9-11]。Zhong等[12]在正、負(fù)離子模式下采用HILIC和RPLC柱分析唾液的代謝特征,以篩查乳腺癌的潛在生物標(biāo)志物。研究發(fā)現(xiàn),HILIC可有效分離在RPLC上死時(shí)間出峰的強(qiáng)極性代謝物,基于兩個(gè)色譜柱組合的數(shù)據(jù)提供了更好的分型和預(yù)測(cè)結(jié)果。為改善HILIC柱保留時(shí)間在代謝物峰匹配中的可靠性,F(xiàn)eng等[13]提出了計(jì)算HILIC保留指數(shù)的方法,用于校準(zhǔn)保留時(shí)間的漂移,以提高代謝物注釋的準(zhǔn)確性。
在色譜填料進(jìn)步的同時(shí),超高效液相色譜(UPLC)的問世大大拓寬了液相色譜的應(yīng)用領(lǐng)域。UPLC可耐受超高壓力(15 000~18 000 psi),結(jié)合較小的粒徑(亞2 μm顆粒)及超高柱效填料(窄內(nèi)徑色譜柱),可實(shí)現(xiàn)樣品的高效、快速分離并獲得尖銳的色譜峰。與傳統(tǒng)液相色譜相比,UPLC具有縮短分析時(shí)間和提高分離度兩大優(yōu)勢(shì)。前者從節(jié)約成本的角度,可在短時(shí)間內(nèi)分析大批量樣品,后者對(duì)復(fù)雜樣品的分析極為重要。Gray等[14]將色譜柱內(nèi)徑由2.1 mm縮小至1.0 mm,使所有分析物的響應(yīng)提升了2~3倍,溶劑用量減少75%。由于信噪比的提升,該方法能夠?qū)崿F(xiàn)分離性能和穩(wěn)健性的顯著增益。UPLC與高分辨質(zhì)譜聯(lián)用可使組學(xué)分析數(shù)據(jù)在分辨率、靈敏度和通量方面更強(qiáng)大。將超高效液相色譜-四極桿-飛行時(shí)間質(zhì)譜(UPLC-Q-TOF-MS)用于分析茶葉的代謝組,峰對(duì)齊后檢測(cè)到674個(gè)特征離子[15]。該平臺(tái)也應(yīng)用于抑郁癥患者的血漿代謝組學(xué)分析,正、負(fù)離子模式下分別獲得4 724和4 504個(gè)特征離子[16]。
多維液相色譜(Multi-dimensional liquid chromatography,MDLC)的概念最早由Giddings 等[17-18]提出,是指樣品中的組分經(jīng)過兩次或多次LC分離,且被分開的組分在后續(xù)分離中不會(huì)再融合。與傳統(tǒng)LC方法相比,MDLC技術(shù)可結(jié)合不同的分離機(jī)理增加分離維數(shù)和提高峰容量,在提高覆蓋度和分離度方面具有獨(dú)特優(yōu)勢(shì)。
圖2 在線二維液相色譜-質(zhì)譜法用于短鏈、中鏈和長(zhǎng)鏈的酰基輔酶A的分析[29]
本課題組在二維及多維色譜方面開展了系統(tǒng)的研究??紤]到對(duì)弱極性或中等極性化合物全二維液相色譜的分離方法相對(duì)成熟[19],Wang等[20]建立了針對(duì)極性化合物分離的HILIC×HILIC全二維系統(tǒng)。Yang等[21]建立了在線的Ag+LC×RPLC 全二維流路用于分析甘油三酯,第一維和第二維分別根據(jù)不飽和度與碳鏈長(zhǎng)度實(shí)現(xiàn)分離。相比于一維方法,選擇性得到提高,但峰容量未顯著提升,原因在于兩維流速差距較大,存在稀釋效應(yīng)[22]。為解決這一問題,Wang等[23]發(fā)展了在線停留HILIC-RPLC系統(tǒng),一方面用稀釋液降低第一維出口溶劑的強(qiáng)度,另一方面引入捕集柱將第一維流出的餾分較好地保留在前端,通過第二維流動(dòng)相反吹將餾分轉(zhuǎn)移至第二維,有效地降低了稀釋效應(yīng),實(shí)現(xiàn)了較低的進(jìn)樣寬度。應(yīng)用于血漿的脂質(zhì)組學(xué)分析中,第一維實(shí)現(xiàn)了脂質(zhì)族分離,第二維根據(jù)脂肪鏈進(jìn)行精細(xì)分離,該模式的峰容量高達(dá)415,與全二維分析取得的實(shí)際峰容量相接近。在線停留模式還應(yīng)用于3D LC的構(gòu)建,第一維的預(yù)分離將復(fù)雜樣品分為幾個(gè)不同餾分,經(jīng)停留接口對(duì)各餾分進(jìn)行有序的全二維分析,有效改善了復(fù)雜樣品的分離效果[24]。針對(duì)傳統(tǒng)分離方法覆蓋范圍不廣的問題,Wang等[25]建立了基于柱切換的分析系統(tǒng),通過將極性不同的HILIC和RPLC色譜柱結(jié)合,將HILIC柱上非保留的疏水性代謝物洗脫并轉(zhuǎn)移至RPLC柱上分離,擴(kuò)展了代謝物的覆蓋范圍,使單柱模式下死時(shí)間流出的代謝物得以保留,實(shí)現(xiàn)了極性和非極性代謝物的依次分析,也可以通過配置兩個(gè)檢測(cè)器實(shí)現(xiàn)同時(shí)分析[26]。應(yīng)用于大鼠尿液的代謝分析中,共檢測(cè)到5 686個(gè)極性代謝物離子和1 808個(gè)非極性代謝物離子,體現(xiàn)了方法在復(fù)雜樣品分離分析中的適用性[27]。為進(jìn)一步提高代謝物覆蓋度,通過預(yù)柱分離,將代謝物在線切割為中等極性和弱極性兩個(gè)餾分,Wang等[28]分別進(jìn)行代謝組學(xué)和脂質(zhì)組學(xué)分析,對(duì)血漿的全組分分析共鑒定出447種(ESI+)和289種(ESI-)代謝物和脂質(zhì),使一次分析同時(shí)獲得代謝組和脂質(zhì)組信息成為可能。將該流程稍加改進(jìn)應(yīng)用于酰基輔酶A(Acyl-CoA)的分析(圖2),實(shí)現(xiàn)了一次進(jìn)樣同時(shí)涵蓋短鏈、中鏈和長(zhǎng)鏈的酰基輔酶A的分析[29]。
多維色譜的應(yīng)用越來越廣泛,很多課題組開展了很好的工作。Liu等[30]建立的NP/RP 2D LC-MS方法實(shí)現(xiàn)了脂質(zhì)類物質(zhì)的同時(shí)檢測(cè),應(yīng)用于良性、惡性乳腺腫瘤患者血漿的全脂質(zhì)分析,成功鑒定了512種脂質(zhì)。該課題組還將方法用于腔隙性腦梗[31]、結(jié)直腸癌[32]和動(dòng)脈粥樣硬化[33]脂質(zhì)組學(xué)分析,證實(shí)了NP/RP 2D LC-MS實(shí)現(xiàn)脂質(zhì)類物質(zhì)全覆蓋的巨大潛力。HILIC和RPLC分離系統(tǒng)提供了兩種完全不同的保留機(jī)制和非常高的正交性,可以實(shí)現(xiàn)一次進(jìn)樣同時(shí)分離檢測(cè)復(fù)雜樣品中的親水和疏水性化合物,提高峰容量和分離通量[8]。Ivanisevic等[34]將RPLC-ESI+和HILIC-ESI-模式結(jié)合構(gòu)建正交的二維體系,該方法可全面涵蓋中心碳代謝通路中的代謝物(如氨基酸、有機(jī)酸、磷酸化糖等)信息。Contrepois等[9]的研究表明將RPLC-MS和HILIC-MS方法結(jié)合,可使尿液和血漿代謝組擴(kuò)增44%,比單獨(dú)使用RPLC-MS增加了108%的代謝物特征,大大提高了代謝組覆蓋率。
LC-MS具有高靈敏和高度穩(wěn)健的雙重優(yōu)勢(shì),從而可提供良好的代謝物覆蓋率[35-37],是代謝組學(xué)研究中應(yīng)用最廣泛的技術(shù)平臺(tái),比GC-MS更具靈活性和普適性[38-40]。在實(shí)際樣品分析中,LC-MS采用的策略包括非靶向、靶向和擬靶向3種。
非靶向分析是最經(jīng)典、應(yīng)用最廣泛的代謝組學(xué)方法。通過對(duì)樣本中所有化合物的綜合、全面、無偏性的高覆蓋檢測(cè),可實(shí)現(xiàn)不同樣品間代謝特征的比較。因此,樣品制備應(yīng)盡可能保持代謝組提取的完整性,所采用的方法應(yīng)具有非選擇性、快速和可重復(fù)性。分辨率對(duì)于非靶向分析至關(guān)重要,結(jié)合高掃描速度和高質(zhì)量精確度的要求,高分辨質(zhì)譜Q-TOF、Q-Orbitrap(四極桿-軌道離子阱)是提供這些性能的最佳選擇[41],獲得的高分辨質(zhì)譜信息有助于快速檢索以鑒定代謝物。Raro等[42]評(píng)估了Q-TOF和Q-Orbitrap對(duì)非靶向代謝組學(xué)確定興奮劑睪酮濫用標(biāo)志物的性能,兩個(gè)質(zhì)譜儀雖然檢測(cè)到的特征數(shù)量不同,但均顯示相同的潛在標(biāo)志物。因此這兩種平臺(tái)對(duì)于非靶向代謝組學(xué)的研究同樣有效,均適用于未知化合物鑒定。非靶向分析通常在正離子和負(fù)離子模式下分析相同樣品,可提供更廣泛的代謝物覆蓋[43]。Breitkopf等[44]利用具有正/負(fù)離子模式切換的高分辨質(zhì)譜鑒定出來自18種脂質(zhì)類別和66個(gè)亞類的共2 493個(gè)脂質(zhì),其中正離子模式下鑒定1 756個(gè),負(fù)離子模式下鑒定737個(gè),單次LC-MS/MS即可獲得兩種電離模式的質(zhì)譜信息。
傳統(tǒng)的非靶向方法分析1個(gè)樣品通常需要半小時(shí),這大大限制了分析通量。因此,快速、高通量的非靶向方法尤為重要。應(yīng)用短柱或微柱、提高色譜柱溫度及流速是縮短洗脫梯度、進(jìn)而縮短分析時(shí)間的良好選擇。Gray等[14]將傳統(tǒng)的2.1 mm×100 mm色譜柱替換為1 mm×50 mm色譜柱,直徑和長(zhǎng)度的縮小使譜帶展寬最小化,性能提升的同時(shí)減少了溶劑用量。將該方法應(yīng)用于小鼠的尿液樣品分析,結(jié)果表明盡管峰容量與檢測(cè)到的特征數(shù)量比傳統(tǒng)方法少,但仍可篩查不同樣本之間關(guān)鍵的差異代謝物[45]。為兼顧分析速度與峰容量,Ouyang等[46]建立了在12 min內(nèi)完成代謝譜采集的快速方法,節(jié)省了約60%的分析時(shí)間,適合于大規(guī)模樣本的非靶向代謝組學(xué)研究。短梯度的UPLC-MS方法有利于提高分析通量,節(jié)省分析時(shí)間,但由于色譜分離度降低導(dǎo)致代謝物覆蓋率的損失是高通量非靶向方法的弊端,這也不利于發(fā)現(xiàn)具有生物學(xué)功能的痕量代謝物,因此,還需要根據(jù)分析需求選擇不同的分析方法。
靶向分析是對(duì)特定代謝途徑相關(guān)的少數(shù)已知靶向分子進(jìn)行精準(zhǔn)定量。靶向分析依賴于串聯(lián)質(zhì)譜固有的高選擇性和高靈敏度,使用三重四極桿(QQQ)質(zhì)譜儀在多反應(yīng)監(jiān)測(cè)(MRM)模式下檢測(cè)代謝物的前體離子和特征產(chǎn)物離子,通常被認(rèn)為是“金標(biāo)準(zhǔn)”[47-48]。Han等[49]建立了在負(fù)離子模式下的人血清中50種膽汁酸的MRM數(shù)據(jù)庫(kù)。Yan等[50]建立了直接耦合的RPLC-HILIC方法進(jìn)行靶向分析,鑒定出人體尿液中198個(gè)代謝物。使用三重四極桿-線性離子阱(Q-Trap)構(gòu)建MRM策略的研究亦有報(bào)道。Chen等[51]在Q-Trap平臺(tái)上獲得了698個(gè)水稻葉片代謝物的二級(jí)質(zhì)譜信息,定性了135種代謝物,相對(duì)定量了277種代謝物。
由于提供MRM模式的QQQ、Q-Trap的分辨率較低,限制了其在復(fù)雜系統(tǒng)生物學(xué)研究中的應(yīng)用,因此需要開發(fā)新的方法以拓寬靶向代謝組學(xué)的研究途徑。基于高分辨、高精度Q-Orbitrap的平行反應(yīng)監(jiān)測(cè)(PRM)模式的靶向定量策略應(yīng)運(yùn)而生,相比于MRM,PRM能實(shí)現(xiàn)高分辨地全面檢測(cè)目標(biāo)代謝物的所有碎片離子。依托PRM掃描模式,Zhou等[52]開發(fā)了一種針對(duì)237種代謝物的大規(guī)模定量方法,并與全掃描和MRM的性能進(jìn)行了系統(tǒng)比較。由于碎裂過程賦予PRM更高的選擇性,相比于全掃描其具有更高的準(zhǔn)確度,相比QQQ具有更高的分辨率。對(duì)復(fù)雜生物樣本的評(píng)估顯示出PRM對(duì)靶向代謝物定量的優(yōu)異性能,可以作為MRM靶向分析的補(bǔ)充策略[53]。PRM還可以輔助定性,許國(guó)旺課題組[54]開發(fā)了一種新策略,大大提高了?;鈮A的檢測(cè)覆蓋率。通過全掃描MS/ddMS2模式和PRM模式的結(jié)合層層遞進(jìn)采集MS數(shù)據(jù),用以識(shí)別特征碎片信息。進(jìn)一步整合子類同源分組和預(yù)測(cè)結(jié)果,共得到758種?;鈮A的信息,這是目前最全面的?;鈮A列表。全面的靶向分析得益于兩步數(shù)據(jù)采集提供的充足的MS結(jié)構(gòu)信息,使得全面鑒定生物樣本中的?;鈮A成為可能。
傳統(tǒng)的靶向分析代謝物覆蓋度及通量有限,無法滿足對(duì)時(shí)間成本和經(jīng)濟(jì)效益的需求,因此需要發(fā)展快速、高通量的靶向方法。QQQ儀器實(shí)現(xiàn)了高掃描速度和快速正負(fù)離子模式切換的功能,并且單次轉(zhuǎn)換停留時(shí)間不超過5 ms,使得MRM分析成為快速、高通量靶向分析的理想策略[53]。Yuan等[55]采用HILIC正負(fù)離子切換模式,實(shí)現(xiàn)了單次進(jìn)樣15 min即可得到289個(gè)MRM離子對(duì),定性分析了258個(gè)代謝物。Wei等[56]將3種色譜條件和兩種電離方式配置在一個(gè)體系中,利用柱切換的時(shí)間間隔進(jìn)行柱清洗和平衡,實(shí)現(xiàn)了僅用10 min靶向定量包括氨基酸、核酸和有機(jī)酸在內(nèi)的205種內(nèi)源性代謝物,以快速的方式實(shí)現(xiàn)了最佳分離。鑒于高分辨質(zhì)譜的低掃描速度,PRM在分析通量方面很難與MRM匹敵。因此,MRM和PRM兩種模式各有利弊,但結(jié)合具有完整MS2采集的PRM和具有快掃速及電離模式切換的MRM,將為快速、高通量靶向代謝組學(xué)定量提供強(qiáng)大的工具。
綜上,由于重復(fù)性和穩(wěn)定性有限,非靶向分析難以為大規(guī)模樣品分析提供高質(zhì)量數(shù)據(jù)。靶向分析由于使用有限的代謝物標(biāo)準(zhǔn)品,限制了代謝物覆蓋度的提升。兩種方法各有優(yōu)劣,往往需在代謝物覆蓋度和數(shù)據(jù)質(zhì)量間進(jìn)行權(quán)衡,導(dǎo)致會(huì)損失很多重要的代謝物信息。因此,需要開發(fā)代謝組學(xué)新技術(shù)以提供高覆蓋度、高質(zhì)量的數(shù)據(jù)。
結(jié)合非靶向方法的高信息覆蓋度及靶向方法的高靈敏度、高重復(fù)性的優(yōu)勢(shì),許國(guó)旺課題組首次提出了擬靶向代謝組學(xué)的概念[57-58]。該方法首先通過高分辨質(zhì)譜全面獲取代謝物的一級(jí)和二級(jí)質(zhì)譜信息,從二級(jí)質(zhì)譜中挑選特征離子對(duì),隨后在具有MRM模式的QQQ儀器上對(duì)離子對(duì)進(jìn)行靶向采集。相比于靶向分析,擬靶向方法通過采集混合生物樣品(QC)的二級(jí)質(zhì)譜代謝特征,可以同時(shí)包括定性與未定性的代謝物,實(shí)現(xiàn)了廣泛覆蓋。與非靶向分析相比,MRM模式的數(shù)據(jù)穩(wěn)定性高、線性范圍寬[58],能夠獲得高質(zhì)量的數(shù)據(jù)信息,可以關(guān)注到更多低豐度代謝物[59]。
擬靶向方法的關(guān)鍵是獲取特征離子對(duì),二級(jí)質(zhì)譜信息的全面獲取是MRM離子對(duì)覆蓋度的重要影響因素。基于信息依賴采集(IDA)模式采集二級(jí)質(zhì)譜信息,應(yīng)用本課題組自主開發(fā)的自動(dòng)化獲取特征離子對(duì)軟件MRM-Ion Pair Finder,共檢測(cè)到854個(gè)代謝物離子對(duì)[60],具有很好的代謝物覆蓋率和可靠的生物標(biāo)志物鑒定潛力。順序窗口采集所有理論碎片離子(SWATH)模式的二級(jí)質(zhì)譜信息采集能力優(yōu)于IDA,在正離子模式下,從血漿標(biāo)準(zhǔn)參考物質(zhì)(NIST SRM 1950)中獲得1 373個(gè)具有離子對(duì)的代謝物,與IDA相比,SWATH可以采集更多的離子對(duì)[61]。除此之外,對(duì)于有碎裂規(guī)律的化合物(如脂質(zhì)),可以根據(jù)保留時(shí)間和碎片與脂質(zhì)結(jié)構(gòu)的規(guī)則進(jìn)行預(yù)測(cè)。Xuan等[62]建立了高覆蓋度的擬靶向脂質(zhì)組學(xué)分析方法,共涵蓋19個(gè)脂類、3 377個(gè)脂質(zhì)離子對(duì),覆蓋7 000多種脂質(zhì)分子結(jié)構(gòu),與靶向脂質(zhì)組學(xué)方法相比,顯示出更高的脂質(zhì)覆蓋度,適合于大規(guī)模脂質(zhì)組學(xué)分析(圖3)。在上述基礎(chǔ)上,本課題組也建立了基于LC-MS擬靶向方法的多批次數(shù)據(jù)校正方法,保證了大規(guī)模、大批量代謝組學(xué)數(shù)據(jù)的穩(wěn)健可靠[63-64]。
圖3 基于UPLC-MS的擬靶向脂質(zhì)組學(xué)[62]
除了擬靶向分析方法,“廣泛靶向”和“全局優(yōu)化靶向(GOT)”等新型代謝組學(xué)技術(shù)也得到發(fā)展,為傳統(tǒng)的代謝組學(xué)分析提供了有價(jià)值的補(bǔ)充方法。Chen等[51]基于Q-Trap質(zhì)譜儀發(fā)展了“廣泛靶向”代謝組學(xué)技術(shù),通過自建的MS數(shù)據(jù)庫(kù),采用MRM模式掃描,匹配物質(zhì)參數(shù)信息進(jìn)行定性和定量。代謝物覆蓋的廣度取決于物種特異的MS庫(kù)覆蓋具有生物學(xué)功能代謝物的全面性,只有獲得生物樣本最全面的代謝物信息,才能具有廣泛的代謝物覆蓋能力。Gu等[65]建立了對(duì)血清代謝物具有廣泛覆蓋的GOT-MS方法,為了提高親水性代謝物的覆蓋度,采用選擇離子監(jiān)測(cè)(SIM)增強(qiáng)掃描(60~600 Da),選擇具有良好峰形且信噪比S/N> 3的離子作為母離子,在MRM模式下進(jìn)行MS/MS碎片掃描,最終獲得針對(duì)595個(gè)母離子的1 890個(gè)MRM離子對(duì)。GOT-MS的關(guān)鍵是利用QQQ對(duì)母離子和子離子進(jìn)行全局掃描,優(yōu)化和擴(kuò)展了QQQ的檢測(cè)能力,實(shí)現(xiàn)了廣泛的代謝物覆蓋。以“擬靶向”、“廣泛靶向”和“全局優(yōu)化靶向”為代表的新一代代謝組學(xué)技術(shù),還將更深層次地結(jié)合非靶向的“廣泛性”和靶向的“精確性”,以期獲得更全面、更精準(zhǔn)的生物樣品代謝譜信息。
在LC-MS代謝組學(xué)研究中如何大規(guī)模準(zhǔn)確定性代謝物仍然是個(gè)極具挑戰(zhàn)性的難題。廣泛采用的策略是將代謝物的質(zhì)譜數(shù)據(jù)與數(shù)據(jù)庫(kù)比對(duì),通過精確分子量(一級(jí)質(zhì)譜)和/或二級(jí)質(zhì)譜信息實(shí)現(xiàn)定性。該方法存在的主要問題如下:(1)由于代謝物眾多,即使質(zhì)譜的質(zhì)量精度小于1 ppm[66],仍不足以準(zhǔn)確推斷元素組成;(2)數(shù)據(jù)庫(kù)中來自于待測(cè)代謝物的二級(jí)質(zhì)譜圖太少,影響了檢索的命中率。加之LC-MS流動(dòng)相、基質(zhì)、離子源等對(duì)化合物碎裂的影響,使得基于數(shù)據(jù)庫(kù)檢索更是難上加難。到目前為止,對(duì)大多數(shù)生物樣本,只能對(duì)4%~5%的LC-MS峰進(jìn)行定性[67]。
圖4 代謝反應(yīng)網(wǎng)絡(luò)的構(gòu)建策略[71]
盡管如此,近年來,關(guān)于代謝物定性的工作仍取得了一些進(jìn)展,主要集中在以下3個(gè)方面。一是基于碎片質(zhì)譜數(shù)據(jù)推測(cè)代謝物結(jié)構(gòu)。對(duì)于有碎裂規(guī)律的分子類別(如脂質(zhì)),通過收集不同類別脂質(zhì)的碎裂和重排信息建立數(shù)據(jù)庫(kù),根據(jù)碎裂規(guī)則可預(yù)測(cè)分子結(jié)構(gòu)[68]。為提高預(yù)測(cè)精度,可以應(yīng)用機(jī)器學(xué)習(xí)從實(shí)驗(yàn)數(shù)據(jù)中訓(xùn)練模型參數(shù)。Allen等[69]提出了競(jìng)爭(zhēng)性碎片模型(CFM),該模型根據(jù)數(shù)據(jù)學(xué)習(xí)碎裂過程,通過預(yù)測(cè)任何碎裂過程的可能性,給出最有可能觀察到的峰,從而提高預(yù)測(cè)的精確度。機(jī)器學(xué)習(xí)還可用于預(yù)測(cè)化合物的分子指紋。Shen等[70]將碎片樹和機(jī)器學(xué)習(xí)相結(jié)合預(yù)測(cè)分子指紋并用于分子結(jié)構(gòu)鑒定,顯著提高了代謝物鑒定的能力。二是基于反應(yīng)物和產(chǎn)物在結(jié)構(gòu)上存在關(guān)聯(lián),利用二級(jí)譜與結(jié)構(gòu)相似性的內(nèi)在聯(lián)系鑒定未知代謝物。預(yù)測(cè)模型MetDNA[71]選擇種子代謝物繪制代謝反應(yīng)網(wǎng)絡(luò),并利用代謝物間二級(jí)質(zhì)譜的點(diǎn)積來評(píng)估代謝物在反應(yīng)網(wǎng)絡(luò)中是否相鄰,逐步擴(kuò)展注釋代謝物,實(shí)現(xiàn)了單次實(shí)驗(yàn)約2 000個(gè)代謝物的注釋,置信水平高達(dá)90%(圖4)。預(yù)測(cè)模型iMET[72]使用各種碰撞能量下代謝物間的二級(jí)質(zhì)譜的余弦相似性和精準(zhǔn)質(zhì)量差異來預(yù)測(cè)代謝物在反應(yīng)網(wǎng)絡(luò)中的上下游關(guān)系。為提高注釋方法的自動(dòng)化能力,采用機(jī)器學(xué)習(xí)從原始數(shù)據(jù)集中訓(xùn)練模型,實(shí)現(xiàn)自動(dòng)對(duì)預(yù)測(cè)結(jié)構(gòu)打分排序,未知化合物鑒定的有效性取決于現(xiàn)有數(shù)據(jù)庫(kù)的覆蓋范圍,因此融合更多數(shù)據(jù)庫(kù)對(duì)訓(xùn)練更準(zhǔn)確的模型至關(guān)重要[73]。通過二級(jí)質(zhì)譜的相似性來注釋結(jié)構(gòu)相關(guān)的代謝物,大大增強(qiáng)了現(xiàn)有數(shù)據(jù)庫(kù)的鑒定能力。三是基于穩(wěn)定同位素標(biāo)記推斷化學(xué)結(jié)構(gòu),其中最為常用的是13C、15N、34S[74]。通常情況下,將標(biāo)記的生物樣品與天然類似物混合,通過有效計(jì)數(shù)代謝物中標(biāo)記的原子數(shù),顯著減少可能的分子式數(shù)量,進(jìn)而改善代謝組學(xué)數(shù)據(jù)的生物學(xué)解釋[75]。對(duì)方法的改進(jìn)是采用獨(dú)特的同位素峰分布,如5%或95%的13C標(biāo)記,即同位素比值異常分析(IROA)技術(shù)[76-77],可使識(shí)別和量化代謝物的能力明顯增強(qiáng)。
對(duì)代謝途徑的深入闡釋僅依靠代謝組學(xué)數(shù)據(jù)還不夠,應(yīng)有多組學(xué)數(shù)據(jù)。多組學(xué)數(shù)據(jù)可以更全面地理解生物學(xué)機(jī)制。
多組學(xué)整合通過多層次分析代謝通路來探尋生物調(diào)控的分子機(jī)制,Lee等[78]對(duì)細(xì)胞樣品進(jìn)行了蛋白質(zhì)層面和代謝層面的分析,通過分析代謝物和代謝酶的表達(dá)水平的相關(guān)性,揭示了細(xì)胞增殖過程中代謝通路的調(diào)控機(jī)制。Wettersten等[79]采用蛋白組學(xué)-代謝組學(xué)相結(jié)合的分析方法研究不同分級(jí)的胃癌組織,揭示了多條調(diào)控胃癌分級(jí)的信號(hào)通路,有助于不同分級(jí)胃癌的個(gè)性化治療。多組學(xué)數(shù)據(jù)的整合分析會(huì)使研究更加系統(tǒng),分析結(jié)果既能互為印證,又能互為補(bǔ)充。Geiger等[80]從蛋白組和代謝組兩個(gè)水平進(jìn)行了大規(guī)模非靶向篩選,分析T細(xì)胞激活與非激活狀態(tài)下蛋白組和代謝組的差異,發(fā)現(xiàn)L-精氨酸代謝通路中的蛋白質(zhì)和代謝物均發(fā)生顯著變化,進(jìn)一步的細(xì)胞功能實(shí)驗(yàn)驗(yàn)證了L-精氨酸對(duì)T細(xì)胞代謝網(wǎng)絡(luò)的調(diào)控機(jī)制。Gupta等[81]研究了植物激素對(duì)大豆葉片蛋白質(zhì)和代謝物的影響,發(fā)現(xiàn)與類黃酮和異類黃酮生物合成的蛋白豐度增加,代謝組的結(jié)果與蛋白組一致。
多組學(xué)技術(shù)平臺(tái)的整合依賴于分析方法、系統(tǒng)生物學(xué)和計(jì)算機(jī)技術(shù)的共同進(jìn)步。在分析方法上,需要建立更加先進(jìn)的分析手段以高通量地獲取穩(wěn)定可靠的數(shù)據(jù),為系統(tǒng)生物學(xué)提供科學(xué)基礎(chǔ);在計(jì)算機(jī)技術(shù)上,應(yīng)深入挖掘數(shù)據(jù)并提供高效的數(shù)據(jù)處理和計(jì)算方法,實(shí)現(xiàn)對(duì)相關(guān)代謝途徑的系統(tǒng)認(rèn)知。
隨著人們?cè)絹碓秸J(rèn)識(shí)到代謝研究的重要性,代謝組學(xué)得到了愈加廣泛的應(yīng)用,包括疾病診斷、潛在生物標(biāo)志物鑒定、疾病發(fā)病機(jī)制闡明和代謝新通路揭示等,尤其是基于LC-MS的代謝組學(xué)技術(shù)更是突飛猛進(jìn)。在色譜分離方面,UPLC能夠?qū)崿F(xiàn)在短時(shí)間內(nèi)對(duì)復(fù)雜樣本的更高效分離;2D LC結(jié)合化學(xué)計(jì)量學(xué)的巨大進(jìn)步能夠大大提高代謝特征檢測(cè)量,實(shí)現(xiàn)代謝物的全面覆蓋。在質(zhì)譜分析方面,對(duì)于非靶向分析,高分辨質(zhì)譜已必不可少,尤其是與UPLC聯(lián)用;基于MRM模式的三重四極桿質(zhì)譜被認(rèn)為是靶向分析的“金標(biāo)準(zhǔn)”,基于PRM的高分辨質(zhì)譜亦逐步應(yīng)用于靶向代謝組學(xué)分析,并顯現(xiàn)出優(yōu)異的定量能力;結(jié)合非靶向和靶向分析優(yōu)勢(shì)的擬靶向技術(shù)顯示出與非靶向相接近的代謝物覆蓋度及與靶向相當(dāng)?shù)臄?shù)據(jù)質(zhì)量,得到了日益廣泛的應(yīng)用。
基于LC-MS的代謝組學(xué)尚存在以下待解決的問題:(1)大樣本的代謝組學(xué)研究需要更加快速、穩(wěn)健、重復(fù)性更高的分析方法,從而以更高的準(zhǔn)確度檢測(cè)代謝特征的差異;(2)對(duì)樣本量極少的代謝組學(xué)研究,需要發(fā)展超高靈敏的痕量代謝物檢測(cè)方法以實(shí)現(xiàn)代謝物的廣泛覆蓋;(3)仍需加強(qiáng)對(duì)代謝物的大規(guī)模準(zhǔn)確定性以推動(dòng)代謝物的生理學(xué)解釋;(4)亟待開發(fā)生物信息學(xué)工具以加速多組學(xué)數(shù)據(jù)整合。雖然目前的LC-MS技術(shù)遠(yuǎn)達(dá)不到代謝組學(xué)的需求,但相信隨著科研人員孜孜不倦的鉆研和代謝組學(xué)的深入發(fā)展,其必將會(huì)在疾病診療中發(fā)揮更大作用。