李在芳, 鄭福建, 夏悅怡, 張秀瓊, 王鑫欣,趙春霞, 趙欣捷, 路 鑫*, 許國旺
(1. 中國科學(xué)院大連化學(xué)物理研究所, 中國科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室,遼寧省代謝組學(xué)重點(diǎn)實(shí)驗(yàn)室, 遼寧 大連 116023; 2. 中國科學(xué)院大學(xué), 北京 100049)
植物在進(jìn)化進(jìn)程中,為適應(yīng)復(fù)雜的生存環(huán)境及滿足發(fā)育需要,產(chǎn)生出種類繁多、數(shù)量巨大、結(jié)構(gòu)非常豐富的次生代謝物,在抵御生物/非生物脅迫、生物間互作以及信息傳遞等方面發(fā)揮重要作用[1],次生代謝途徑解析對(duì)植物分子育種及天然產(chǎn)物生物合成等具有重要意義。苯丙烷代謝是植物最重要的次生代謝合成途徑之一,與植物應(yīng)激誘導(dǎo)有著密切關(guān)系[2,3]。苯丙烷代謝有多個(gè)分支途徑,如黃酮途徑、木質(zhì)素途徑、木脂素途徑、羥基肉桂酸酰胺途徑等;骨架結(jié)構(gòu)經(jīng)多種后修飾,如羥基化、糖基化、乙?;?、異戊二烯化、硫酸化和甲基化等,產(chǎn)生了復(fù)雜多樣的苯丙烷途徑代謝物。
基于液相色譜-高分辨串聯(lián)質(zhì)譜(LC-HRMS/MS)的代謝組學(xué)分析技術(shù)為次生代謝物鑒定及途徑闡釋提供了手段[4-7]。如Wen等[8]基于非靶向LC-HRMS/MS代謝組學(xué)技術(shù)鑒別了玉米中29個(gè)類黃酮,通過整合基因組學(xué)、轉(zhuǎn)錄組學(xué)信息,揭示了玉米黃酮生物合成的遺傳學(xué)基礎(chǔ)。牟紅梅等[9]基于超高效液相色譜-串聯(lián)質(zhì)譜的非靶向代謝組學(xué)分析研究了成熟期茄梨和紅茄梨果皮代謝物差異,發(fā)現(xiàn)差異代謝物涉及黃酮代謝、氨基酸代謝、苯丙烷代謝以及苯丙烷分支途徑黃酮代謝等。胡永丹等[10]基于超高效液相色譜-高分辨質(zhì)譜聯(lián)用技術(shù)分析茶樹花化學(xué)成分,采用氮規(guī)則、質(zhì)量虧損和特征子離子篩選目標(biāo)化學(xué)成分,從7個(gè)茶樹花樣本中共鑒定出137個(gè)化合物。非靶向代謝組學(xué)采集了非常豐富的質(zhì)譜信號(hào),包括一級(jí)質(zhì)譜和二級(jí)質(zhì)譜(MS & MS/MS),代謝組鑒定多采用質(zhì)譜數(shù)據(jù)庫搜索方式[11]。盡管全球天然產(chǎn)物社會(huì)分子網(wǎng)絡(luò)(Global Natural Products Social Molecular Networking, GNPS)數(shù)據(jù)庫已收錄免費(fèi)共享的83 314張MS/MS譜圖,但與復(fù)雜多樣的植物代謝組,特別是次生代謝組相比,質(zhì)譜庫的覆蓋范圍仍不足,搜庫鑒定能力有限[12]。利用非靶向代謝組實(shí)驗(yàn)數(shù)據(jù),構(gòu)建基于質(zhì)譜相似性(MS/MS similarity)的分子網(wǎng)絡(luò)(molecular networking, MN)[13,14],可人工推斷注釋數(shù)據(jù)庫無法鑒定的結(jié)構(gòu)類似物[15]。如Clements等[16]采用代謝組學(xué)結(jié)合分子網(wǎng)絡(luò)的方法,推測了一種新型開環(huán)賽氏菌縮肽(serratamolide)類似物的結(jié)構(gòu)。但該方法不能有效篩選目標(biāo)途徑相關(guān)分子簇,且方法注釋能力主要依賴分子簇內(nèi)可搜庫注釋的種子節(jié)點(diǎn)。植物次生代謝物結(jié)構(gòu)存在大量修飾基團(tuán),在MS/MS中常以中性丟失形式體現(xiàn)[17]。植物代謝途徑數(shù)據(jù)庫包含大量代謝反應(yīng)信息,如植物代謝途徑(Plant Metabolic Pathways,PlantCyc,https://www.plantcyc.org/)[18]收錄了5 234個(gè)反應(yīng),京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG, https://www.genome.jp/kegg/)收錄了11 744個(gè)生化反應(yīng)。將代謝途徑中的修飾反應(yīng)用于非靶向數(shù)據(jù)中代謝特征的篩選,可有助于提高途徑代謝物的發(fā)現(xiàn)效率[19]。
為此,本研究針對(duì)次生代謝物種類多、結(jié)構(gòu)復(fù)雜,且存在大量未知結(jié)構(gòu)代謝物的分析挑戰(zhàn),以玉米葉片苯丙烷途徑代謝物為例,利用代謝途徑的修飾反應(yīng)以及現(xiàn)有質(zhì)譜數(shù)據(jù)庫,發(fā)展用于非靶向LC-HRMS/MS代謝組數(shù)據(jù)中重要途徑代謝物篩選和注釋的新方法,為次生代謝物的注釋和途徑解析提供新思路。
ACQUITY UPLC超高效液相色譜系統(tǒng)購自美國Waters公司。Triple TOF 5600+飛行時(shí)間質(zhì)譜(TOF-MS)購自美國AB SCIEX公司。超純水由購自美國Billerica公司的Milli-Q系統(tǒng)純化制備。乙腈(HPLC級(jí))和甲醇(HPLC級(jí))購自德國Merck公司。甲酸(純度98%)和碳酸氫銨購自中國J & K Scientific有限公司。
玉米葉片代謝組提取:準(zhǔn)確稱取玉米新鮮葉片組織凍干粉50 mg,置于1.5 mL離心管中。加入1.0 mL 80%(v/v)甲醇水提取劑,渦旋提取5 min,在4 ℃條件下,以21 500 g轉(zhuǎn)速離心10 min。取700 μL上清液,放入真空離心濃縮儀凍干。凍干樣品加入100 μL 80%(v/v)甲醇水復(fù)溶,復(fù)溶液在4 ℃條件下,以21 500 g轉(zhuǎn)速離心10 min。取上清液用于儀器分析。
正離子模式下的液相色譜條件 Waters ACQUITY BEH C18色譜柱(100 mm×2.1 mm, 1.7 μm);柱溫:50 ℃;進(jìn)樣器溫度:4 ℃;流動(dòng)相A: 0.1%(v/v)甲酸水溶液;流動(dòng)相B: 0.1%(v/v)甲酸乙腈溶液;流速:0.35 mL/min;進(jìn)樣量:5 μL。洗脫梯度:0~1.0 min, 5%B; 1.0~24.0 min, 5%B~100%B; 24.0~28.0 min, 100%B; 28.0~28.1 min, 100%B~5%B; 28.1~30.0 min, 5%B。
負(fù)離子模式下的液相色譜條件 Waters ACQUITY HSS T3色譜柱(100 mm×2.1 mm, 1.8 μm);柱溫:50 ℃;進(jìn)樣器溫度:4 ℃;流動(dòng)相A: 6.5 mmol/L碳酸氫銨水溶液;流動(dòng)相B: 含6.5 mmol/L碳酸氫銨的95%(v/v)甲醇水溶液;流速:0.35 mL/min;進(jìn)樣量:5 μL。洗脫梯度:0~1.0 min, 2%B; 1.0~18.0 min, 2%B~100%B; 18.0~22.0 min, 100%B; 22.0~22.1 min, 100%B~2%B; 22.1~25.0 min, 2%B。
質(zhì)譜條件 離子源:電噴霧電離(ESI)源,采用正、負(fù)離子模式檢測;掃描方式:一級(jí)全掃描質(zhì)量范圍m/z50~1 250;二級(jí)數(shù)據(jù)依賴型掃描(Top 15)質(zhì)量范圍m/z50~1 250;碰撞能量:15、30和45 eV;離子源溫度:500 ℃;電噴霧電壓:4 500 V;氣簾氣壓強(qiáng):0.241 MPa;霧化氣(gas 1)壓強(qiáng):0.345 MPa;加熱氣(gas 2)壓強(qiáng):0.345 MPa。
1.4.1原始數(shù)據(jù)預(yù)處理
采用MarkerView 1.2.1軟件處理質(zhì)譜原始數(shù)據(jù),獲得包含代謝特征保留時(shí)間、質(zhì)荷比和峰強(qiáng)度的質(zhì)譜峰列表。采用ProteoWizard 3.0.10240軟件將質(zhì)譜原始數(shù)據(jù)文件轉(zhuǎn)化為. mgf格式的二級(jí)質(zhì)譜文件。
1.4.2修飾代謝組篩選
首先,從代謝途徑數(shù)據(jù)庫收集修飾反應(yīng),將修飾類型的名稱、分子式和精確相對(duì)分子質(zhì)量整理至.csv格式的文件中,生成修飾類型列表。將非靶向代謝組數(shù)據(jù)的質(zhì)譜峰列表、二級(jí)質(zhì)譜文件,以及修飾類型列表作為輸入文件,運(yùn)行自編程序包ModifiedMetMRM。設(shè)置質(zhì)譜峰列表與二級(jí)質(zhì)譜文件的匹配參數(shù)為質(zhì)量精度15×10-6,保留時(shí)間窗口12 s?;谛揎楊愋土斜慝@取非靶向代謝組數(shù)據(jù)中修飾代謝組的匹配參數(shù)為質(zhì)量窗口15×10-6,子離子最低絕對(duì)強(qiáng)度為100。離子融合參數(shù)為質(zhì)量窗口15×10-6,保留時(shí)間窗口12 s。
1.4.3探針分子數(shù)據(jù)庫構(gòu)建
下載GNPS(https://gnps.ucsd.edu/)中的3個(gè)質(zhì)譜數(shù)據(jù)集(GNPS Library, NIH Natural Products Library Round 1和NIH Natural Products Library Round 2)。采用自編代碼收集3個(gè)數(shù)據(jù)庫化合物的SMILES,并在ChemDes平臺(tái)(http://www.scbdd.com/convert/convert/)將其轉(zhuǎn)化為InChIKey。利用ClassyFire(https://cfb.fiehnlab.ucdavis.edu/)工具獲得化合物的化學(xué)分類,保留其中苯丙烷類化合物,獲取化合物的相關(guān)信息,包括采集MS/MS的儀器類型、SMILES和二級(jí)質(zhì)譜圖等。
圖 1 重要途徑代謝物的篩選與注釋流程Fig. 1 Workflow of screening and annotation of pathway-associated metabolites KEGG: the Kyoto Encyclopedia of Genes and Genomes; MN: molecular networking; GNPS: Global Natural Products Social Molecular Networking.
1.4.4分子網(wǎng)絡(luò)構(gòu)建
分子網(wǎng)絡(luò)由開源工具GNPS平臺(tái)完成。建網(wǎng)參數(shù):不少于6個(gè)子離子匹配,MS/MS相似度閾值為0.7;母離子質(zhì)量精度閾值:0.01 Da;子離子質(zhì)量精度閾值:0.02 Da;單個(gè)連通網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)最大值:500;單個(gè)節(jié)點(diǎn)最大相鄰節(jié)點(diǎn)數(shù):50。分子網(wǎng)絡(luò)可視化由軟件Cytoscape 3.8.0實(shí)現(xiàn)。
1.4.5代謝物定性
采用基于SMRT數(shù)據(jù)集構(gòu)建的GNN-RT模型[20],通過標(biāo)準(zhǔn)品遷移學(xué)習(xí)預(yù)測本實(shí)驗(yàn)色譜條件下的保留時(shí)間;使用開源工具CFM-ID 4.4.3 (https://hub.docker.com/r/wishartlab/cfmid)預(yù)測代謝物的虛擬(insilico)二級(jí)質(zhì)譜;二級(jí)質(zhì)譜相似度計(jì)算采用譜熵算法[21]。代謝物化學(xué)類別預(yù)測采用SIRIUS 4[22]中的CANOPUS[12]完成,使用默認(rèn)參數(shù)。
方法總體框架如圖1所示,途徑代謝物的篩選與注釋步驟主要包括:1)基于公共代謝途徑數(shù)據(jù)庫及文獻(xiàn)報(bào)道,收集參與途徑的修飾反應(yīng),構(gòu)建修飾基團(tuán)質(zhì)譜數(shù)據(jù)庫,進(jìn)而從非靶向?qū)嶒?yàn)數(shù)據(jù)中篩選修飾代謝組(含有修飾基團(tuán)的代謝物); 2)從開源質(zhì)譜數(shù)據(jù)庫中收集目標(biāo)途徑代謝物及其類似物作為探針分子,構(gòu)建探針分子串聯(lián)質(zhì)譜數(shù)據(jù)庫;3)將探針分子與修飾代謝組共建分子網(wǎng)絡(luò);4)篩選目標(biāo)途徑代謝物分子簇;5)基于探針分子結(jié)構(gòu)、修飾基團(tuán)、子結(jié)構(gòu)信息等注釋代謝物。
利用開源代謝途徑知識(shí)庫,如:KEGG、PlantCyc以及文獻(xiàn)報(bào)道[23-25],收集參與苯丙烷途徑的代謝反應(yīng),提取修飾基團(tuán)。表1給出了收集到的61種修飾反應(yīng)類型,包括11種通用修飾類型(甲基化、甲氧基化、羥基化、甲氨基化、乙?;?、羧基化、硫酸化、丙二?;?、戊糖基化、脫氧己糖基化和己糖基化)和50種途徑特異性修飾類型(13種胺結(jié)合、5種羥基肉桂酰結(jié)合、13種酸結(jié)合、18種醇結(jié)合和1種異戊二烯化修飾)。
表 1 參與苯丙烷代謝的后修飾反應(yīng)Table 1 Modifications involved in phenylpropanoids biosynthesis
從玉米葉片正、負(fù)離子模式非靶向代謝組學(xué)數(shù)據(jù)中篩選到60種修飾類型,對(duì)應(yīng)1 385個(gè)和1 412個(gè)代謝物。其中,正、負(fù)離子模式下分別有32.27%(447/1 385)和26.06%(368/1 412)的代謝物含有兩種及以上修飾基團(tuán),通用修飾類型占比32.31%(正離子模式)和34.85%(負(fù)離子模式);正離子模式下,特異性修飾類型主要是胺結(jié)合(7.76%)、羥基肉桂酰結(jié)合(8.09%)、酸結(jié)合(13.91%)和醇結(jié)合(36.28%)修飾;異戊二烯化修飾占比較低,僅為1.66%。負(fù)離子模式與正離子模式類似,上述特異性修飾及異戊二烯化修飾的占比分別為3.94%、13.62%、19.21%、28.12%和0.26%。
基于ClassyFire[26]化學(xué)分類從GNPS數(shù)據(jù)庫中包含天然產(chǎn)物較多的3個(gè)質(zhì)譜數(shù)據(jù)集(GNPSLibrary、NIH Natural Products Library Round 1和NIH Natural Products Library Round 2)中共收集到1 542個(gè)苯丙烷類化合物的正離子模式二級(jí)譜圖2 677張和661個(gè)苯丙烷類化合物的負(fù)離子模式二級(jí)譜圖814張,建立探針分子串聯(lián)質(zhì)譜數(shù)據(jù)庫。圖2給出了探針分子二級(jí)質(zhì)譜采集條件統(tǒng)計(jì),其中來自飛行時(shí)間質(zhì)譜的二級(jí)譜圖占主要的比重,正、負(fù)離子模式占比分別為83.75%和97.67%(見圖2a)。對(duì)探針分子的化學(xué)類別進(jìn)行統(tǒng)計(jì),分屬36個(gè)亞類,其中類黃酮、異黃酮、香豆素及其衍生物、肉桂酸及其衍生物占比較大,正、負(fù)離子模式占比分別為68.61%和71.26%(見圖2b)。
圖 2 探針分子串聯(lián)質(zhì)譜數(shù)據(jù)庫收錄統(tǒng)計(jì)Fig. 2 Statistics of the probe molecule MS/MS database
將探針分子與玉米葉片中篩選出的修飾代謝組共建分子網(wǎng)絡(luò),選取其中苯丙烷途徑代謝物所在的分子簇。分子簇篩選條件為:簇內(nèi)同時(shí)含有探針分子與修飾代謝物,或雖不含探針分子但含有一個(gè)及以上途徑特異性修飾的代謝物。滿足篩選條件的分子簇中共含有392(正離子模式)和417個(gè)(負(fù)離子模式)修飾代謝物。圖3a所示為負(fù)離子模式篩選出的分子簇,簇內(nèi)的探針分子可快速提示簇內(nèi)代謝物所屬的途徑信息。如圖3b所示,簇內(nèi)8個(gè)探針分子(黃色)均為木脂素類化合物,提示該分子簇為木脂素及其結(jié)構(gòu)類似物。僅含途徑特異性修飾基團(tuán)的代謝物分子簇如圖3c,簇內(nèi)含有木脂素途徑特異性醇結(jié)合的修飾基團(tuán),如松柏醇(non-condensed coniferyl alcohol)和芥子醇(non-condensed sinapyl alcohol)等,該分子簇也被快速識(shí)別為木脂素途徑代謝物。
圖 3 基于探針-修飾組分子網(wǎng)絡(luò)篩選出的苯丙烷途徑代謝物Fig. 3 Phenylpropanoids pathway-associated metabolites screened by probes-modified metabolome molecular network a. phenylpropanoids pathway-associated clusters in negative ion mode; b. co-cluster consisting of both probe molecules and modified metabolites; c. modified metabolites with one or more pathway-specific modification types.
對(duì)篩選出的途徑代謝物進(jìn)行結(jié)構(gòu)注釋,對(duì)于含有探針分子的分子簇,以探針分子為初始種子節(jié)點(diǎn),結(jié)合修飾基團(tuán)信息進(jìn)行網(wǎng)絡(luò)傳播注釋。以圖3b紅色虛框中紫色節(jié)點(diǎn)(m/z697.228 6)的注釋為例,其相鄰黃色節(jié)點(diǎn)為探針分子9″-O-Z-p-香豆酰-9″′-O-E-p-香豆酰-(7S,8S)-愈創(chuàng)木酰甘油8-O-4′-松柏醚(9″-O-Z-p-coumaroyl-9″′-O-E-p-coumaroyl-(7S,8S)-guaiacylglycerol 8-O-4′-coniferyl ether,m/z667.218 0);它們之間存在Δm/z為30.010 5的質(zhì)量差,推斷其為探針分子甲氧基化修飾的產(chǎn)物。此外,該節(jié)點(diǎn)只有香豆酰(coumaroyl)一種修飾(中性丟失),說明甲氧基化修飾未發(fā)生在香豆酰部分。進(jìn)一步從該節(jié)點(diǎn)的二級(jí)譜圖可知,香豆酰(146.035 7)以中性形式丟失后,產(chǎn)生子離子m/z551.192 9,它與子離子m/z341.101 2之間可能存在m/z210.091 7的中性丟失,從表1可知?dú)w屬為非縮合芥子醇(non-condensed sinapyl alcohol),基于該子結(jié)構(gòu)推斷甲氧基化修飾僅能發(fā)生在阿魏醇(feruloyl alcohol)上。對(duì)其二級(jí)質(zhì)譜碎片離子進(jìn)行子結(jié)構(gòu)注釋(見圖4a),并將碎片信息進(jìn)行化合物結(jié)構(gòu)拼接,將得到的結(jié)構(gòu)搜索PubChem數(shù)據(jù)庫,確定為稀有木脂素A(dadahol A)。
圖 4 (a)基于已知相鄰節(jié)點(diǎn)的代謝物傳播注釋和(b)代謝物從頭注釋Fig. 4 (a)Annotation of metabolites with known neighbor-nodes and (b) de novo annotation of metabolites
對(duì)只含有途徑特異性修飾代謝物的分子簇,如簇內(nèi)有可被搜庫鑒定的節(jié)點(diǎn),則以注釋節(jié)點(diǎn)為初始種子,注釋過程與含有探針分子的分子簇類似。對(duì)于無相鄰注釋節(jié)點(diǎn)的修飾代謝物采用從頭注釋方式,如圖3c所示簇內(nèi)代謝物僅有修飾基團(tuán)提供的子結(jié)構(gòu)信息。以簇末端代謝物(m/z551.191 5)的結(jié)構(gòu)解析為例說明如下:該代謝物含有非縮合松柏醇(non-condensed coniferyl alcohol)子結(jié)構(gòu),經(jīng)中性丟失(m/z180.078 6)產(chǎn)生m/z371.111 2的子離子;另外還有香豆酸(coumaric acid)特征離子(m/z163.037 7),它與子離子m/z371.111 2之間可能存在m/z208.073 5的中性丟失;該中性丟失與修飾基團(tuán)庫中的非縮合芥子醇(m/z210.089 2)相差2.015 7,推斷可能是非縮合芥子醇開環(huán)失去2個(gè)H;將得到的子結(jié)構(gòu)非縮合松柏醇、香豆酸和非縮合芥子醇進(jìn)行拼接,符合二級(jí)譜圖注釋結(jié)果的僅存在一種合理結(jié)構(gòu)(見圖4b)。該結(jié)構(gòu)經(jīng)PubChem和SciFinder數(shù)據(jù)庫搜索,均未見收錄。采用上述注釋方法,將正、負(fù)離子均注釋出的同一代謝物,根據(jù)其結(jié)構(gòu)去冗余后共初步注釋出129個(gè)苯丙烷途徑代謝物,其中89個(gè)在PubChem和SciFinder數(shù)據(jù)庫中已有收錄,26個(gè)為數(shù)據(jù)庫未報(bào)道的“未知結(jié)構(gòu)”化合物。采用注釋代謝物的MS/MS對(duì)其結(jié)構(gòu)進(jìn)一步驗(yàn)證,其中68個(gè)注釋代謝物的化合物類別可被準(zhǔn)確預(yù)測為苯丙烷代謝物。對(duì)其中115個(gè)有確切結(jié)構(gòu)的代謝物(其余14個(gè)為同分異構(gòu)體)預(yù)測其保留時(shí)間,其中102個(gè)代謝物的預(yù)測保留時(shí)間相對(duì)誤差小于30%。采用CFM-ID工具預(yù)測了115個(gè)代謝物的二級(jí)譜圖,并計(jì)算了與實(shí)驗(yàn)二級(jí)譜圖的相似性;其中,具有較高相似性(>0.5)的代謝物有28個(gè),較相似(0.4~0.5)的代謝物有30個(gè),有一定相似性(<0.4)的有57個(gè)。此外,對(duì)其中10個(gè)有標(biāo)準(zhǔn)品的代謝物進(jìn)行了驗(yàn)證,驗(yàn)證結(jié)果顯示注釋結(jié)構(gòu)正確。
從注釋結(jié)果可知,129個(gè)苯丙烷途徑代謝物涉及苯丙烷下游主要分支途徑產(chǎn)生的次生代謝物(見圖5),如黃酮分支途徑的8個(gè)類黃酮、19個(gè)氧苷類黃酮、32個(gè)碳苷類黃酮,羥基肉桂酸途徑的31個(gè)羥基肉桂酸酰胺及其衍生物,以及木脂素合成途徑的22個(gè)(新)木脂素/木脂素苷等。其中4個(gè)氧苷類黃酮、4個(gè)碳苷類黃酮、6個(gè)羥基肉桂酸酰胺及其衍生物和11個(gè)木脂素結(jié)構(gòu)在PubChem和SciFinder數(shù)據(jù)庫中均未被收錄(見圖5括號(hào)內(nèi)紅色數(shù)字)。
圖 5 注釋代謝物的分支途徑分布Fig. 5 Distributions of annotated metabolites in the downstream branches of the phenylpropanoid pathwayRed numbers in brackets: previously unreported in both PubChem and SciFinder databases.
本研究以苯丙烷途徑代謝物的篩選和注釋為例,發(fā)展了一種基于修飾組和探針分子的重要途徑代謝物高效篩選和注釋方法。僅從一種玉米葉片組織中就注釋出了129個(gè)苯丙烷途徑代謝物,其中有26個(gè)未被PubChem和SciFinder數(shù)據(jù)庫收錄,顯示了方法在發(fā)現(xiàn)與注釋途徑代謝物特別是未在數(shù)據(jù)庫收錄的“未知結(jié)構(gòu)”代謝物方面的能力。鑒于目前途徑數(shù)據(jù)庫提供的修飾反應(yīng)尚不全面,以及開源質(zhì)譜數(shù)據(jù)庫因譜圖質(zhì)量、儀器采集條件差異等原因,方法注釋能力還未能充分發(fā)揮。隨著數(shù)據(jù)庫信息的不斷積累和完善,以及基于機(jī)器學(xué)習(xí)的子結(jié)構(gòu)預(yù)測方法不斷成熟,未來將在重要代謝途徑挖掘和利用方面發(fā)揮更大的作用。