覃舒然,劉海翠,李大山,王文靜
云南中醫(yī)藥大學(xué)中藥學(xué)院,昆明 650500
化合物的結(jié)構(gòu)分析對(duì)于天然產(chǎn)物的發(fā)現(xiàn)至關(guān)重要,特別是對(duì)于珍稀或名貴中藥材的物質(zhì)基礎(chǔ)揭示。然而,高度多樣化的化合物結(jié)構(gòu)解析需要耗費(fèi)大量的時(shí)間和人力,這是對(duì)天然產(chǎn)物進(jìn)行表征的最大挑戰(zhàn)之一,因此將質(zhì)譜分子網(wǎng)絡(luò)技術(shù)應(yīng)用于天然產(chǎn)物的結(jié)構(gòu)研究中[1]。
液相色譜串聯(lián)質(zhì)譜(LC-MS/MS)是代謝組學(xué)中最常用的分析方法之一,然而,解釋這些復(fù)雜數(shù)據(jù)是天然產(chǎn)物研究的一大困難。近年來(lái),分子網(wǎng)絡(luò)等新型生物信息學(xué)方法的出現(xiàn),為復(fù)雜基質(zhì)中已知化合物的識(shí)別提供了新的思路和角度。其中全球天然產(chǎn)物分子網(wǎng)絡(luò)集群數(shù)據(jù)庫(kù)(Global Natural Products Social Molecular Networking,GNPS)是一個(gè)開(kāi)放的串聯(lián)質(zhì)譜數(shù)據(jù)的數(shù)據(jù)庫(kù),是目前唯一能夠?qū)崿F(xiàn)分子網(wǎng)絡(luò)的公共基礎(chǔ)平臺(tái)[2],能對(duì)LC-MS/MS生成的數(shù)據(jù)集進(jìn)行分析[3,4]。GNPS中分子網(wǎng)絡(luò)的可視化是將每個(gè)光譜表示為一個(gè)節(jié)點(diǎn),而光譜到光譜的排列則表示節(jié)點(diǎn)之間的聯(lián)系,可以于GNPS在線將相關(guān)分子圖譜可視化為分子網(wǎng)絡(luò)[5]。GNPS總共包括235850個(gè)譜圖和22644個(gè)化合物。GNPS不僅能夠做到鑒定已知化合物、類似物及自動(dòng)分析分子網(wǎng)絡(luò)中化合物,同時(shí)還具備對(duì)多來(lái)源的二級(jí)質(zhì)譜數(shù)據(jù)進(jìn)行復(fù)制鏈接及存儲(chǔ)管理的功能[6]。
質(zhì)譜分子網(wǎng)絡(luò)(molecular networking,MN)是一個(gè)MS/MS數(shù)據(jù)組織和可視化平臺(tái)。每個(gè)質(zhì)譜被認(rèn)為是一個(gè)向量,并使用余弦相似度與其他所有質(zhì)譜進(jìn)行比較,當(dāng)兩個(gè)質(zhì)譜之間的相似度高于閾值時(shí),它們就會(huì)在分子網(wǎng)絡(luò)中連接在一起[7,8]。2012年P(guān)ieter教授首次提出分子網(wǎng)絡(luò)技術(shù)[9],質(zhì)譜分子網(wǎng)絡(luò)是一種基于串聯(lián)質(zhì)譜分析(MS/MS)的方法,適用于各種類天然產(chǎn)物的分析,其目的是快速識(shí)別已知化合物和確定各種各樣未知的天然產(chǎn)物。簡(jiǎn)言之,該方法就是收集串聯(lián)質(zhì)譜數(shù)據(jù),并基于片段相似性來(lái)構(gòu)建網(wǎng)絡(luò)[10]。該技術(shù)已廣泛應(yīng)用于天然產(chǎn)物、代謝組學(xué)和藥物發(fā)現(xiàn)等領(lǐng)域[11,12]。
目前,Trivella等[13]和Fox Ramos等[14]報(bào)道MN已被證明是一種非常有效的工具,可以快速識(shí)別復(fù)雜混合物中的天然產(chǎn)物并且有助于發(fā)現(xiàn)新的天然產(chǎn)物[15];而Nothias-Esposito等[16]報(bào)道MN作為一種有效的工具用于以質(zhì)譜為基礎(chǔ)的代謝組學(xué)中來(lái)表征植物中特殊代謝物的生成;Kang等[17]運(yùn)用MN能將次級(jí)代謝物分類為類似的簇,該技術(shù)在天然產(chǎn)物研究中被用于篩選分離目標(biāo);Lei等[18]采用MN觀察到未加工附子及加工后附子的含量差異;除此之外,Tian等[6]報(bào)道了MN還可以清晰明了地觀測(cè)到不同品種不同產(chǎn)地茶葉的化學(xué)成分的差別,從而對(duì)茶葉進(jìn)行定性定量評(píng)價(jià);通過(guò)分析碎片離子的類型和碎片離子的相對(duì)含量變化來(lái)分析天然產(chǎn)物分子結(jié)構(gòu)的變化及其官能團(tuán)的轉(zhuǎn)化情況,來(lái)推斷天然產(chǎn)物是否生成或轉(zhuǎn)化。
MN是基于串聯(lián)質(zhì)譜數(shù)據(jù)的組織和可視化,通過(guò)光譜相似圖,揭示同源質(zhì)譜片段的存在。由于結(jié)構(gòu)類似的化合物具有相似的碎片光譜,它們的節(jié)點(diǎn)往往聚集在一起,形成類似物簇[19]。在相同的質(zhì)譜分離條件下,若天然產(chǎn)物分子有類似的結(jié)構(gòu)就會(huì)產(chǎn)生相似的質(zhì)譜碎片離子,計(jì)算機(jī)可以根據(jù)系統(tǒng)的算法對(duì)進(jìn)入高分辨質(zhì)譜后形成的二級(jí)質(zhì)譜碎片進(jìn)行相似度計(jì)算,根據(jù)碎片相似度的高低,然后依照類似度將質(zhì)譜碎片圖整合為一種能夠可視化的網(wǎng)絡(luò)圖譜。在MN中,密切相關(guān)的天然產(chǎn)物均具有相似的二級(jí)質(zhì)譜片段,并根據(jù)相同的生物合成來(lái)源對(duì)這些天然產(chǎn)物進(jìn)行分組,由此產(chǎn)生的簇允許對(duì)相同和類似分子進(jìn)行可視化搜索,通過(guò)與天然產(chǎn)物數(shù)據(jù)庫(kù)的比較,快速對(duì)已知代謝物進(jìn)行檢測(cè),并基于系統(tǒng)碎片化對(duì)類似物進(jìn)行識(shí)別[3,20]。MN可以提供一種快速、靈敏的方法來(lái)同時(shí)處理分析某植物提取物的化學(xué)成分,有效節(jié)約人力時(shí)間和精力。
MN在過(guò)去5年已經(jīng)發(fā)展起來(lái),成功地應(yīng)用于天然產(chǎn)物化學(xué)結(jié)構(gòu)研究,比如化合物鑒定、代謝物分離、生物研究、基因組測(cè)序和探索微生物菌株的優(yōu)先排序。這種技術(shù)與GNPS結(jié)合,能開(kāi)放地獲取數(shù)據(jù)庫(kù),用于對(duì)MS/MS譜數(shù)據(jù)共享,處理,加強(qiáng)特定化學(xué)類別和化合物的識(shí)別,并有助于對(duì)樣品進(jìn)行進(jìn)一步研究[13]。
GNPS平臺(tái)利用串聯(lián)質(zhì)譜(MS/MS)數(shù)據(jù)對(duì)化合物進(jìn)行注釋,允許具有高度相似的質(zhì)譜的節(jié)點(diǎn)組成簇,有助于使代謝組學(xué)中化學(xué)結(jié)構(gòu)可視化[21]。分子網(wǎng)絡(luò)與特征檢測(cè)方法相結(jié)合形成了基于特征的分子網(wǎng)絡(luò)(feature-based molecular networking,F(xiàn)BMN)。Phelan[22]提供了使用GNPS和FBMN生成分子網(wǎng)絡(luò)以注釋微生物天然產(chǎn)物的方法。但FBMN對(duì)骨架差異顯著的新化合物的有效鑒定仍然是困難的。He等[23]提出了一個(gè)基于生源砌塊的分子網(wǎng)絡(luò)(blocks-based molecular network,BBMN)策略,以進(jìn)一步探索一葉萩型生物堿的未知化學(xué)空間,這一策略的應(yīng)用能高效發(fā)現(xiàn)和鑒定Flueggeasuffruticosa中的三種新型一葉萩型生物堿,即suffranidines A~C。與經(jīng)典MN和FBMN相比,BBMN策略具有以下優(yōu)點(diǎn):1)高選擇性:選擇性地識(shí)別有特定生物遺傳特征片段的相關(guān)化合物;2)更快速:將龐大的MS2數(shù)據(jù)優(yōu)化為更簡(jiǎn)潔、更有針對(duì)性的數(shù)據(jù),使后續(xù)的數(shù)據(jù)分析更加快速。這一策略不僅可以有效地發(fā)現(xiàn)植物中新的天然產(chǎn)物,而且可以廣泛地應(yīng)用于探索動(dòng)物、微生物和海洋生物等。
建立MN主要有以下幾個(gè)步驟:對(duì)樣品進(jìn)樣分析,將進(jìn)樣后所得到的質(zhì)譜數(shù)據(jù)用Proteo Wizard軟件轉(zhuǎn)化為mzML、mzXML和mgf等通用格式文件,但因處理后依然會(huì)有一些干擾離子影響分子網(wǎng)絡(luò)的質(zhì)量,所以需采用Mzmine2軟件再次處理,上傳至GNPS數(shù)據(jù)分析平臺(tái),通過(guò)計(jì)算機(jī)計(jì)算比較樣品中所有化合物、標(biāo)準(zhǔn)化合物和GNPS收錄的化合物二級(jí)質(zhì)譜圖之間的相似度,通常以余弦值表示(相似度越大,則余弦值越大),然后根據(jù)相似度大小將所有分子離子數(shù)據(jù)整合成一張可視化的網(wǎng)絡(luò)圖譜(見(jiàn)圖1)。分子網(wǎng)絡(luò)圖中可直接看到樣品中所有未知化合物與標(biāo)準(zhǔn)化合物之間的結(jié)構(gòu)相似度,使用Cytoscape軟件可視化分子網(wǎng)絡(luò),可以將這些網(wǎng)絡(luò)具有的功能注釋和數(shù)據(jù)庫(kù)鏈接在一起研究,網(wǎng)絡(luò)圖中的節(jié)點(diǎn)代表分子,其中各節(jié)點(diǎn)之間由不同粗細(xì)的線段相連接,而這些線段代表這些分子之間相互作用的強(qiáng)弱[24,25]。
圖1 建立MN的步驟Fig.1 Steps of establishing MN
Proteo Wizard是一款模塊化用于質(zhì)譜數(shù)據(jù)讀取與格式轉(zhuǎn)化的開(kāi)放源代碼軟件,Proteo Wizard可將質(zhì)譜數(shù)據(jù)轉(zhuǎn)換為mzML、mzXML和mgf等基于文本的通用格式,用于表示描述掃描數(shù)、前體和二級(jí)質(zhì)譜離子和產(chǎn)生分子所需強(qiáng)度的質(zhì)譜數(shù)據(jù)[10]。
Mzmine2是一個(gè)主要針對(duì)LC-MS數(shù)據(jù),用于質(zhì)譜數(shù)據(jù)處理的開(kāi)源軟件。Mzmine2用于對(duì)批量或元mzXML文件來(lái)進(jìn)行數(shù)據(jù)處理,把處理后的數(shù)據(jù)生成csv和mgf文件,并導(dǎo)出用于分子網(wǎng)絡(luò)[10],且使用Mzmine2可以識(shí)別出同分異構(gòu)體[26]。Perruchon等[27]證明Mzmine2與分子網(wǎng)絡(luò)的結(jié)合可以加速生物樣品的去復(fù)制,進(jìn)而關(guān)注潛在的未知化合物。
Cytoscape是一個(gè)開(kāi)放源代碼軟件平臺(tái),用于可視化分子相互作用網(wǎng)絡(luò)和生物途徑,并將這些網(wǎng)絡(luò)與注釋、基因表達(dá)譜和其他狀態(tài)數(shù)據(jù)集成在一起,根據(jù)片段相似度對(duì)波譜進(jìn)行聚集后,將數(shù)據(jù)導(dǎo)入到Cytoscape中,顯示為節(jié)點(diǎn)和邊緣組成的網(wǎng)絡(luò)[3]。Cytoscape最初是為生物學(xué)研究設(shè)計(jì)的,現(xiàn)在已發(fā)展為一個(gè)復(fù)雜網(wǎng)絡(luò)分析和可視化的通用平臺(tái)。Cytoscape核心分布為數(shù)據(jù)集成、分析和可視化提供了一組基本特征。
由于生物信息學(xué)和分析化學(xué)的快速發(fā)展,特別是質(zhì)譜的發(fā)展促進(jìn)了天然產(chǎn)物的研究,串聯(lián)質(zhì)譜(MS/MS)和MN的結(jié)合已被證明是一種非常有效的工具,可以快速識(shí)別復(fù)雜混合物中的天然產(chǎn)物,并且有助于新穎天然產(chǎn)物的發(fā)現(xiàn)[13,14,23]。
Yuan等[28]將UPLC-LTQ-Orbitrap MS與MN相結(jié)合對(duì)鐵線蓮屬植物中三萜皂苷類成分進(jìn)行鑒別,可快速、可視化地區(qū)分6種植物中三萜皂苷的差異,其中長(zhǎng)花鐵線蓮、美花鐵線蓮、準(zhǔn)噶爾鐵線蓮和甘川鐵線蓮這4種鐵線蓮相似度較高,可在民族用藥中替代入藥;銀葉鐵線蓮三萜皂苷類成分較少,需謹(jǐn)慎替代入藥;鈍萼鐵線蓮中無(wú)三萜皂苷類成分,不可替代入藥。Huang等[29]在MN中識(shí)別出7個(gè)生物堿類型的粒子簇,藉此在夏天無(wú)中共鑒定和推測(cè)出52個(gè)化合物,其中有21個(gè)潛在的新化合物,6個(gè)化合物為首次在該植物中發(fā)現(xiàn)。Shen[30]建立酸棗仁已知成分的本地?cái)?shù)據(jù)庫(kù),對(duì)其成分進(jìn)行分類總結(jié),建立MN,通過(guò)UHPLC-Q-Orbitrap MS分析技術(shù),構(gòu)建了酸棗仁中化學(xué)成分快速識(shí)別的分析策略,鑒定了其提取物中的90個(gè)化合物,分別為64個(gè)黃酮類成分、21個(gè)生物堿類成分以及5個(gè)皂苷類成分。Nothias-Esposito等[16]采用MN比較了Euphorbiapithyusa和E.cupanii親緣關(guān)系較近的兩種大戟屬植物中二萜類化合物分布情況,發(fā)現(xiàn)10個(gè)曼西醇型化合物,6個(gè)premyrsinol衍生物和4個(gè)佛波醇酯。Pan等[31]以中藥金銀花為例,應(yīng)用MN對(duì)其復(fù)雜多類型成分進(jìn)行綜合鑒定,從中共鑒定出537個(gè)化合物,其中包括類黃酮和咖啡酰奎寧酸的新型二聚體等潛在的新結(jié)構(gòu)。Hu等[32]應(yīng)用MN成功地鑒定了烘焙咖啡豆中7個(gè)II型二萜類化合物,并且發(fā)現(xiàn)了一系列新穎的含氮的對(duì)映貝殼杉烷型二萜。Lyu等[33]應(yīng)用MN,對(duì)荔枝果肉提取物中的9種原花青素和11種黃酮苷進(jìn)行了定性分析。Areas等[34]利用UHPLC-HRMS和分子網(wǎng)絡(luò)對(duì)Lessingianthusbrevifolius(Less.) H.Rob.(Asteraceae)進(jìn)行了去重復(fù)研究,鑒定出其中的15個(gè)已知化合物,包括兩種倍半萜內(nèi)酯和13種黃酮類化合物。Ruan等[35]根據(jù)MS/MS碎片模式的相似性創(chuàng)建GNPS分子網(wǎng)絡(luò),運(yùn)用Cytoscape 3.6.1軟件篩選結(jié)構(gòu)相似的分子簇,在五味子中共鑒定出31個(gè)聯(lián)苯環(huán)辛二烯型木脂素類化學(xué)成分,其中的13個(gè)為首次鑒定。Jiang等[36]基于HPLC-Q-TOF-MS/MS數(shù)據(jù)的分子網(wǎng)絡(luò)分析來(lái)研究草烏中的二萜生物堿,九個(gè)標(biāo)準(zhǔn)品用于總結(jié)陽(yáng)離子模式下的碎片特征,進(jìn)一步用于確定兩組未知化合物的結(jié)構(gòu)。Brel等[37]應(yīng)用MN,允許通過(guò)串聯(lián)質(zhì)譜數(shù)據(jù)集組織把特定化學(xué)成分作為目標(biāo),對(duì)57株昆蟲(chóng)病原微生物進(jìn)行了篩選,結(jié)果表明,粉棒束孢BSNB-1250乙酸乙酯(EtOAc)提取物表現(xiàn)出抗菌活性和潛在的新化學(xué)成分:paecilosetin及5個(gè)新的類似物。McManus等[38]利用MN對(duì)Trichodesmiumthiebautii提取物進(jìn)行分析,發(fā)現(xiàn)其中充滿了鹵化化合物。隨后通過(guò)質(zhì)譜分離得到了異毛霉素C和毛霉素G~I(xiàn)。這些新的物質(zhì)與之前描述的毛霉素具有結(jié)構(gòu)的變化,通過(guò)比較研究能夠發(fā)現(xiàn)與小鼠神經(jīng)母細(xì)胞瘤細(xì)胞毒性相關(guān)的結(jié)構(gòu)特征。Rivera-Mondragón等[4]采用基于UPLC-MS/MS的MN與常規(guī)分離和核磁共振相結(jié)合的非靶向代謝組學(xué)方法對(duì)Crescentiacujete果肉進(jìn)行植物化學(xué)分析,分離并鑒定出66個(gè)化學(xué)成分。de Oliveira等[3]基于非靶向串聯(lián)質(zhì)譜的MN快速鑒定Adenocalymmaimperatoris-maximilianii萃取物中63個(gè)已知的黃酮類化合物(含同分異構(gòu)體),還利用MN首次從該植物中推導(dǎo)得到含異戊二烯基的黃酮衍生物。Reginaldo等[39]通過(guò)HR-LC-ESI-MS/MS分析脫水(旱季在其自然棲息地收獲)和水合(植物通過(guò)水合作用后在實(shí)驗(yàn)室培育)的Selaginellaspp.標(biāo)本,首次運(yùn)用MN對(duì)Selaginellaspp.中39個(gè)化學(xué)成分進(jìn)行結(jié)構(gòu)推定,主要為卷柏素和黃酮類化合物。Purves等[40]利用基于HR-MS/MS的MN對(duì)發(fā)酵提取物進(jìn)行比較,結(jié)果顯示,40%和42%的母離子分別是由南極和蘇格蘭的細(xì)菌分離物產(chǎn)生的,只有8%的物質(zhì)在這些地點(diǎn)中是共有的,表明生物地理高度影響其化學(xué)成分;研究所得到的MN中包含超過(guò)3500個(gè)母離子,質(zhì)荷比范圍為m/z149~2 558,說(shuō)明產(chǎn)生了豐富的次生代謝產(chǎn)物。Song等[41]采用MN對(duì)異喹啉類生物堿進(jìn)行聚類,尋找可能的化學(xué)成分。Wang等[42]基于MS/MS的分子網(wǎng)絡(luò)來(lái)研究Aspergilluscaelatus的化學(xué)成分,從而發(fā)現(xiàn)了新的二酮哌嗪二聚體和曲霉素。Freire等[43]通過(guò)基于特征的分子網(wǎng)絡(luò)、去復(fù)制和分離,對(duì)海綿Agelasdispar的甲醇部分進(jìn)行研究,發(fā)現(xiàn)了新的溴吡咯衍生物。Zhao等[44]基于UPLC-Q-TOF-MS、多元統(tǒng)計(jì)分析和MN的非目標(biāo)代謝組學(xué)方法在Morchellasp.與對(duì)照組之間鑒定出的50個(gè)差異化學(xué)成分,此外,基于分子網(wǎng)絡(luò)分析,鑒定了三種desferri-ferricrocin及其鐵螯合物的同源化合物,包括desferri-ferrichrome、desferri-ferrichrome C和一個(gè)新注釋的同系物。Caldas等[45]考慮到Gymnopilusimperialis可能含有大量化學(xué)成分,GNPS具有尋找化學(xué)成分、節(jié)省時(shí)間以及對(duì)天然產(chǎn)物的分離和表征方面的功能,從G.imperialis的甲醇、二氯甲烷和乙酸乙酯提取物中注釋了24個(gè)低聚異戊二烯,其中4個(gè)來(lái)自GNPS光譜庫(kù)匹配,20個(gè)來(lái)自基于分子網(wǎng)絡(luò)的預(yù)測(cè)。Luo等[46]基于MS/MS的分子網(wǎng)絡(luò)被用于開(kāi)發(fā)Xylariasp.的肽天然產(chǎn)物,從而發(fā)現(xiàn)了一種新的環(huán)七肽。Hu[47]通過(guò)UPLC-Q-TOF-MS技術(shù)結(jié)合診斷離子與分子網(wǎng)絡(luò)分析策略,從當(dāng)歸與酒當(dāng)歸中鑒定出126個(gè)化合物,包括28個(gè)苯酞類,32個(gè)有機(jī)酸類,8個(gè)香豆素類,8個(gè)黃酮類,16個(gè)氨基酸類,31個(gè)其它化合物。
Wu等[48]采用基于GNPS特征網(wǎng)絡(luò)的方法對(duì)黃金芽綠茶中9個(gè)黃酮苷、6個(gè)兒茶素和3個(gè)黃酮醇進(jìn)行了跟蹤并利用UPLC-MS2數(shù)據(jù)和GNPS分子網(wǎng)絡(luò)技術(shù)從黃金芽綠茶中發(fā)現(xiàn)具有乙酰膽堿酯酶抑制活性的新木質(zhì)素苷類化合物。Zhang等[49]采用基于GNPS的MN分析中根據(jù)碎片結(jié)構(gòu)的相似性,將燈盞細(xì)辛注射液中的化合物分為2大類別,分別是咖啡酰酯衍生物和黃酮類。Xu[50]利用基于GNPS平臺(tái)MN分析MyrotheciumroridumIFB-E091發(fā)酵產(chǎn)物組分的化學(xué)成分,以新環(huán)十肽MR-1和MR-2作為種子節(jié)點(diǎn)進(jìn)行分子網(wǎng)絡(luò)分析,結(jié)果發(fā)現(xiàn),組分Fr.5-3中存在環(huán)十肽化合物,除已分離得到的4個(gè)新環(huán)十肽MR-1~MR-4外,還存在3個(gè)環(huán)十肽MR-5~MR-7。
此外,MN還可以與空間分辨特征、雙電離模式MS/MS等相結(jié)合對(duì)天然產(chǎn)物進(jìn)行結(jié)構(gòu)分析,Kuo等[1]在空間分辨特征的指導(dǎo)下,將MN應(yīng)用于沉香的結(jié)構(gòu)分析中,對(duì)3大類的2-(2-苯乙基)色酮及其類似物進(jìn)行了表征。Li等[51]將基于特征的分子網(wǎng)絡(luò)(FBMN)和雙電離模式MS/MS相結(jié)合從銀杏葉提取物和銀杏葉中成功鑒定出95個(gè)化合物,其中包括黃酮苷、銀杏內(nèi)酯、木脂素苷、萜類和酚類化合物。
研究者們常采用LC-MS分析天然產(chǎn)物中的化學(xué)成分,采集各類樣品中化合物的質(zhì)譜數(shù)據(jù),再通過(guò)PCA、PLS-DA等得到的載荷圖和散點(diǎn)圖等對(duì)樣品進(jìn)行分類總結(jié),而采用了MN就能對(duì)其進(jìn)行可視化處理,快速鑒定,得出結(jié)論。
質(zhì)譜與代謝物的化學(xué)結(jié)構(gòu)相聯(lián)系,MN能夠根據(jù)生物體內(nèi)的代謝物的結(jié)構(gòu)相似性進(jìn)行分組,通過(guò)檢測(cè)代謝物之間相似性的關(guān)鍵信息,鑒定生物樣品的代謝物[16,52]。
采用MN可以快速地對(duì)生物體內(nèi)的代謝產(chǎn)物進(jìn)行鑒定。Gao等[53]將串聯(lián)質(zhì)譜與MN結(jié)合,通過(guò)GNPS觀察蛹蟲(chóng)草提取物處理的白血病細(xì)胞和對(duì)照組的代謝情況,對(duì)藥用真菌提取物和癌細(xì)胞的代謝產(chǎn)物結(jié)構(gòu)進(jìn)行解析,并半定量地識(shí)別其變化。Said等[10]基于LC-MS/MS的MN方法鑒定人類尿液中的可可酚代謝物,目的是提出一種有生物活性的酚類代謝物鑒定的方法。Xiong等[54]建立了UPLC-HRMS結(jié)合質(zhì)譜分子網(wǎng)絡(luò)分析血漿中代謝物的方法,共定性檢測(cè)到187個(gè)代謝物。Farag等[55]通過(guò)GNPS平臺(tái)的分子網(wǎng)絡(luò),利用LC串聯(lián)質(zhì)譜技術(shù),在體外培養(yǎng)人腸道微生物群后,共鑒定出生咖啡豆中的36個(gè)代謝產(chǎn)物,包括4個(gè)未報(bào)道的烷基肉桂酸酯和6個(gè)新的生物轉(zhuǎn)化產(chǎn)物。
此外,MN還能跟藥代動(dòng)力學(xué)相結(jié)合進(jìn)行相關(guān)研究,Wang等[56]將質(zhì)譜數(shù)據(jù)整合到分子網(wǎng)絡(luò)中,以發(fā)現(xiàn)天然藥物Ardisiajaponica(Thunb.) Blume的活性成分,在大鼠血漿中共識(shí)別出8個(gè)吸收的原型成分。Seo等[57]基于MS/MS的分子網(wǎng)絡(luò)系統(tǒng)研究了柘樹(shù)葉的提取物中生物活性成分的藥代動(dòng)力學(xué)特征,使用LC-QTOF/MS獲得血漿樣品的產(chǎn)物離子質(zhì)量數(shù)據(jù),并進(jìn)行分子網(wǎng)絡(luò)分析,由此產(chǎn)生的分子網(wǎng)絡(luò)圖表明,槲皮素和山奈酚的葡萄糖醛酸代謝物是主要的循環(huán)物種。
基于TOrTE(tandem-MS origin tracing engine)的MN可以快速分析不同來(lái)源樣品粗提物中的目標(biāo)化合物,并對(duì)其進(jìn)行定量表征[6]。先把每個(gè)節(jié)點(diǎn)的原始數(shù)據(jù)用TOrTE轉(zhuǎn)化成為“cluster_info.txt”格式的文件,再將這些文件轉(zhuǎn)化成“mzXML”格式的文件,而每個(gè)節(jié)點(diǎn)的色譜峰用Proteo Wizard軟件進(jìn)行提取,計(jì)算每個(gè)峰的峰面積,最后合并峰面積,并用Cytoscape軟件可視化為餅狀圖。每個(gè)節(jié)點(diǎn)代表一種化學(xué)成分,節(jié)點(diǎn)中不同顏色表示某一化學(xué)成分的不同來(lái)源,顏色在每個(gè)節(jié)點(diǎn)中占面積的大小表示某一化學(xué)成分在不同來(lái)源樣品中量的多少,即面積越大,其含量越大;而面積越小,其含量越小[24](見(jiàn)圖2)??捎行П苊馐褂么罅繕?biāo)準(zhǔn)品進(jìn)行定量的限制,提升實(shí)驗(yàn)結(jié)果的準(zhǔn)確度。
圖2 MN的定量過(guò)程Fig.2 Quantitative process of MN
Lei等[18]以高通量、高靈敏度的UPLC-Q-TOF/MS為基礎(chǔ),采用MN對(duì)未加工附子及加工后附子的整體化學(xué)成分進(jìn)行了綜合檢測(cè)和鑒定,鑒定出145個(gè)化合物,分析其含量差異。Winnikoff等[58]將培養(yǎng)的20種海洋藍(lán)藻粗提物的MS/MS數(shù)據(jù)集導(dǎo)入GNPS,生成分子網(wǎng)絡(luò),對(duì)幾種具有生物活性和生物合成吸引力的脂肽malyngamide C進(jìn)行定性和定量,其中產(chǎn)量最高的是巴拿馬的Okeaniahirsuta(PAB10FEB10-01),其含量達(dá)2.4%。Calabrese等[59]基于特征的分子網(wǎng)絡(luò)(FBMN)研究Zhanthoxylumheitzii中代謝物在植物器官中的分布,并發(fā)現(xiàn)潛在的新成分,總共檢測(cè)到143個(gè)代謝物,分別為生物堿、木脂素、多酚、脂肪酸和氨基酸類的代謝物,并對(duì)不同器官進(jìn)行了半定量分析。Ma等[60]運(yùn)用液相色譜-串聯(lián)質(zhì)譜法以及基于質(zhì)譜的分子網(wǎng)絡(luò)進(jìn)一步分析次生代謝產(chǎn)物的產(chǎn)量和多樣性,在糙米培養(yǎng)基中分別加入金合歡醇(1 μmol/L)、法尼焦磷酸銨鹽(5 μmol/L)、亞硫酸氫鈉甲萘醌(10 μmol/L)、3-氨基-L-酪氨酸(1 mmol/L)等4種誘導(dǎo)條件均可調(diào)控菌株C23-3次級(jí)代謝產(chǎn)物發(fā)生較明顯變化,其丁內(nèi)酯、土震素和洛伐他汀類化合物的多樣性和產(chǎn)量較為突出。Li等[61]基于分子網(wǎng)絡(luò),明顯觀察到炮制前后女貞子的化學(xué)成分在種類和含量上發(fā)生了很大變化。
MN將不同的天然產(chǎn)物分類為類似的支架簇,該技術(shù)在天然產(chǎn)物研究中被用于篩選分離目標(biāo)[17]。
可將MN與生物活性結(jié)合對(duì)天然產(chǎn)物進(jìn)行篩選分離:Nothias等[62]開(kāi)發(fā)了以生物活性為基礎(chǔ)的MN,用于發(fā)現(xiàn)天然產(chǎn)物生物測(cè)定引導(dǎo)的分離中的藥物先導(dǎo)物,提出了生物活性分子網(wǎng)絡(luò)的概念。Olivon等[19]利用多信息分子網(wǎng)絡(luò)分離具有生物活性的天然產(chǎn)物,使用大量的分子網(wǎng)絡(luò)嵌入不同的信息層(生物活性和分類數(shù)據(jù)),以突出粗提物的化學(xué)多樣性中潛在的生物活性支架,通過(guò)從兩個(gè)植物來(lái)源(Bocquillonianervosa和Neoguillauminiacleopatra)分離活性次生代謝產(chǎn)物瑞香烷型二萜原酸酯和4種12-deoxyphorbols,它們抑制Wnt信號(hào)通路,并顯示出對(duì)CHIKV病毒的抗病毒活性。Raheem等[63]采用代謝組學(xué)和生物活性指導(dǎo)的分離方法,并結(jié)合MN,從英國(guó)風(fēng)信子(Hyacinthoidesnon-scripta)中尋找到具有抗錐蟲(chóng)體活性為98.9%(20 μmol/L)的norlanostane型皂苷。Olivon等[64]通過(guò)多信息分子網(wǎng)絡(luò)的方法,從Codiaeumpeltatum中獲得抗病毒化合物。Cabral等[65]基于MN靶向分離Conchocarpusfontanesianus中6個(gè)新的吲哚吡多喹唑啉類生物堿。Naman等[66]結(jié)合MN和生物活性測(cè)定指導(dǎo)下的分離,可以從American Samoan采集的cf.Symplocasp.樣本中靶向分離出一種新的具有生物活性的環(huán)八肽——samoamide A,將生物活性篩選與MN的化學(xué)信息學(xué)策略相結(jié)合作為發(fā)現(xiàn)工具,加速了具有新的化學(xué)結(jié)構(gòu)和預(yù)期生物活性的天然產(chǎn)物的靶向分離。Han等[67]基于LC-MS/MS分子網(wǎng)絡(luò)的指導(dǎo)下,從Penicilliumcellarum中分離出具有葡萄糖攝取刺激活性的七種新的被疣青霉素衍生物penicicellarusins A~G,以及三種已知的類似物。
MN與結(jié)構(gòu)相結(jié)合對(duì)天然產(chǎn)物進(jìn)行篩選分離:Wu等[68]提出了結(jié)構(gòu)導(dǎo)向分離的概念,建立了一個(gè)抗病毒倍半萜分子網(wǎng)絡(luò),對(duì)Saussurealappa(Decne.) C.B Clarke進(jìn)行了研究,分離了七種新倍半萜,即lappaterpenes A~G。Mi等[69]基于MS/MS質(zhì)譜導(dǎo)向策略,將芫花花蕾的乙醇提取物通過(guò)硅膠粗分得到的餾分進(jìn)行LC-MS/MS測(cè)試,將所獲得的數(shù)據(jù)上傳到GNPS質(zhì)譜分析平臺(tái)進(jìn)行進(jìn)一步分析,分子網(wǎng)絡(luò)分析顯示有明顯與已知對(duì)照品化合物yuanhuacine節(jié)點(diǎn)連接的簇,這些節(jié)點(diǎn)則被視為瑞香烷型二萜類的衍生物,以此確定了富含二萜類成分的餾分,最終分離得到了4個(gè)未被描述以及8個(gè)已知的瑞香烷型二萜。
MN還能夠與核磁共振波譜法(nuclear magnetic resonance spectroscopy,NMR)、層次聚類分析(hierarchical clustering analysis,HCA)和超臨界流體色譜(supercritical fluid chromatography,SFC)等其他技術(shù)、方法相結(jié)合靶向分離目標(biāo)化合物,尤其是與NMR結(jié)合(見(jiàn)表1)。
表1 MN與NMR、HCA和SFC結(jié)合分離目標(biāo)化合物Table 1 MN was combined with NMR,HCA and SFC to separate the target compound
采用MN與一些傳統(tǒng)技術(shù)和方法相結(jié)合可以快速完成對(duì)復(fù)雜化學(xué)成分進(jìn)行鑒定,對(duì)樣品間的成分差異可視化,不僅能大大縮減了質(zhì)譜、核磁等數(shù)據(jù)分析化合物結(jié)構(gòu)的工作量,有效減少盲目性,而且能直觀快速分析出化合物在不同樣品中的分布。
Tian等[6]在Cytoscape軟件上分析在綠茶和黑茶中茶氨酸和表沒(méi)食子兒茶素沒(méi)食子酸酯的相對(duì)含量變化,將非發(fā)酵茶的綠茶與發(fā)酵茶黑茶做對(duì)比發(fā)現(xiàn),二者茶氨酸的相對(duì)含量均減小,而表沒(méi)食子兒茶素沒(méi)食子酸酯的相對(duì)含量卻在增加。Kalinski等[75]基于MN分析,然后進(jìn)行制備純化,以繪制七個(gè)樣本提取物中新的和已知的吡咯烷醌和相關(guān)化合物的多樣性,分析了Tsitsikammafavus海綿的次級(jí)代謝產(chǎn)物庫(kù),其中兩個(gè)樣本表現(xiàn)出不同的形態(tài)和化學(xué)特征:不含discorhabdins,只有微量的tsitsikammamines,相反,有大量未分支和鹵化的makaluvamines,這項(xiàng)研究為推測(cè)latrunculid海綿中pyrroloiminoquinone的生物合成途徑提供了新的線索。
上述研究通過(guò)運(yùn)用MN分析不同基團(tuán)的相對(duì)含量變化,推測(cè)各基團(tuán)的取代和合成順序,大大減少了生物合成途徑的工作量,為研究天然產(chǎn)物的生物合成途徑提供了參考。通過(guò)MN篩選出不同碎片離子,查找天然產(chǎn)物特征官能團(tuán)的特征碎片離子,通過(guò)對(duì)比驗(yàn)證,建立相關(guān)性,并以此為方法通過(guò)分析碎片離子的種類變化和相對(duì)含量變化追蹤天然產(chǎn)物分子結(jié)構(gòu)變化及官能團(tuán)的相互轉(zhuǎn)化,從而推斷天然產(chǎn)物的生成及轉(zhuǎn)化。
在過(guò)去的幾年中,MN作為一種新興工具[43]被提出來(lái)用于簡(jiǎn)化天然產(chǎn)物的結(jié)構(gòu)研究,已經(jīng)成功應(yīng)用于天然產(chǎn)物中化學(xué)成分及活性成分的發(fā)現(xiàn)、分離與制備、結(jié)構(gòu)鑒定、定量分析。MN適用于對(duì)天然產(chǎn)物進(jìn)行體內(nèi)成分及其代謝產(chǎn)物的研究,可更好地闡釋其藥效物質(zhì)基礎(chǔ)和代謝過(guò)程[24]。
運(yùn)用MN比對(duì)特征碎片離子,分析其種類和相對(duì)含量變化,得知天然產(chǎn)物分子結(jié)構(gòu)變化及官能團(tuán)的相互轉(zhuǎn)化,可用于推斷天然產(chǎn)物的生源合成途徑,但在文獻(xiàn)調(diào)研中發(fā)現(xiàn)國(guó)內(nèi)外相關(guān)報(bào)道尚不多見(jiàn),這也許將會(huì)是MN用于天然產(chǎn)物研究的一個(gè)新方向。
綜上所述,到目前為止,MN主要應(yīng)用于天然產(chǎn)物的結(jié)構(gòu)鑒定,其與其他技術(shù)相結(jié)合,是天然產(chǎn)物的結(jié)構(gòu)研究特別是新穎結(jié)構(gòu)和活性成分發(fā)現(xiàn)的一種高效快捷方法。體內(nèi)代謝、定量分析以及生物合成途徑方面的研究較少,是今后研究人員可以關(guān)注的方向。
天然產(chǎn)物研究與開(kāi)發(fā)2022年11期