杜國(guó)榮 ,董怡青,李 跑*
(1.湖南農(nóng)業(yè)大學(xué) 食品科學(xué)技術(shù)學(xué)院,食品科學(xué)與生物技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410128;2.上海煙草集團(tuán)有限責(zé)任公司技術(shù)中心 北京工作站,北京 101121)
色譜及其聯(lián)用技術(shù),如氣相色譜-質(zhì)譜(GC-MS)、高效液相色譜/二極管陣列檢測(cè)器(HPLC/DAD)以及高效液相色譜-質(zhì)譜(HPLC-MS)等得到了飛速發(fā)展,在復(fù)雜環(huán)境、醫(yī)藥、生物樣品分析中得到了廣泛應(yīng)用,并向高通量、簡(jiǎn)單、快速、靈敏、低成本的方向發(fā)展[1-3]。其中,自動(dòng)化色譜分析是現(xiàn)階段研究的重點(diǎn)和難點(diǎn)。自動(dòng)化色譜分析研究主要通過(guò)采用自動(dòng)化的進(jìn)樣方式、改進(jìn)分離分析模式或儀器的硬件結(jié)構(gòu)來(lái)實(shí)現(xiàn)快速和批量分析。一方面采取合理的樣品前處理方法,以實(shí)現(xiàn)待測(cè)物與干擾物的分離,另一方面采取先進(jìn)的分離手段,以實(shí)現(xiàn)待測(cè)組分之間的完全分離。這些手段在硬件方面為自動(dòng)化檢測(cè)奠定了基礎(chǔ)。此外,自動(dòng)化的色譜解析以及組分的定性和定量分析必須有可靠的數(shù)據(jù)采集和處理軟件作保證。然而,在自動(dòng)化色譜分析的軟件方面存在較多問(wèn)題:一方面對(duì)于儀器得到的復(fù)雜二維或更高維數(shù)據(jù)的分析相較于一維數(shù)據(jù)的分析并未得到同等的重視,即使采用了先進(jìn)的自動(dòng)化進(jìn)樣技術(shù)和分離手段,對(duì)于復(fù)雜數(shù)據(jù)的分析仍需大量人力來(lái)實(shí)現(xiàn);另一方面,由于分析對(duì)象的復(fù)雜性,低含量組分的信號(hào)易受到其它干擾組分的影響而導(dǎo)致無(wú)法實(shí)現(xiàn)準(zhǔn)確的定性定量分析[4]。
化學(xué)計(jì)量學(xué)在背景噪聲的自動(dòng)化扣除或組分信息的自動(dòng)化提取領(lǐng)域取得了卓越的成效,為復(fù)雜色譜信號(hào)自動(dòng)化解析提供了新思路。針對(duì)復(fù)雜色譜信號(hào)的解析問(wèn)題,科學(xué)家建立了多種化學(xué)計(jì)量學(xué)方法,如化學(xué)因子分析[5-6]、多元曲線(xiàn)分辨-交替最小二乘法[7]、小波變換[8]、免疫算法[9-10]等。但現(xiàn)有的化學(xué)計(jì)量學(xué)方法并不能完全有效地實(shí)現(xiàn)復(fù)雜體系色譜信號(hào)的自動(dòng)化解析。其主要原因在于:①對(duì)操作者的各類(lèi)解析方法熟悉度要求較高。大部分化學(xué)計(jì)量學(xué)方法參數(shù)較多,需人工干預(yù)才能達(dá)到較好的解析目的,提高了對(duì)操作者的經(jīng)驗(yàn)要求;②對(duì)于干擾嚴(yán)重的色譜信號(hào),大多數(shù)化學(xué)計(jì)量學(xué)方法解析效率較低、時(shí)間長(zhǎng),甚至不能有效實(shí)現(xiàn)信號(hào)的準(zhǔn)確解析,因而不能滿(mǎn)足復(fù)雜色譜信號(hào)的自動(dòng)化解析需求。
圖1 色譜數(shù)據(jù)自動(dòng)化分析程序Fig.1 Flowchart of automated chromatographic data analysis
為此,自動(dòng)化色譜解析算法成為科研工作者關(guān)心的重點(diǎn),大量自動(dòng)化解析算法被提出[11-50]。如圖1所示,色譜數(shù)據(jù)自動(dòng)化分析程序主要包括4部分:自動(dòng)色譜峰識(shí)別(Automatic chromatographic peak detection,ACPD)、背景以及基線(xiàn)漂移校正(Background drift correction,BDC)、色譜譜峰漂移校正以及重疊色譜峰的解析[11-12]。本文對(duì)近年來(lái)發(fā)展的復(fù)雜色譜信號(hào)自動(dòng)化解析中與這四部分相關(guān)的化學(xué)計(jì)量學(xué)方法原理與應(yīng)用進(jìn)行了總結(jié)與評(píng)述。
色譜信號(hào)中組分的定性與定量分析的關(guān)鍵在于色譜峰的準(zhǔn)確識(shí)別。色譜圖中每個(gè)色譜峰對(duì)應(yīng)一個(gè)組分,但由于儀器和環(huán)境因素的影響,譜圖中常出現(xiàn)未能完全分離的重疊色譜峰以及不規(guī)則峰形,如前肩峰、后肩峰、拖尾峰甚至負(fù)峰等。這些不規(guī)則峰的出現(xiàn)加大了ACPD分析的難度。近年來(lái)針對(duì)一維以及二維色譜數(shù)據(jù),國(guó)內(nèi)外學(xué)者提出了許多適合于ACPD的新算法,已有研究主要集中在對(duì)導(dǎo)數(shù)法的改進(jìn)以及發(fā)展基于質(zhì)譜信號(hào)的ACPD算法兩部分。
基于一維色譜信號(hào)的ACPD分析算法可分為兩類(lèi):基于色譜峰基本物理特性而建立的ACPD算法和基于小波變化的ACPD算法。前者主要利用色譜信號(hào)的信噪比、色譜峰形狀(高斯擬合)和一階/二階導(dǎo)數(shù)實(shí)現(xiàn)色譜峰的ACPD解析;后者主要基于色譜信號(hào)中各組分的信息在時(shí)域或頻率域中存在的差別,采用小波分析將色譜信號(hào)分解從而提取各組分的色譜信息。在基于色譜峰基本物理特性的ACPD算法研究中,Boe[13]提出了一種改進(jìn)的泊松模型方法——面積重現(xiàn)法。該方法直接從實(shí)驗(yàn)色譜信號(hào)中計(jì)算得到模型的參數(shù)且不改變譜峰的形狀和大小,可用于快速識(shí)別色譜峰。但該方法采用同一峰形參數(shù)來(lái)擬合信號(hào)中的所有譜峰,從而忽略了組分間色譜峰的差異,易給解析結(jié)果造成較大偏差。Vivó-Truyols等[14]提出了一種基于高階導(dǎo)數(shù)的ACPD方法,以一階導(dǎo)數(shù)為基礎(chǔ)確定組分的洗脫區(qū)域,而色譜峰的快速識(shí)別則采用二階導(dǎo)數(shù)實(shí)現(xiàn)。但該方法依舊無(wú)法實(shí)現(xiàn)有效的ACPD分析,原因在于該方法需加入經(jīng)驗(yàn)確定的閾值來(lái)實(shí)現(xiàn)噪聲和組分信號(hào)的區(qū)分。為此,劉明明等[15]將原本的ACPD方法結(jié)合面積重現(xiàn)法,提出了全新的ACPD算法,較好地實(shí)現(xiàn)了復(fù)雜色譜如煙氣譜圖等的ACPD分析,且在一定的范圍內(nèi)能識(shí)別大量復(fù)雜譜峰中湮沒(méi)的未知組分信息及其大致量。此外,由于色譜峰在平滑窗口中具有局部最大值,因此Fu等[16]基于多尺度高斯平滑建立了一種新型的ACPD方法,可以實(shí)現(xiàn)復(fù)雜色譜信號(hào)中組分信息的準(zhǔn)確提取。對(duì)于基于小波變化的ACPD分析方法研究,Zhang等[17]通過(guò)充分利用小波空間的附加信息,提出了多尺度譜峰檢測(cè)(Multi-scale peak detection,MSPD)的方法,并分別采用Python和Cython對(duì)算法進(jìn)行了編寫(xiě),結(jié)果表明該方法可以大大提高復(fù)雜色譜信號(hào)ACPD分析的準(zhǔn)確性。然而以上基于一維色譜信號(hào)解析的方法在對(duì)復(fù)雜色譜信號(hào)進(jìn)行ACPD分析時(shí),大多不能直接檢測(cè)兩峰是否重疊,需用戶(hù)設(shè)置某個(gè)參數(shù)加以判斷。此外,這些方法的解析效率較低,無(wú)法實(shí)現(xiàn)大量數(shù)據(jù)的自動(dòng)化分析。針對(duì)低信噪比的信號(hào)解析,這些算法大多不能得到正確的結(jié)果。
GC-MS是現(xiàn)階段應(yīng)用最多的色譜聯(lián)用技術(shù)之一。相對(duì)于色譜信號(hào)的不穩(wěn)定,質(zhì)譜信號(hào)中不易出現(xiàn)基線(xiàn)和色譜峰漂移的影響,且存在已建立完善的標(biāo)準(zhǔn)質(zhì)譜庫(kù),因此更適于ACPD分析。Miao等[18]基于目標(biāo)因子分析(Target factor analysis,TFA),建立了一種適合于GC-MS數(shù)據(jù)的ACPD方法。以標(biāo)準(zhǔn)質(zhì)譜庫(kù)中某一組分的質(zhì)譜為目標(biāo)因子,利用算法判斷色譜信號(hào)中是否存在該組分信息,利用目標(biāo)因子與該方法計(jì)算得到的質(zhì)譜之間的相似性作為判斷該組分是否存在的依據(jù)。所建立方法成功實(shí)現(xiàn)了蔬菜中農(nóng)殘等復(fù)雜GC-MS信號(hào)的ACPD分析。此外,本課題組[19]基于迭代目標(biāo)轉(zhuǎn)換因子分析(Iterative target transformation factor analysis,ITTFA),提出了一種GC-MS的ACPD算法。該方法同樣以標(biāo)準(zhǔn)質(zhì)譜庫(kù)中某一組分的質(zhì)譜作為初始向量,沿著色譜洗脫時(shí)間采用ITTFA逐一檢驗(yàn),以迭代得到的質(zhì)譜與質(zhì)譜庫(kù)中質(zhì)譜的匹配度作為判斷該物質(zhì)是否存在的依據(jù),從而確定復(fù)雜色譜信號(hào)中所包含的組分信息。利用所建立的方法,實(shí)現(xiàn)了河水樣品中16種鄰苯二甲酸酯類(lèi)物質(zhì)的ACPD分析。TFA和ITTFA均可用于識(shí)別色譜信號(hào)中是否存在目標(biāo)組分信息,但不適用于共存組分較多的大數(shù)據(jù)矩陣的分析。因此,本課題組又提出了“移動(dòng)窗口目標(biāo)轉(zhuǎn)換因子分析(Moving window target transformation factor analysis,MWTTFA)”方法[20],沿GC-MS數(shù)據(jù)矩陣的保留時(shí)間方向逐步識(shí)別目標(biāo)組分,不僅可用于判斷目標(biāo)組分是否存在,還可直接得到目標(biāo)組分的洗脫時(shí)間區(qū)間。在解析結(jié)果中濃度為零的組分即為不存在的組分,而對(duì)于存在的組分則可以得到相應(yīng)的色譜信息。所建立的方法在復(fù)雜農(nóng)藥混合物色譜信號(hào)ACPD分析中得到了成功應(yīng)用。
通過(guò)ACPD可以實(shí)現(xiàn)組分?jǐn)?shù)以及待測(cè)組分洗脫時(shí)間的確定,但復(fù)雜色譜信號(hào)中背景以及基線(xiàn)漂移嚴(yán)重影響了后續(xù)的色譜自動(dòng)化分析,需對(duì)其進(jìn)行校正。近年來(lái),越來(lái)越多的化學(xué)計(jì)量學(xué)方法被用于BDC分析。這些方法主要可分為三類(lèi)。第一類(lèi)是基于多項(xiàng)式擬合的方法,但簡(jiǎn)單的多項(xiàng)式擬合方法效率低,且解析結(jié)果的準(zhǔn)確性受操作者經(jīng)驗(yàn)的影響。改進(jìn)型多項(xiàng)式擬合方法在解析結(jié)果的準(zhǔn)確性和自動(dòng)化程度上有所提高,但是遇到復(fù)雜的色譜信號(hào)解析時(shí),這些方法依舊無(wú)法實(shí)現(xiàn)理想的BDC解析。第二類(lèi)是基于小波變換的方法,由于背景和基線(xiàn)信號(hào)具有較低的頻率,因此在小波空間上扣除較低頻率的背景信息可以實(shí)現(xiàn)BDC分析。Liu等[21]提出了一種基于提升方案和最小均方算法的自適應(yīng)小波變換并將該小波變換用于色譜信號(hào)的背景校正。先使用LMS算法生成自適應(yīng)提升小波的濾波器,再使用提升方案計(jì)算信號(hào)的細(xì)節(jié)和近似系數(shù),從而根據(jù)頻率高低將信號(hào)分解成不同的部分。由于不同部分之間頻率的差異,背景信號(hào)可以很容易地被識(shí)別和移除。此外,在背景移除的過(guò)程中,通過(guò)加入“回饋操作”來(lái)保證信號(hào)不會(huì)被“過(guò)扣除”。該方法的優(yōu)勢(shì)在于可以在不事先選擇小波函數(shù)的情況下根據(jù)處理目的和信號(hào)本身的特點(diǎn)產(chǎn)生自適應(yīng)的提升小波濾波器,從而省去了傳統(tǒng)小波變換對(duì)信號(hào)進(jìn)行分解時(shí)選擇小波函數(shù)這一繁瑣而復(fù)雜的工作,大大減少了工作量。該算法已成功用于農(nóng)藥混合物色譜信號(hào)的BDC分析,但該方法進(jìn)行小波變換比較耗時(shí),且需對(duì)特殊峰區(qū)間和重疊峰等進(jìn)行特殊處理,算法參數(shù)多,因此較難實(shí)現(xiàn)自動(dòng)化的BDC分析。第三類(lèi)是基于懲罰最小二乘的BDC算法。在對(duì)較為復(fù)雜的色譜信號(hào)BDC處理時(shí),這些算法無(wú)法正確識(shí)別譜峰位置,易導(dǎo)致最終結(jié)果中負(fù)值的產(chǎn)生。為了改進(jìn)傳統(tǒng)方法參數(shù)多和效率低的缺點(diǎn),并實(shí)現(xiàn)自動(dòng)BDC分析,Zhang等[22]提出了一種自適應(yīng)迭代懲罰最小二乘(Adaptive iteratively reweighted penalized least squares,airPLS)方法,僅通過(guò)1個(gè)參數(shù)即可實(shí)現(xiàn)快速自動(dòng)化的BDC分析。采用參數(shù)λ調(diào)節(jié)擬合背景平滑程度,采用迭代逐步削弱峰對(duì)背景擬合的影響,通過(guò)引入稀疏矩陣算法將其時(shí)間和空間復(fù)雜度變?yōu)榫€(xiàn)性,從而可用于更加復(fù)雜色譜數(shù)據(jù)的BDC分析。該方法已成為BDC分析中最常用的方法之一。Baek等[23]在airPLS方法基礎(chǔ)上,基于廣義Logistic函數(shù),提出了非對(duì)稱(chēng)加權(quán)懲罰最小二乘(Asymmetrically reweighted penalized least squares,arPLS)方法。與airPLS的對(duì)比結(jié)果表明該方法提高了對(duì)于復(fù)雜色譜信號(hào)BDC分析的準(zhǔn)確性。此外,Liu等[24-25]發(fā)現(xiàn)在數(shù)據(jù)平滑或基線(xiàn)校正時(shí)利用稀疏矩陣算法能使矩陣的運(yùn)算速度大大提升,并通過(guò)結(jié)合雙邊指數(shù)平滑算法和分位數(shù)回歸算法,采用迭代加權(quán)的策略,提出了選擇性加權(quán)分位數(shù)回歸算法和自動(dòng)雙邊指數(shù)平滑算法。前者以處理數(shù)據(jù)的穩(wěn)健性見(jiàn)長(zhǎng),而后者以處理數(shù)據(jù)的快速高效性突出。采用這兩種方法均可以實(shí)現(xiàn)色譜信號(hào)快速準(zhǔn)確的BDC分析。
此外,由于ACPD處理中往往需要對(duì)色譜信號(hào)進(jìn)行BDC計(jì)算,對(duì)色譜的BDC處理也促進(jìn)了ACPD分析。因此目前的研究通常將色譜數(shù)據(jù)自動(dòng)化分析的前兩個(gè)階段(ACPD和BDC)聯(lián)合解決。Yu等[11-12]提出了ACPD-BDC算法,可以實(shí)現(xiàn)從復(fù)雜色譜數(shù)據(jù)中自動(dòng)提取組分信息并消除背景和基線(xiàn)的干擾;Fu等[26]提出了局部最小值穩(wěn)健統(tǒng)計(jì)分析方法(Local minimum values-robust statistical analysis,LMV-RSA),首先找到信號(hào)中的局部最小值,然后基于穩(wěn)健統(tǒng)計(jì)方法采用迭代優(yōu)化的方式去除屬于組分信息的局部最小值,最后采用線(xiàn)性插值的方式扣除信號(hào)中的背景信號(hào)。該方法成功提取了GC和GC-MS信號(hào)中的色譜信息,如色譜峰的保留時(shí)間、峰面積、峰高以及起始位置。Torres-Lapasiód等[27-28]提出了一種新型的ACPD算法和去卷積方法,通過(guò)指定閾值的方式來(lái)區(qū)分信號(hào)與噪聲,首先根據(jù)一階導(dǎo)數(shù)對(duì)信號(hào)進(jìn)行分區(qū),再根據(jù)二階導(dǎo)數(shù)實(shí)現(xiàn)對(duì)色譜峰的自動(dòng)識(shí)別;針對(duì)GC-MS數(shù)據(jù)的分析,Brereton等[29-30]發(fā)展了一種針對(duì)大批量GC-MS數(shù)據(jù)的自動(dòng)峰值檢測(cè)和匹配的算法,在一定程度上解決了色譜數(shù)據(jù)自動(dòng)化分析的問(wèn)題。
在實(shí)驗(yàn)操作中,儀器漂移、固定相分解、分析物互相反應(yīng)等不可控因素,導(dǎo)致不同檢測(cè)物中同一物質(zhì)的色譜峰洗脫時(shí)間不同,給定性定量分析造成了一定的困難。譜峰漂移校正是將有差別的色譜中同一物質(zhì)的譜峰校正至相等的矩陣列中。在譜峰漂移校正方面已提出了許多算法。
第一類(lèi)是基于一維數(shù)據(jù)的優(yōu)化算法,主要有動(dòng)態(tài)規(guī)整、峰檢測(cè)和進(jìn)化算法等。但是對(duì)于復(fù)雜的色譜峰,如信號(hào)中不同組分信號(hào)強(qiáng)度的差別較大且重疊嚴(yán)重等,這些方法無(wú)法實(shí)現(xiàn)有效的譜峰漂移校正[31]。為此,Zhang等提出了alignDE(Alignment of chromatograms by differential evolution)算法[32]和多尺度譜峰對(duì)齊法(Multiscale peak alignment,MSPA)算法[33]。前者采用微分進(jìn)化算法優(yōu)化譜峰位置,從而實(shí)現(xiàn)譜峰漂移校正,而后者采用連續(xù)小波變換確定每個(gè)色譜峰的起始位置,將待測(cè)信號(hào)中的色譜峰按大小順序依次進(jìn)行譜峰漂移校正。Savorani等[34-35]開(kāi)發(fā)了icoshift(Interval correlation optimised shifting)工具包,可以實(shí)現(xiàn)色譜信號(hào)的譜峰漂移校正。Li等[36]基于色譜中的共有峰實(shí)現(xiàn)譜峰漂移校正,提出了最長(zhǎng)距離移動(dòng)(Longest distance shifting,LDS)方法。與相關(guān)最優(yōu)化規(guī)整(Correlation optimized warping,COW)和icoshift方法相比,該方法計(jì)算過(guò)程簡(jiǎn)單,可以實(shí)現(xiàn)較為復(fù)雜的色譜信號(hào)(如重疊峰等譜峰)漂移的校正。Christin等[37-38]將傳統(tǒng)的一維優(yōu)化函數(shù)轉(zhuǎn)為多通道下函數(shù)優(yōu)化,提出將組分偵測(cè)方法與變形方法相結(jié)合的色譜時(shí)間校正策略(Correlation optimized warping coupled to component detention algorithm,DTW-CODA)。Zheng等[39]基于多尺度高斯平滑,建立了自動(dòng)時(shí)間漂移校正(Automatic time shift alignment,ATSA)方法。該方法包括ACPD-BDC、自適應(yīng)的初步校正和精準(zhǔn)校正3個(gè)部分。通過(guò)對(duì)復(fù)雜模擬數(shù)據(jù)以及實(shí)際數(shù)據(jù)的分析,ATSA處理后數(shù)據(jù)之間的相關(guān)性得到了顯著提高,表明該方法可以實(shí)現(xiàn)復(fù)雜色譜數(shù)據(jù)的譜峰漂移校正。
第二類(lèi)是基于二維數(shù)據(jù)的算法,現(xiàn)階段具有代表性的方法有基于ITTFA[40]、秩最小化的時(shí)間漂移校正法(Rank minimization,RM)[41]及基于平行因子分析(Parallel factor analysis,PARAFAC)[42-43]等建立的譜峰漂移校正方法。其中,ITTFA策略不同于RM和PARAFAC策略,前者是先分解后對(duì)比,分解單樣本得到其組分的色譜峰,對(duì)比同種組分的不同樣本的譜峰位置差異,后者側(cè)重于最小擬合殘差的求取以實(shí)現(xiàn)譜峰漂移校正。因此ITTFA算法的準(zhǔn)確性取決于算法對(duì)單樣本的解析結(jié)果,而RM和PARAFAC方法基于譜峰漂移校正轉(zhuǎn)換為尋找數(shù)據(jù)最佳擬合,并未構(gòu)建與譜峰漂移直接相關(guān)的目標(biāo)函數(shù),因此這些方法在解析較為復(fù)雜的色譜數(shù)據(jù)時(shí)有可能存在一定的問(wèn)題。為此,Yu等[31]提出基于樣本間抽象子空間差異度(Abstract subspace difference,ASSD)的譜峰漂移校正方法。該方法的基本思想是色譜時(shí)間譜峰漂移可以在抽象子空間中反映出來(lái),從而可以利用兩樣本間的抽象色譜子空間差異實(shí)現(xiàn)譜峰漂移的校正。此外,Zheng等[44-45]采用快速傅立葉交叉相關(guān)和質(zhì)譜信息以實(shí)現(xiàn)譜峰漂移的校正。首先采用連續(xù)小波變換得到譜峰的洗脫區(qū)域和峰寬信息,利用快速傅立葉變換交叉相關(guān)計(jì)算得到每一段保留時(shí)間區(qū)域的候選移動(dòng)點(diǎn)數(shù);然后與參考峰對(duì)應(yīng)的質(zhì)譜進(jìn)行匹配,確定每一段候選峰的最佳移動(dòng)點(diǎn)數(shù);最后對(duì)無(wú)信號(hào)區(qū)間進(jìn)行線(xiàn)性插值和譜峰移動(dòng)以實(shí)現(xiàn)最準(zhǔn)確的譜峰漂移校正。該方法可用于聯(lián)用儀器如GC-MS和LC-MS數(shù)據(jù)的譜峰漂移校正。此外,Zheng等[46]又利用色譜組分逐步流出的特性以及譜峰漂移的局部相似性進(jìn)行譜峰漂移校正。通過(guò)加入移動(dòng)窗口的方式,計(jì)算每個(gè)窗口交叉相關(guān)來(lái)估計(jì)待校準(zhǔn)信號(hào)需移動(dòng)的點(diǎn)數(shù),可用于高通量色譜峰漂移的校正。
現(xiàn)已建立了各種重疊色譜峰解析的方法,大多算法都采用固定的“窗口”通過(guò)將原始數(shù)據(jù)分割成包含有色譜峰的小段數(shù)據(jù),再利用算法實(shí)現(xiàn)對(duì)色譜峰的自動(dòng)化檢測(cè)?;诨瘜W(xué)因子分析的窗口因子分析方法(Window factor analysis,WFA)是一種應(yīng)用非常廣泛的信號(hào)解析方法。WFA方法的關(guān)鍵是找到目標(biāo)組分濃度分布的區(qū)域,這個(gè)連續(xù)的區(qū)域被稱(chēng)為目標(biāo)組分的“窗口”。但在傳統(tǒng)的WFA方法中,“窗口”的確定通過(guò)檢查所有可能的“窗口”再加上合適的判據(jù)來(lái)實(shí)現(xiàn),這種方式非常繁瑣和費(fèi)時(shí)。此外,復(fù)雜實(shí)際樣品的信號(hào)常受到背景和譜峰重疊的干擾,使得“窗口”的確定尤為困難。這些問(wèn)題限制了WFA方法在色譜信號(hào)自動(dòng)化分析中的應(yīng)用。為了解決這個(gè)問(wèn)題,本課題組[5]發(fā)展了一種廣義的“窗口”,提出了廣義窗口因子分析算法(Generalized window factor analysis,GWFA),用于實(shí)際復(fù)雜樣品GC-MS信號(hào)的快速解析。該方法具有以下優(yōu)勢(shì):“窗口”確定簡(jiǎn)單準(zhǔn)確,因而避免了傳統(tǒng)WFA方法中因“窗口”確定不準(zhǔn)確時(shí)定量結(jié)果出現(xiàn)偏差的弊端;由于該方法基于質(zhì)譜方向建立“窗口”,因而消除了色譜譜峰偏移所帶來(lái)的影響;該方法不易受到信號(hào)中較大噪聲的干擾。但是該算法需將色譜信號(hào)進(jìn)行分段處理以縮小計(jì)算,因此無(wú)法完全實(shí)現(xiàn)對(duì)色譜信號(hào)的自動(dòng)化分析。
實(shí)際樣品復(fù)雜且基質(zhì)干擾嚴(yán)重,利用GC-MS進(jìn)行分析時(shí)譜峰重疊現(xiàn)象難以避免且信號(hào)較為復(fù)雜,給信號(hào)解析提出了極大的挑戰(zhàn)。針對(duì)多組分重疊色譜信號(hào)的自動(dòng)化解析問(wèn)題,Shao等[19-20]提出了一種基于曲線(xiàn)擬合的免疫算法。通過(guò)實(shí)驗(yàn)或計(jì)量學(xué)提取得到標(biāo)準(zhǔn)信號(hào),免疫算法已成功應(yīng)用于混合樣品重疊色譜信號(hào)的解析中。既往研究中建立的免疫算法通常只適用于少量組分構(gòu)成的數(shù)據(jù),計(jì)算之前必須將數(shù)據(jù)分段,以減小算法應(yīng)用的難度,因而很難稱(chēng)為真正的自動(dòng)高通量分析。而Wu等[47]結(jié)合獨(dú)立成分分析、ITTFA和非負(fù)免疫算法,提出了一種基于多步篩選過(guò)程的真正的高通量分析計(jì)量學(xué)方法。首先,通過(guò)獨(dú)立成分分析和ITTFA來(lái)提取重疊GC-MS信號(hào)中所有可能存在的質(zhì)譜信息;然后以質(zhì)譜之間的匹配率作為判斷依據(jù),對(duì)獲得的質(zhì)譜數(shù)據(jù)進(jìn)行第二次篩選,排除重復(fù)信息;最后利用經(jīng)過(guò)前兩步篩選得到的質(zhì)譜,通過(guò)非負(fù)免疫算法計(jì)算得到相應(yīng)的色譜數(shù)據(jù),通過(guò)計(jì)算信噪比,對(duì)得到的色譜信號(hào)進(jìn)行最后一次篩選,最終將重疊GC-MS信號(hào)中所有存在的組分提取出來(lái)。以40種農(nóng)藥混合物的GC-MS信號(hào)進(jìn)行驗(yàn)證,表明該方法可以一次性地將40種農(nóng)藥的質(zhì)譜和色譜信息提取出來(lái),實(shí)現(xiàn)了對(duì)重疊GC-MS信號(hào)的自動(dòng)化高通量解析。此外,本課題組[20]結(jié)合MWTTFA和非負(fù)免疫算法,建立了一種高通量解析方法。利用MWTTFA檢驗(yàn)復(fù)雜信號(hào)中存在的組分,確定目標(biāo)組分的質(zhì)譜信息和洗脫時(shí)間的區(qū)間,然后以得到的質(zhì)譜信息作為后續(xù)計(jì)算的輸入值,利用非負(fù)免疫算法解析得到相應(yīng)的色譜信息。采用快速升溫程序?qū)?7種和42種農(nóng)藥混合標(biāo)準(zhǔn)樣品的GC-MS信號(hào)進(jìn)行分析,利用所建立的方法可在10 min內(nèi)得到全部組分的色譜和質(zhì)譜信息,實(shí)現(xiàn)快速自動(dòng)化分析。
近年來(lái),隨著各類(lèi)新型高階量分析儀器,如全二維液相色譜光二極管陣列聯(lián)用儀、全二維液相色譜質(zhì)譜聯(lián)用儀的發(fā)展,獲取包含大量化學(xué)信息的高維數(shù)據(jù)已變得較為容易,而傳統(tǒng)的數(shù)據(jù)處理方法難以實(shí)現(xiàn)對(duì)復(fù)雜高維數(shù)據(jù)的自動(dòng)分析。因此,研究者們基于PARAFAC算法建立了一系列的自動(dòng)解析算法[48-50]。通過(guò)將原始數(shù)據(jù)分割成包含有色譜峰的小段數(shù)據(jù),采用非常少的參數(shù),利用PARAFAC算法即可實(shí)現(xiàn)對(duì)色譜峰的自動(dòng)化檢測(cè)。利用一臺(tái)普通的筆記本計(jì)算機(jī),采用默認(rèn)的參數(shù)即可在10 min內(nèi)實(shí)現(xiàn)包含有30種多環(huán)芳烴的復(fù)雜樣品GC-MS信號(hào)的快速解析。此外,Yu等[31]結(jié)合ASSD 和交替三線(xiàn)性分解(Alternating trilinear decomposition,ATLD)算法,能夠在干擾存在下準(zhǔn)確校正出分析物的時(shí)間漂移并獲得“二階優(yōu)勢(shì)”。Wu等[51-54]將ATLD方法引入復(fù)雜HPLC/DAD和LC-MS信號(hào)的自動(dòng)化解析中,采用“數(shù)學(xué)分離”對(duì)復(fù)雜的重疊數(shù)據(jù)進(jìn)行解析。結(jié)果表明,即使在色譜峰嚴(yán)重重疊的情況下,利用該方法亦可以實(shí)現(xiàn)對(duì)復(fù)雜體系中特定多組分的同時(shí)定性定量分析,快速解析得到目標(biāo)分析物的色譜、光譜、質(zhì)譜和濃度信息,具有獨(dú)特的“二階或高階優(yōu)勢(shì)”。
色譜數(shù)據(jù)自動(dòng)化分析程序的四個(gè)部分中,目前的研究大多僅集中解決了其中一個(gè)或兩個(gè)部分,且主要集中在前兩個(gè)階段,即ACPD和BDC,而對(duì)后兩個(gè)階段——色譜譜峰漂移校正以及重疊色譜峰解析的研究較少。因此,這些方法在一定程度上解決了色譜數(shù)據(jù)自動(dòng)化分析的問(wèn)題,但往往需將原始數(shù)據(jù)分割成包含有色譜峰的小段數(shù)據(jù),不適合大規(guī)模數(shù)據(jù)的自動(dòng)化分析;同時(shí),對(duì)于復(fù)雜的食品樣品分析,往往不能得到正確的解析結(jié)果。此外,新型高階量分析儀器如全二維液相色譜光二極管陣列聯(lián)用儀可以提供四維或更高階的色譜數(shù)據(jù)。這些數(shù)據(jù)包含更豐富的分析信息,能避免背景干擾和基體效應(yīng),且不易受外界條件的影響,進(jìn)而提高了預(yù)測(cè)精度。如何進(jìn)一步快速有效地提取這些新型儀器提供的復(fù)雜色譜信號(hào)的信息,并以化學(xué)計(jì)量學(xué)為指導(dǎo),通過(guò)自動(dòng)化及計(jì)算機(jī)技術(shù)以實(shí)現(xiàn)現(xiàn)代分析儀器的智能化功能將成為今后的重點(diǎn)發(fā)展方向。
[1] Li D X,Gan L,Bronja A,Schmitz O J.Anal.Chim.Acta,2015,891: 43-61.
[2] Tranchida P Q,Franchina F A,Dugo P,Mondello L.MassSpectrom.Rev.,2016,35(4): 524-534.
[3] Xiao Z W,He M,Chen B B,Hu B.Talanta,2016,s156/157: 126-133.
[4] Vestner J,de Revel,Krieger-Weber S,Rauhut D,du Toit M,de Villiers A.Anal.Chim.Acta,2016,911: 42-58.
[5] Li P,Cai W S,Shao X G.J.Chromatogr.A,2015,1407(8): 203-207.
[6] Li P,Cai W S,Shao X G.J.Chemom.,2015,29(5): 300-308.
[7] Jaumot J,Juan A D,Tauler R.Chemometr.Intell.Lab.Syst.,2015,140: 1-12.
[8] Shao X G,Leung A K M,Chau F T.Acc.Chem.Res.,2003,36(4): 276-283.
[9] Shao X G,Liu Z C,Cai W S.TrAC-TrendAnal.Chem.,2009,28(11): 1312-1321.
[10] Zeng Y H,Cai W S,Shao X G.J.Sep.Sci.,2015,38(12): 2053-2058.
[11] Yu Y J,Xia Q L,Wang S,Wang B,Xie F W,Zhang X B,Ma Y M,Wu H L.J.Chromatogr.A,2014,1359: 262-270.
[12] Yu Y J,Fu H Y,Zhang L,Wang X Y,Sun P J,Zhang X B,Xie F W.J.Chromatogr.A,2015,1399: 65-73.
[13] Boe B.J.Chromatogr.A,2007,1139(1): 1-6.
[14] Vivó-Truyols G,Torres-Lapasió J R,van Nederkassel A M,Vander H Y,Massart D L.J.Chromatogr.A,2005,1096(1/2): 133-145.
[15] Liu M M,Xia B L,Yang J.Chin.J.Chromatogr.(劉明明,夏炳樂(lè),楊俊.色譜),2009,27(3): 351-355.
[16] Fu H Y,Guo J W,Yu Y J,Li H D,Cui H P,Liu P P,Wang B,Wang S,Lu P.J.Chromatogr.A,2016,1452: 1-9.
[17] Zhang Z M,Tong X,Peng Y,Ma P,Zhang M J,Lu H M,Chen X Q,Liang Y Z.Analyst,2015,140(23): 7955-7964.
[18] Miao L N,Cai W S,Shao X G.Talanta,2011,83(4): 1247-1253.
[19] Li P,Mei Z,Cai W S,Shao X G.J.Sep.Sci.,2014,37(13): 1585-1590.
[20] Li P,Cai W S,Shao X G.Chin.J.Chromatogr.(李跑,蔡文生,邵學(xué)廣.色譜),2017,35(1): 8-13.
[21] Liu Y,Cai W S,Shao X G.Chemometr.Intell.Lab.Syst.,2013,125(12): 11-17.
[22] Zhang Z M,Chen S,Liang Y Z.Analyst,2010,135(5): 1138-1146.
[23] Baek S J,Park A,Ahn Y J,Choo J.Analyst,2015,140(1): 250-257.
[24] Liu X B,Zhang Z M,Sousa P F M,Chen C,Ouyang M L,Wei Y C,Liang Y Z,Chen Y,Zhang C P.Anal.Bioanal.Chem.,2014,406(7): 1985-1998.
[25] Liu X B,Zhang Z M,Liang Y,Sousa P F M,Yun Y H,Ling Y.Chemometr.Intell.Lab.Syst.,2014,139: 97-108.
[26] Fu H Y,Li H D,Yu Y J,Wang B,Lu P,Cui H P,Liu P P,She Y B.J.Chromatogr.A,2016,1449: 89-99.
[27] Vivo-Truyóls G,Torres-Lapasió J R,van Nederkassel A M,Vander Hey-den Y,Massart D L.J.Chromatogr.A,2005,1096(1/2): 133-145.
[28] Vivo-Truyóls G,Torres-Lapasió J R,van Nederkassel A M,Vander Hey-den Y,Massart D L.J.Chromatogr.A,2005,1096(1/2): 146-155.
[29] Dixon S J,Brereton R G,Soini H A,Novotny M V,Penn D J.J.Chemom.,2006,20(8/10): 325-340.
[30] Fong S S,Rearden P,Kanchagar C,Sassetti C,Trevejo J,Brereton R G.Anal.Chem.,2011,83(5): 1537-1546.
[31] Yu Y J,Wu H L,Niu J F,Zhao J,Li Y N,Kang C,Yu R Q.Analyst,2013,138(2): 627-634.
[32] Zhang Z M,Chen S,Liang Y Z.Talanta,2011,83(4): 1108-1117.
[33] Zhang Z M,Liang Y Z,Lu H M,Tan B B,Xu X N,Ferro M.J.Chromatogr.A,2012,1223(3): 93-106.
[34] Savorani F,Tomasi G,Engelsen S B.J.Magn.Reson.,2009,202(2): 190-202.
[35] Tomasi G,Savorani F,Engelsen S B.J.Chromatogr.A,2011,1218(43): 7832-7840.
[36] Li B Q,Chen J,Wang X,Xu M L,Zhai H L.J.Sep.Sci.,2016,39(23): 4549-4556.
[37] Christin C,Smilde A K,Hoefsloot H C J,Suits F,Bischoff R,Horvatovich P L.Anal.Chem.,2008,80(18): 7012-7021.
[38] Christin C,Hoefsloot H C J,Smilde A K,Bischoff R,Horvatovich P L.J.Proteome.Res.,2010,9(3): 1483-1495.
[39] Zheng Q X,Fu H Y,Li H D,Wang B,Peng C H,Wang S,Cai J L,Liu S F,Zhang X B,Yu Y J.Sci.Rep.,2017,7(1): 256.
[40] Comas E,Gimeno R A,Ferré J,Marcé R M,Borrull F,Rius F X.Anal.Chim.Acta,2002,470(2): 163-173.
[41] Fraga C G,Prazen B J,Synovec R E.Anal.Chem.,2001,73(24): 5833-5840.
[42] Bortolato S A,Arancibia J A,Escandar G M,Olivieri A C.Chemometr.Intell.Lab.Syst.,2010,101(1): 30-37.
[43] Parastar H,Akvan N.Anal.Chim.Acta,2014,816: 18-27.
[44] Zheng Y B,Zhang Z M,Liang Y Z,Zhan D J,Huang J H,Yun Y H,Xie H L.J.Chromatogr.A,2013,1286(8): 175-182.
[45] Zhang M J,Wen M,Zhang Z M,Lu H M,Liang Y Z,Zhan D J.J.Sep.Sci.,2015,38(6): 965-974.
[46] Li Z,Wang J J,Huang J,Zhang Z M,Lu H M,Zheng Y B,Zhan D J,Liang Y Z.J.Sep.Sci.,2013,36(9/10): 1677-1684.
[47] Wu X,Cai W S,Shao X G.J.Sep.Sci.,2014,37(7): 828-834.
[48] Furbo S,Christensen J H.Anal.Chem.,2012,84(5): 2211-2218.
[49] Johnsen L G,Amigo J M,Skov T,Bro R.J.Chemom.,2014,28(2): 71-82.
[50] Montemurro M,Siano G G,Alcaráz M R,Goicoechea H C.TrendsAnal.Chem.,2017,93: 119-133.
[51] Sun J Q,Wu H L.J.Instrum.Anal.(孫劍奇,吳海龍.分析測(cè)試學(xué)報(bào)),2007,26(5): 686-689.
[52] Gu H W,Wu H L,Li S S,Yin X L,Hu Y,Xia H,Fang H,Yu R Q,Yang P Y,Lu H J.Chemometr.Intell.Lab.Syst.,2016,155: 62-72.
[53] Liu Z,Wu H L,Xie L X,Hu Y,Fang H,Sun X D,Wang T,Xiao R,Yu R Q.Anal.Methods,2017,9: 3361-3374.
[54] Liu Z,Wu H L,Xie L X,Hu Y,Fang H,Sun X D,Wang T,Xiao R,Yu R Q.Chemometr.Intell.Lab.Syst.,2017,160: 125-138.