余蓮蓮 邵利民
(中國科學技術(shù)大學化學系,合肥230026)
開放光路傅里葉變換紅外(OP/FT-IR)光譜是大氣測量的有效工具,已廣泛用于大氣分析和環(huán)境監(jiān)測[1~4]。OP/FT-IR 具有儀器可靠、操作簡單、無需采樣、在線測量、以及無人值守監(jiān)測等優(yōu)點[5~8]。在實際測量中,OP/FT-IR 光譜受到水蒸汽和二氧化碳的振-轉(zhuǎn)光譜以及基線緩慢變化的干擾,嚴重影響了痕量組分的分析。此外,光譜定性分析主要基于目視檢查或光譜庫搜索,要求操作者能有效識別目標化合物的特征,這些都給數(shù)據(jù)解析帶來一定的困難。本研究將采用兩種化學計量學方法克服上述困難。
目標因子分析(Target factor analysis,TFA)是一種自模因子分析方法,通過分析多個光譜組成的數(shù)據(jù)矩陣,能夠提取出隱藏在單個光譜中的信息。TFA 目前在化學中已廣泛應用于色譜[9],反應力學和動力學[10,11],光譜分析[12],醫(yī)療和醫(yī)藥研究[13,14]以及食品[15]等領(lǐng)域。
目標波段熵最小化(Band-target entropy minimization,BTEM)方法能夠從多組分光譜中重建純組分光譜,具有無需目標分子的先驗信息,也不依賴于統(tǒng)計學檢驗等優(yōu)點[16]。BTEM 已應用于各種液相和固相的反應體系[17],已經(jīng)成功重建FT-IR[18],Raman[19],NMR[20]和MS[21]等復雜光譜,但是對OP/FTIR 光譜的重建目前尚未見報道。
Widjaja 等[22]將BTEM 與其它曲線分解程序(如OPA-ALS,SIMPLISMA,SIMPLISMA-ALS,IPCA)進行了對比,表明BTEM 是可以重建出最接近純組分參考光譜的方法,但是尚未見將BTEM 與TFA 這兩種算法進行比較的報道。因此,本研究將用BTEM 和TFA 兩種方法定性分析混合物光譜中NH3,C2H5OH 和O3的光譜信息,并對結(jié)果進行比較。結(jié)果表明,TFA 基于參考光譜,主要組分的重建效果很好,低信號強度的次要組分中存在干擾會影響重建的效果;BTEM 中,無論是主要組分還是次要組分,都在不依靠參考光譜的前提下進行重建,而重建結(jié)果的好壞主要取決于目標函數(shù)的選擇。本研究不僅將BTEM 方法應用于OP/FT-IR 光譜,而且將BTEM 和TFA 兩種方法的結(jié)果進行了比較,為實現(xiàn)多組分OP/FT-IR 光譜定性分析提供了一定的思路和參考。
OP/FT-IR 光譜測量在美國Idaho 州南部的一個牧場進行,用于研究牧場周圍的大氣組成。OP/FTIR 光譜儀為MDA(Atlanta,GA)產(chǎn)品;Bomem Michelson 100 干涉器(加拿大Bomem 公司);直徑為31.5 cm 的望遠鏡用于產(chǎn)生準直紅外光束;汞鎘碲(MCT)檢測器;準直反射器為立方角陣列反射器。
通過干涉譜計算得到分辨率1 cm-1的吸收光譜,填零因子為8,切趾函數(shù)Norton-Beer(Medium),并且對MCT 檢測器的非線性響應進行了校正[23]。所有的光譜預處理和數(shù)據(jù)計算采用MATLAB(美國MathWorks 公司)。
進行5 次連續(xù)測量,每一次連續(xù)測量的單個光譜按照測量時間的順序進行排列,組成5 個混合物光譜數(shù)據(jù)集矩陣,5 個數(shù)據(jù)集中混合物光譜數(shù)分別為1177,600,811,332 和1184,光譜波數(shù)范圍為750 ~1250 cm-1。
OP/FT-IR 光譜連續(xù)測量獲得m 個吸收光譜,每個光譜有n 個數(shù)據(jù)點,通過逐行排列的方式排列光譜,得到一個m 行n 列的光譜Dm×n,由朗伯-比爾定律可知,Dm×n是濃度矩陣Cm×p和光譜矩陣Sn×p的線性組合。
其中,p 是可以重建出純組分的數(shù)量,上標T 表示矩陣轉(zhuǎn)置。
對Dm×n進行PCA
其中,q 是主因子的個數(shù),在理論上等于式(1)中的p;U 和V 分別是主成分向量和特征向量組成的矩陣;R 是殘余矩陣。忽略殘余矩陣R,得到:
式(3)表明,V 包含了S 中所有的真實光譜信息,只是形式不同,因此特征向量也稱為抽象光譜。特征向量與真實光譜向量張成同一線性空間,因此,S 中任何一個光譜向量sn×1都可以由特征向量V 線性表示:其
中,Tq×1表示旋轉(zhuǎn)向量。
TFA 是Malinowski 提出的一種化學因子分析方法[24],檢驗測量數(shù)據(jù)矩陣中是否包含目標物的化學信息,進而判斷樣品中是否存在目標物。
TFA 通過式(4)獲得目標向量,其中,旋轉(zhuǎn)向量T 通過最小二乘方法獲得:
TFA 中,首先選擇目標物的參考光譜,然后將參考光譜代入式(5),計算得到旋轉(zhuǎn)向量T,再將T 代入式(4)即可得到重建光譜。最后,比較參考光譜和重建光譜的相似程度,以此來判斷目標物是否存在于被測樣品中。
目標波段熵最小化方法[22]是一種將光譜的目標波段和信息熵最小化的概念相結(jié)合的曲線分解方法。BTEM 在特征向量中選擇具有目標分子光譜特征的波段作為目標波段,設(shè)計了目標函數(shù),當目標函數(shù)達到最小時,這些光譜特征能夠被保留,而且其它干擾最小。通過模擬退火算法(Simulated Annealing,SA)搜索最優(yōu)旋轉(zhuǎn)向量T,使目標函數(shù)最小。最后,將最優(yōu)旋轉(zhuǎn)向量T 代入(4)式以重建目標分子的純光譜。在模擬退火算法中,旋轉(zhuǎn)向量T 的初始值隨機產(chǎn)生,因此多次運行結(jié)果存在一定差異。
BTEM 的目標函數(shù)具有以下形式[22]:
其中,H(T)為Shannon 信息熵函數(shù),P(T)為懲罰函數(shù)。Shannon 在研究信號處理時通過最小化信息熵來簡化光譜[25]。信息熵反映了頻譜范圍內(nèi)光譜信息的離散程度;信息熵最小能夠使光譜特征在光譜基線平滑時得以集中,從而最大限度地簡化光譜。懲罰函數(shù)P 的作用是使目標物的光譜和濃度非負,越接近于0 目標函數(shù)越能獲得最優(yōu)解[26]。
對數(shù)據(jù)集1 的矩陣D1177×2075進行PCA,得到的前10 個特征向量按照特征值的大小排列。由圖1 可見,前8 個特征向量顯示了明確的光譜特征,其余主要是儀器噪聲。因此保留前8 個主成分進行下一步分析。對其它4 個數(shù)據(jù)集的矩陣進行PCA,通過類似的方法得到了相應的主因子數(shù)。這5 個數(shù)據(jù)集的主因子數(shù)分別為8,6,10,6 和9。
對數(shù)據(jù)集1,圖1 中EV1 ~EV2 主要為水蒸汽的吸收,EV3 ~EV6 在900 ~1000 cm-1有兩個特征峰,將EV3 中較明顯的兩個特征峰分別標記為i 和j,EV7 ~EV8 在1000 ~1100 cm-1有一個特征峰,將EV8 中此特征峰標記為k(各特征峰的波數(shù)范圍見圖1 標注)。用TFA 和BTEM 兩種方法進一步分析,通過重建光譜與參考光譜的相似程度以及二者的相關(guān)系數(shù)值作為組分定性分析的依據(jù)。
分別以圖1 中的i、j 作為目標波段,通過BTEM方法進行光譜重建。結(jié)果表明,重建光譜與NH3參考光譜十分相似,重建光譜與參考光譜之間相關(guān)系數(shù)分別為0.9394 和0.9408。由此可以確定數(shù)據(jù)集1中存在NH3的光譜信息,盡管在1150 ~1250 cm-1有水蒸汽的干擾。綜上所述,對NH3光譜進行重建時,無論選擇i 還是j 作為目標波段,重建出的光譜圖相似,相關(guān)系數(shù)值大小相近。因此,從其它數(shù)據(jù)集重建NH3光譜時均選擇j 作為目標波段。
為確定數(shù)據(jù)集1 中其它組分,TFA 方法分別通過C2H5OH 和O3參考光譜進行光譜重建,這兩種組分在1000 ~1100 cm-1均有特征吸收峰。BTEM 方法則以k 為目標波段進行光譜重建,光譜重建結(jié)果見圖2B 和2C。結(jié)果表明,TFA 方法無論是依靠C2H5OH 還是O3參考光譜進行光譜重建,重建的光譜都與C2H5OH 參考光譜高度相似;BTEM 方法重建的光譜也與C2H5OH 參考光譜十分相似。此外,兩種方法的重建光譜與C2H5OH 參考光譜相關(guān)系數(shù)分別為0.9476 和0.9058,與O3參考光譜相關(guān)系數(shù)分別為0.8328 和0.7682。綜上所述,可以確定數(shù)據(jù)集1 中存在C2H5OH。
盡管可以確定C2H5OH 的存在,兩種方法的C2H5OH 重建光譜還是存在明顯干擾,包括噪聲,以及在750 ~760 cm-1和1150 ~1250 cm-1的水蒸汽吸收。無法完全消除干擾的原因是數(shù)據(jù)集中C2H5OH 光譜信息較弱,致使干擾相對較強。對于BTEM 方法重建的C2H5OH 光譜,930 ~980 cm-1出現(xiàn)了兩個微小的NH3吸收峰,這一干擾并沒有出現(xiàn)在TFA 方法的C2H5OH 重建光譜。主要原因是,TFA 方法依靠C2H5OH 參考光譜進行重建,BTEM 方法則沒有任何可參考的信息,因此重建的光譜不可避免地受到吸收較強的NH3干擾。
為了進一步比較TFA 和BTEM,分別將兩種方法得到的旋轉(zhuǎn)向量代入BTEM 的目標函數(shù),得到目標函數(shù)中的各項值,見表1。
圖1 數(shù)據(jù)集1 的前10 個特征向量圖Fig.1 The first ten eigenvectors calculated for date set #1
圖2 數(shù)據(jù)集1 處理結(jié)果Fig.2 The result of data set 1
表1 TFA與BTEM方法的旋轉(zhuǎn)向量在BTEM 目標函數(shù)中各項值Table 1 Values in the objective function of BTEM with rotation vectors obtained by TFA and BTEM
表1 數(shù)據(jù)顯示,TFA 的目標函數(shù)值G 均小于BTEM 的目標函數(shù)值G,其中主要原因是TFA 的Shannon 信息熵值H 較小,而H 較小是因為TFA 在依靠純組分參考光譜的前提下進行光譜重建,但是BTEM 方法無任何可參考信息,所以BTEM 受到的干擾相對較大。此結(jié)論與圖2A 和2B 中部分光譜圖的結(jié)果一致。此外,兩種方法的懲罰函數(shù)P 均接近于0,而且對目標函數(shù)值G 的影響很小,表明光譜重建中目標物光譜和濃度非負的影響較小。
處理其它4 個數(shù)據(jù)集,光譜重建結(jié)果見圖3。圖3A 表明,除了數(shù)據(jù)集2,從其它數(shù)據(jù)集均能重建出NH3光譜。這是因為數(shù)據(jù)集2 是遠離牧場測量的,NH3的濃度非常低,無法從測量光譜中提取出NH3的信息。
圖3B 表明,從數(shù)據(jù)集2 和4 中能夠成功重建C2H5OH 光譜。在數(shù)據(jù)集2 中,雖然NH3濃度較小重建不出NH3光譜,但是在重建C2H5OH 光譜時,還是會受到微弱NH3和水蒸氣的干擾。而在數(shù)據(jù)集4 中重建的C2H5OH 光譜只受到水蒸氣的干擾,這是因為在這個數(shù)據(jù)集中乙醇的濃度較大而且對紅外的吸收較強,NH3的干擾相對較小。對數(shù)據(jù)集3,TFA 方法以乙醇的參考光譜進行重建,重建出具有臭氧特征峰的光譜,這表明在數(shù)據(jù)集3 中微量組分臭氧的濃度較大,盡管在原始實驗光譜中無法看到臭氧的特征吸收。對于數(shù)據(jù)集5,在1000 ~1100 cm-1有一個類似于C2H5OH 的特征峰,但是不明顯。計算出兩種方法的重建光譜與C2H5OH 參考光譜的相關(guān)系數(shù)分別為0.8108 和0.7535,進一步確認不存在C2H5OH。
圖3C 表明,從數(shù)據(jù)集3、5 中能重建出O3光譜。對于數(shù)據(jù)集3 和5,兩種方法的重建光譜盡管受到水蒸汽紅外吸收的干擾,但可以很明顯地看到O3的特征峰。對于數(shù)據(jù)集2 和4,兩種方法的重建光譜均為C2H5OH 光譜,表明在這兩個數(shù)據(jù)集中不存在O3的光譜信息。
圖3B-c 和圖3C-c 分別是BTEM 處理同一數(shù)據(jù)、使用相同波段重建的光譜,二者的光譜特征基本一致,然而存在細微差別,這與BTEM 中旋轉(zhuǎn)向量T 的初始值有關(guān)。T 的初始值通過隨機產(chǎn)生,每次計算時的初值并不相同,因此多次運行結(jié)果略有差異。盡管如此,重建光譜的光譜特征基本一致,保證了BTEM 方法定性分析結(jié)果的可靠性。
混合物中組分的重建光譜與參考光譜之間相關(guān)系數(shù)值見表2。結(jié)果表明,相關(guān)系數(shù)基本上反映了
參考光譜與重建光譜的相似程度,可以作為判斷依據(jù)。但對于數(shù)據(jù)集5,表2 中O3的相關(guān)系數(shù)只有0.7861,但在圖3C 中卻可以看到O3的特征峰,這是因為光譜中噪聲很大,并且NH3和水蒸氣干擾較強,所以重建光譜中雖然能看到O3的光譜特征,但是相關(guān)系數(shù)值卻比0.85 小。
圖3 數(shù)據(jù)集2 ~5 處理結(jié)果Fig.3 The results of data sets #2 to #5
表2 混合物光譜的組分判定結(jié)果Table 2 Identifications of target molecules from the spectra mixtures
TFA 方法是大氣OP/FT-IR 光譜定性分析的重要工具,但是BTEM 方法應用于OP/FT-IR 光譜定性分析還未見報道。將BTEM 方法引入OP/FT-IR 光譜中,相對于TFA 方法,BTEM 方法具有無需目標分子的先驗信息的特點,為實現(xiàn)多組分OP/FT-IR 光譜定性分析提供了新的辨別方法,為OP/FT-IR 光譜的定性分析發(fā)展拓展了空間。
1 LIU Wen-Qing,CUI Zhi-Cheng,DONG Feng-Zhong.Optoelectronic Technol.Inform.,2002,15:1 -12
劉文清,崔志成,董鳳忠.光電子技術(shù)與信息,2002,15:1 -12
2 SUN Xiu-Yun,LI Yan,WANG Jun-De.Spectroscopy and Spectral Analysis,2003,23(4):739 -741
孫秀云,李燕,王俊德.光譜學與光譜分析,2003,23(4):739 -741
3 XU Liang,LIU Jian-Guo,LU Yi-Huai,LIU Wen-Qing.Spectroscopy and Spectral Analysis,2007,27(5):889 -891
徐亮,劉建國,陸亦懷,劉文清.光譜學與光譜分析,2007,27(5):889 -891
4 WANG Yan,ZHANG Yan-Chao,LI Ning,ZHAO Xue-Hong.Opto-Electronic Engineering,2008,35:73 -81
汪曣,張艷超,李寧,趙學玒.光電工程,2008,35:73 -81
5 Newman A R.Anal.Chem.,1997,69:43A-47A
6 Walter W T.Proc.SPIE.,2004,5270:144 -150 (Environmental Monitoring and Remediation III)
7 Childers J W,Thompson E L,Harris D B,Kirchgessner D A,Clayton M,Natschke D F,Phillips W J.Atmos.Environ.,2001,35:1923 -1936
8 Wiseman J M,Ifa D R,Song Q Y,Cooks R G.Angew.Chem.Int.Ed.,2006,45(43):7188 -7192
9 van Zomeren P V,Metting H J,Coenegracht P M J,de Jong G J.J.Chromatogr.A,2005,1096:165 -176
10 Carvalho A R,Wattoom J,Zhu L,Brereton R G.Analyst,2006,131:90 -97
11 Day J P R,Campbell R A,Russell O P,Bain C D.J.Phys.Chem.C,2007,111(25):8757 -8774
12 Kuzmanovski I,Trpkovska M,Soptrajanov B,Stefov V.Vib.Spectrosc.,1999,19:249 -253
13 Tetteh J,Mader K T,Andanson J M,McAuley W J,Lane M E,Hadgraft J,Kazarian S G,Mitchell J C.Anal.Chim.Acta,2009,642(1-2):246 -256
14 Kauffmana J F,Dellibovi M,Cunninghamb C R.J.Pharm.Biomed.Anal.,2007,43:39 -48
15 Monfreda M,Gobbi L,Grippa A.Food.Chem.,2014,145:584 -592
16 Widjaja E,Li C Z,Garland M.J.Comb.Chem.,2009,11(2):261 -266
17 Widjaja E,Lee W L,Loo S C J.Anal.Chem.,2010,82(4):1277 -1282
18 Tjahjono A M,F(xiàn)eng G,Hermanto M W.RSC Adv.,2014,4:22194 -22204
19 Cheng S,Li C,Guo L.Vib.Spectrosc.,2014,70:110 -114
20 Guo L F,Wiesmath A,Sprenger P,Garland M.Anal.Chem.,2005,77(6):1655 -1662
21 Zhang H J,Garland M,Zeng Y Z,Wu P.J.Am.Soc.Mass.Spectrom.,2003,14(11):1295 -1305
22 Widjaja E,Li C Z,Chew W,Garland M.Anal.Chem.,2003,75(17):4499 -4507
23 Shao L,Griffiths P R.Anal.Chem.,2008,80(13):5219 -5224
24 Malinowski E R.Factor Analysis in Chemistry,3rd ed.;John Wiley and Sons.New York,2002
25 Shannon C E.E.Bell.Sys.Tech.J.,1948,27:379 -623
26 Widjaja E,Garland M.J.Comput.Chem.,2002,23(9):911 -919