伍卓慧, 黃冰佳, 李學(xué)勤, 王曉萍
1. 浙江大學(xué)海洋學(xué)院, 浙江 舟山 316021
2. 浙江大學(xué)海南研究院, 海南 三亞 572025
3. 海洋感知技術(shù)與裝備教育部工程研究中心, 浙江 舟山 316021
三維熒光光譜檢測(cè)技術(shù)是一種可以同時(shí)描繪熒光強(qiáng)度與發(fā)射波長(zhǎng)和激發(fā)波長(zhǎng)變化關(guān)系的光譜技術(shù)。 因?yàn)樵摲椒ň哂羞x擇性好、 信息量大、 靈敏度高和無(wú)需對(duì)樣品進(jìn)行復(fù)雜的前處理工作等優(yōu)點(diǎn), 所以被廣泛應(yīng)用于食品[1]、 醫(yī)療[2]、 化工[3]和環(huán)境[4-5]等領(lǐng)域。
然而, 在三維熒光光譜數(shù)據(jù)中總是會(huì)夾雜著瑞利散射和拉曼散射, 如圖1所示。 這兩種散射是物質(zhì)的固有光學(xué)特性, 但不符合三線性原則, 散射峰的形狀和位置會(huì)隨激發(fā)波長(zhǎng)的變化而變化。 并且瑞利散射峰的熒光強(qiáng)度通常要高于樣品自身, 會(huì)干擾甚至覆蓋部分樣品的熒光信號(hào), 致使樣品本身特征難以表達(dá)。 因此往往需要在數(shù)據(jù)處理前期, 對(duì)瑞利散射和拉曼散射進(jìn)行校正處理。 在以往研究中, 常用的方法有: 空白扣除法[6-7]、 置零法[8]和Delaunay三角形內(nèi)插值法[9-10]等。 空白扣除法即為直接用所得物質(zhì)的三維熒光光譜減去溶劑的三維熒光光譜, 該方法操作簡(jiǎn)單, 但是對(duì)于低濃度樣品往往存在散射區(qū)域去除不完全的缺點(diǎn)。 而置零法則為直接將散射區(qū)域內(nèi)的數(shù)據(jù)進(jìn)行替換, 將其設(shè)置為零, 此方法雖然簡(jiǎn)單易行, 但是容易造成有效數(shù)據(jù)丟失。 Delaunay三角形內(nèi)插值法, 即用插值所得數(shù)據(jù)代替散射區(qū)域內(nèi)的原始數(shù)據(jù)。 既去除了散射干擾, 又盡可能地保留了原始數(shù)據(jù)特征, 是一種現(xiàn)階段應(yīng)用最多且十分有效的去散射算法。 但該方法存在需要定義許多最佳設(shè)置不明顯的超參數(shù)的阻礙, 并且當(dāng)光譜嚴(yán)重重疊時(shí)其適應(yīng)性較差。 同時(shí)不難發(fā)現(xiàn), 現(xiàn)階段許多算法皆致力于將散射區(qū)域內(nèi)的數(shù)值替換為與三維熒光光譜剩余部分?jǐn)?shù)據(jù)一致的新數(shù)據(jù), 因此常采用二維插值算法。 但研究表明, 它較為復(fù)雜, 容易導(dǎo)致過(guò)擬合現(xiàn)象發(fā)生[11], 而一維插值能夠較好地避免這種現(xiàn)象。
因此本文將對(duì)單個(gè)發(fā)射光譜進(jìn)行研究, 提出了一種自適應(yīng)的三維熒光光譜去散射方法。 該方法基于一維插值, 綜合考慮散射峰和物質(zhì)峰的熒光強(qiáng)度與重疊程度, 將光譜共分為五類情況對(duì)應(yīng)三種插值算法分別進(jìn)行散射校正處理。 去除散射后的三維熒光光譜圖, 較好的保留了光譜的原始特征, 證明了此方法校正散射干擾的有效性。 同時(shí), 模擬突發(fā)水質(zhì)污染實(shí)驗(yàn)表明, 本文方法在提高熒光數(shù)據(jù)處理的適應(yīng)性和準(zhǔn)確性方面具有潛力。
本實(shí)驗(yàn)采用由日本日立公司生產(chǎn)的F-4600 FL熒光分光光度計(jì)測(cè)定樣品的三維熒光光譜數(shù)據(jù)。 設(shè)置發(fā)射波長(zhǎng)區(qū)間為200~700 nm, 步長(zhǎng)為5 nm。 激發(fā)波長(zhǎng)區(qū)間為200~600 nm, 步長(zhǎng)也為5 nm。 設(shè)置儀器的激發(fā)與發(fā)射狹縫寬度均為10 nm, PMT電壓設(shè)置為400 V, 掃描速度定為30 000 nm·min-1。 所有計(jì)算均使用美國(guó)MathWorks公司出品的MATLAB R2021a進(jìn)行。 利用drEEM工具箱(http://www.models.life.ku.dk/drEEM)構(gòu)建PARAFAC模型[12]。
在本研究中, 我們選擇了河北沿程生物科技有限公司的酪氨酸、 南通飛宇生物科技有限公司的黃腐酸、 上海摩楷生物科技有限公司的萘乙酸和上海源葉生物科技有限公司的羅丹明B四種典型的化學(xué)物質(zhì)進(jìn)行實(shí)驗(yàn)。 將酪氨酸、 萘乙酸和羅丹明B的濃度梯度均設(shè)置為: 20、 40、 60、 80和100 μg·L-1。 將黃腐酸的濃度梯度設(shè)置為: 1、 3、 5、 7和9 mg·L-1。 每種化學(xué)品均用Millipore公司的Milli-Q水凈化系統(tǒng)的去離子水作溶劑配制而成, 各得五個(gè)樣品。
模擬突發(fā)污染水樣, 通過(guò)自來(lái)水與羅丹明B配制而成。 自來(lái)水取自浙江大學(xué)舟山校區(qū)海科樓。 通過(guò)控制水流流速, 每5 min取樣一次, 共取樣30個(gè)樣本。 為防止非必要性誤差的產(chǎn)生, 每個(gè)樣品均掃描三次三維熒光光譜, 取平均值作為樣品最終的三維熒光光譜進(jìn)行數(shù)據(jù)分析。
在三維熒光光譜中, 拉曼散射可近似由水分子與激發(fā)光光子相互作用發(fā)生能級(jí)躍遷而產(chǎn)生, 影響因素較為單一[13]。 且考慮到測(cè)試儀器本身的背景噪聲也會(huì)對(duì)實(shí)驗(yàn)效果造成影響。 因此我們需要測(cè)量每次實(shí)驗(yàn)中溶劑的三維熒光光譜, 本實(shí)驗(yàn)的溶劑均為去離子水, 將其作為背景基線。 采用原始光譜數(shù)據(jù)減去背景基線的校正方法, 也稱為空白扣除法, 達(dá)到校正拉曼散射和背景干擾的目的。
而瑞利散射的產(chǎn)生機(jī)理相對(duì)于拉曼散射而言要復(fù)雜很多。 瑞利散射是由光子與溶解氣體、 懸浮顆粒和可溶分子等碰撞而產(chǎn)生的, 影響因素頗多。 因此對(duì)于部分樣品, 特別是低濃度樣品而言, 僅采用空白扣除法往往難以對(duì)其達(dá)到很好的校正效果。 針對(duì)已完成拉曼散射校正的三維熒光光譜數(shù)據(jù), 本文將從散射峰與物質(zhì)峰的熒光強(qiáng)度和重疊程度兩方面考慮, 將光譜分為五類情況對(duì)應(yīng)三種重疊等級(jí), 采用一種自適應(yīng)的散射去除方法對(duì)其進(jìn)行校正。 首先, 對(duì)這一節(jié)中將出現(xiàn)的參數(shù)進(jìn)行定義與解釋說(shuō)明, 如表1所示。 需要注意的是, 當(dāng)散射區(qū)域與物質(zhì)峰因重疊過(guò)度而致使物質(zhì)區(qū)域沒(méi)有峰值時(shí), 物質(zhì)區(qū)域峰值即定義為其最大值, 且瑞利散射近似于一個(gè)中心在激發(fā)波長(zhǎng)處的高斯函數(shù)[14]。
表1 定義參數(shù)與解釋說(shuō)明
然后對(duì)即將應(yīng)用到的三種算法進(jìn)行簡(jiǎn)要介紹。 置零法即為用零替換已有數(shù)據(jù)。 Hermite插值, 也稱為具有節(jié)點(diǎn)的導(dǎo)數(shù)值約束的插值。 因?yàn)槠鋰?yán)苛的算法要求, 既能保證數(shù)據(jù)的強(qiáng)關(guān)聯(lián)性又能使所得曲線相對(duì)光滑, 在插值領(lǐng)域應(yīng)用廣泛。 然而直接使用Hermite插值得到的多項(xiàng)式往往次數(shù)較高, 也存在著龍格現(xiàn)象。 因此在本研究中, 我們采用了分段三次Hermite插值多項(xiàng)式(piecewise cubic hermite interpolating polynomial, PCHIP)以防止過(guò)擬合。 高斯擬合即為用高斯函數(shù)對(duì)已經(jīng)存在的數(shù)據(jù)點(diǎn)進(jìn)行函數(shù)擬合逼近。
由于拉曼散射是通過(guò)空白扣除法進(jìn)行校正的, 所以原始光譜的瑞利散射數(shù)據(jù)也將扣除部分。 因此會(huì)存在瑞利散射信號(hào)比物質(zhì)熒光強(qiáng)度弱的情況。 我們將從散射峰與物質(zhì)峰的熒光強(qiáng)度大小關(guān)系進(jìn)行考慮, 將其分為h≤1/2H和h>1/2H兩大類。 首先介紹h≤1/2H的情況。 我們對(duì)其四個(gè)端點(diǎn): A、 B、 C、 D分別進(jìn)行評(píng)估。 對(duì)于A端點(diǎn), 當(dāng)h1≤1/2H0, 且y(A)≈0時(shí)表示散射峰與物質(zhì)峰不存在重疊區(qū)域, 采用置零法對(duì)R1區(qū)域進(jìn)行有效數(shù)據(jù)替換處理; 當(dāng)0 圖2 酪氨酸在(a) 210 nm, (b) 260 nm, (c) 270 nm, (d) 275 nm激發(fā)波長(zhǎng)下的熒光發(fā)射光譜 而當(dāng)h>1/2H時(shí), 將存在三種情況, 即無(wú)重疊、 微弱重疊和嚴(yán)重重疊。 以B點(diǎn)為例進(jìn)行探討, A、 C和D點(diǎn)的情況根據(jù)上文依次類推。 當(dāng)h1>1/2H1,y(B)≈0時(shí), 如圖2(b)所示, 表明散射峰與物質(zhì)峰無(wú)重疊, 可用置零法將R1區(qū)域內(nèi)數(shù)據(jù)替換為0。 當(dāng)0 將這五種情況列表如表2所示。 需要注意的是對(duì)于瑞利散射而言其一般具有兩個(gè)邊界端點(diǎn), 如果兩個(gè)端點(diǎn)所判斷的情況不一樣, 則需要根據(jù)優(yōu)先級(jí)關(guān)系進(jìn)行進(jìn)一步判斷處理。 優(yōu)先級(jí)關(guān)系為: 類別5>類別4=類別2>類別3=類別1。 表2 自適應(yīng)算法所對(duì)應(yīng)的五類情況 如圖3(a), (c), (e), (g)分別是酪氨酸、 黃腐酸、 萘乙酸和羅丹明B的原始光譜圖, 酪氨酸、 萘乙酸和羅丹明B的濃度均為40 μg·L-1, 黃腐酸的濃度為5 mg·L-1, 以此為例, 其他情況均可類推。 不難看出, 酪氨酸和黃腐酸與拉曼光譜重疊較為嚴(yán)重, 存在嚴(yán)重重疊區(qū)域。 通過(guò)空白扣除法, 扣除了原始三維熒光光譜的背景干擾和拉曼散射后, 所得光譜圖如圖3(b), (d), (f), (h)所示。 通過(guò)對(duì)比圖3(a), (b)和圖3(c), (d)可以看出, 即使物質(zhì)熒光區(qū)域與拉曼散射區(qū)域嚴(yán)重重疊, 該方法也能起到很好的校正效果。 由此論證通過(guò)空白扣除法校正拉曼散射是合理有效的。 圖3 (a) 酪氨酸、 (c) 黃腐酸、 (e) 萘乙酸、 (g) 羅丹明B的原始三維熒光光譜圖; 其拉曼散射校正后的光譜圖分別為(b)、 (d)、 (f)、 (h); 校正后的三維熒光光譜圖上方兩條色條分別表示一階瑞利散射和二階瑞利散射區(qū)域與物質(zhì)峰的重疊程度, 藍(lán)黑色、 橙色和紅色色條分別對(duì)應(yīng)無(wú)重疊、 微弱重疊和嚴(yán)重重疊 通過(guò)圖3(b), (d), (f), (h)也可以看出, 對(duì)于低濃度樣品而言, 僅僅通過(guò)空白扣除法是無(wú)法完全去除瑞利散射干擾的, 這與理論相符。 因此對(duì)于低濃度并且物質(zhì)熒光信號(hào)存在與散射區(qū)域重疊較為嚴(yán)重的樣品來(lái)說(shuō), 亟需一種有效的去除瑞利散射的方法。 按照1.4節(jié)的方法, 綜合考慮物質(zhì)峰與散射區(qū)域峰值的熒光強(qiáng)度和重疊程度, 對(duì)光譜進(jìn)行重疊等級(jí)評(píng)估, 結(jié)果如圖3(b), (d), (f), (h)三維熒光光譜上方的色條所示。 上方第一條色條表示一階瑞利散射與物質(zhì)峰的重疊程度, 上方第二條表示二階瑞利散射與物質(zhì)峰的重疊程度。 藍(lán)黑色代表無(wú)重疊, 橙色代表微弱重疊, 紅色代表嚴(yán)重重疊。 不難得出, 羅丹明B的重疊情況和程度相對(duì)于其他三種物質(zhì)來(lái)說(shuō)更為復(fù)雜, 這與事實(shí)相符。 根據(jù)2.1節(jié)中瑞利散射區(qū)域與物質(zhì)峰重疊程度的評(píng)估結(jié)果, 分別對(duì)酪氨酸、 黃腐酸、 萘乙酸和羅丹明B這四種典型的有機(jī)化合物進(jìn)行了相應(yīng)的算法處理。 校正后的三維熒光光譜圖如圖4(a), (b), (c), (d)所示。 與原始三維熒光光譜圖對(duì)比, 可以發(fā)現(xiàn)物質(zhì)熒光光譜區(qū)域結(jié)構(gòu)完整, 大量信息得以有效留存, 瑞利散射和拉曼散射完全去除。 即使光譜重疊嚴(yán)重的羅丹明B的三維熒光光譜經(jīng)過(guò)處理后形狀也未失真, 證明了本文方法去除散射干擾的有效性。 圖4 (a) 酪氨酸、 (b)黃腐酸、 (c)萘乙酸、 (d)羅丹明B基于自適應(yīng)方法校正后的三維熒光光譜圖 因?yàn)辄S腐酸是天然有機(jī)化合物, 廣泛存在于自然界中, 并且物質(zhì)熒光區(qū)域和散射區(qū)域存在嚴(yán)重重疊情況。 所以以黃腐酸為典型物質(zhì), 將本文方法與現(xiàn)階段研究中采用最多的Delaunay三角形內(nèi)插值法進(jìn)行對(duì)比。 我們分別采用[16, 18]、 [10, 10]、 [22, 22]、 [18, 16]為最佳參數(shù)的一階瑞利散射、 一階拉曼散射、 二階瑞利散射和二階拉曼散射數(shù)值設(shè)定進(jìn)行了Delaunay插值, 結(jié)果如圖5(b)所示。 可以看出紅色方框區(qū)域內(nèi)的熒光信號(hào)相對(duì)于本文所使用的方法而言出現(xiàn)嚴(yán)重失真, 存在過(guò)擬合現(xiàn)象。 說(shuō)明Delaunay插值方法對(duì)存在嚴(yán)重重疊干擾的適應(yīng)性較弱。 并對(duì)四種有機(jī)化合物的共20個(gè)樣本, 分別用這兩種方法進(jìn)行了散射校正處理, 以重疊區(qū)域散射校正后的數(shù)據(jù)進(jìn)行濃度回歸, 所得決定系數(shù)R-squared的值列表如表3所示, 本文方法的平均決定系數(shù)為0.996 2, 相對(duì)于Delaunay插值法所得的平均決定系數(shù)提高了5.04%, 進(jìn)一步證明了本文方法保持物質(zhì)熒光光譜區(qū)域的結(jié)構(gòu)特征和去除散射干擾的合理有效性。 表3 四種有機(jī)化合物經(jīng)本文方法和Delaunay插值法散射校正后進(jìn)行濃度回歸預(yù)測(cè)所得的決定系數(shù)值 圖5 黃腐酸散射校正后的三維熒光光譜圖 為驗(yàn)證本文方法在實(shí)際應(yīng)用場(chǎng)景中的可靠性和通用性, 我們通過(guò)模擬突發(fā)污染實(shí)驗(yàn)對(duì)所得水樣進(jìn)行了水質(zhì)監(jiān)測(cè)。 因?yàn)榱_丹明B是一種常見(jiàn)的致癌染料, 經(jīng)常在印染廠附近的河流中發(fā)現(xiàn)。 所以我們擬采用自來(lái)水和羅丹明B進(jìn)行實(shí)驗(yàn), 共獲得30個(gè)樣品。 利用PARAFAC模型計(jì)算30個(gè)樣品的四個(gè)PARAFAC分量的載荷, 如圖6所示, 可以看到組分四在第9和第10個(gè)樣品之間有明顯的變化。 這與加入羅丹明B的時(shí)間相符, 進(jìn)一步驗(yàn)證了本文方法修正三維熒光光譜中瑞利散射和拉曼散射的合理性, 同時(shí)論證了此方法具有普適性, 可以用于實(shí)際應(yīng)用場(chǎng)景之中。 圖6 模擬突發(fā)污染水樣的四種PARAFAC組分載荷隨時(shí)間的變化趨勢(shì) 基于散射峰與物質(zhì)峰的熒光強(qiáng)度和光譜重疊程度, 提出了一種自適應(yīng)的三維熒光光譜去散射方法。 其過(guò)程包括: 獲取樣品的三維熒光光譜數(shù)據(jù)→通過(guò)空白扣除法扣除拉曼散射和背景干擾→根據(jù)散射峰與物質(zhì)峰的熒光強(qiáng)度和光譜重疊程度將樣品光譜分為五種情況對(duì)應(yīng)三種算法分別進(jìn)行數(shù)據(jù)處理→得到散射校正后的三維熒光光譜數(shù)據(jù)。 在四種典型有機(jī)化學(xué)品的去散射實(shí)驗(yàn)中, 與原始光譜、 空白扣除法和Delaunay插值法對(duì)比, 利用本文方法去散射后的三維熒光光譜數(shù)據(jù)相比單一的使用空白扣除法更好地校正了瑞利散射的干擾。 并且以重疊區(qū)域散射校正后的數(shù)據(jù)進(jìn)行濃度回歸, 本文方法所得的平均決定系數(shù)為0.996 2, 相比于Delaunay插值法提高了5.04%, 進(jìn)一步證明了本文方法有效地避免了過(guò)擬合現(xiàn)象的發(fā)生, 保持了物質(zhì)熒光光譜區(qū)域的結(jié)構(gòu)特征。 此外, 還進(jìn)行了模擬突發(fā)污染實(shí)驗(yàn), 對(duì)水樣進(jìn)行監(jiān)測(cè)。 結(jié)果表明, 此方法在提高三維熒光光譜數(shù)據(jù)處理的適應(yīng)性和準(zhǔn)確性方面具有潛力, 可用于實(shí)際場(chǎng)景之中。2 結(jié)果與討論
2.1 拉曼散射與背景干擾校正
2.2 三維熒光光譜校正
2.3 模擬突發(fā)污染水樣的PARAFAC分析
3 結(jié) 論