許佩軍, 周 末, 張明振, 郭秋含, 牟曉紅, 李 焱
(1.遼寧師范大學(xué) 物理與電子技術(shù)學(xué)院,遼寧 大連 116029;2.中國(guó)科學(xué)院 大連化學(xué)物理研究所 分子反應(yīng)動(dòng)力學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,遼寧 大連 116023)
三維熒光光譜是近些年廣泛應(yīng)用而發(fā)展起來(lái)的一種熒光分析技術(shù), 它在食品科學(xué)[1-2]、分析化學(xué)[3-6]、生物化學(xué)[7-8]以及環(huán)境科學(xué)[9-10]等領(lǐng)域都有廣泛的應(yīng)用. 三維熒光光譜是由激發(fā)波長(zhǎng)(Emission, Em), 發(fā)射波長(zhǎng)(Excitation, Ex), 熒光強(qiáng)度(熒光強(qiáng)度數(shù)值用Z表示)組成的三維矩陣光譜(Excitation-Emission Matrix, EEM), 它描述了熒光強(qiáng)度隨激發(fā)波長(zhǎng)和發(fā)射波長(zhǎng)的變化關(guān)系. 三維熒光光譜不僅能夠獲得激發(fā)波長(zhǎng)與發(fā)射波長(zhǎng), 同時(shí)能夠獲取變化時(shí)的熒光強(qiáng)度信息. 在熒光光譜的生成過(guò)程中, 由散射機(jī)制引起的拉曼(Raman)散射或瑞利(Rayleigh)散射, 經(jīng)常會(huì)單獨(dú)存在或同時(shí)存在于熒光光譜數(shù)據(jù)中. 這兩種散射的能量通常要高于目標(biāo)物質(zhì)對(duì)應(yīng)的能量. 而且, 這兩種散射的能量范圍有可能干擾甚至部分覆蓋目標(biāo)物質(zhì)的能量, 于是, 去除熒光光譜中的無(wú)用散射就具有重要的理論研究意義.
無(wú)用散射的去除工作, 一直是熒光光譜分析工作中的重要步驟[11-13]. 2014年, Eilers和Kroonenberg通過(guò)高斯峰刻畫(huà)了散射的位置信息、高度以及寬度. 在平滑處理后, 實(shí)現(xiàn)拉曼和瑞利散射的去除[14]. 2015年, Rinnan和Anderson對(duì)熒光光譜數(shù)據(jù)中的拉曼和瑞利散射進(jìn)行去除[15]. 2015年,Elcoroaristizabla和Bro等人對(duì)熒光光譜數(shù)據(jù)處理的相關(guān)工作進(jìn)行了總結(jié)[16]. 2019年,Chiappini、Alcaraz和Goicorchea等人提出改進(jìn)的信息保守方法用于處理熒光數(shù)據(jù)中的拉曼和瑞利散射[17]. 2019年, Chiappini等人基于已有的算法, 給出處理熒光光譜數(shù)據(jù)的圖形交互界面, 這使得即使沒(méi)有程序語(yǔ)言基礎(chǔ), 也能夠輕松實(shí)現(xiàn)光譜數(shù)據(jù)的處理[18].
上述工作中, 對(duì)無(wú)用散射的判斷, 大部分是在Ex方向上基于高斯分布判斷散射的寬度, 高度等信息. 當(dāng)散射能量不滿足對(duì)稱或高斯分布時(shí), 散射的信息便有待進(jìn)一步確定. 本文旨在提出一種基于數(shù)據(jù)自動(dòng)判斷無(wú)用散射的機(jī)制, 在完成去除后, 通過(guò)剩余數(shù)據(jù)對(duì)刪除數(shù)據(jù)實(shí)現(xiàn)補(bǔ)全. 這一算法對(duì)熒光光譜數(shù)據(jù)并無(wú)高斯分布的要求.
在光譜數(shù)據(jù)中, 瑞利散射滿足
Em=n×Ex,
(1)
其中,n代表n階散射.
在光譜數(shù)據(jù)中, 拉曼散射滿足
(2)
其中,wnr是光譜數(shù)據(jù)中瑞利散射和拉曼散射的波數(shù)之差.
在無(wú)用散射去除過(guò)程中, 熒光光譜需要滿足如下兩條件要求:①瑞利和拉曼散射的能量大于目標(biāo)物質(zhì)的能量;②瑞利和拉曼散射至少存在一種. 在Em方向中,散射能量不要求為高斯分布. 最高值可以為定值. 無(wú)用散射的去除過(guò)程有3個(gè)主要步驟:①數(shù)據(jù)預(yù)處理及散射判斷;②散射信息處理以及散射去除;③去除補(bǔ)齊.
在對(duì)光譜數(shù)據(jù)實(shí)現(xiàn)預(yù)處理和散射判斷的過(guò)程中, 由于生成機(jī)制所致, 熒光光譜中會(huì)存在大量的散點(diǎn)噪聲, 這使得光譜的能量并不平滑, 會(huì)影響之后的無(wú)用散射信息的判斷準(zhǔn)確性. 于是, 在本文提出的算法中, 通過(guò)2D的均值濾波實(shí)現(xiàn)平滑處理, 在基本保留熒光光譜的主要信息的前提下, 去除此類噪聲. 具體的, 如下式所示:
(3)
其中,ni、nj分別是在2D數(shù)據(jù)中沿Ex、Em方向上的平滑寬度.
在熒光光譜的數(shù)據(jù)中, 通過(guò)能量值判斷瑞利或拉曼散射是否存在. 根據(jù)兩種散射的理論基礎(chǔ), 兩者在光譜中的位置基本固定, 需要確定的是必須去除的無(wú)用散射寬度.
本文的思路是通過(guò)迭代的方式, 在一定范圍不斷選擇能量高的數(shù)據(jù), 通過(guò)最小二乘法擬合出直線方程.當(dāng)直線方程在散射的范圍之內(nèi), 則認(rèn)為存在散射;若直線方程不在散射的范圍之內(nèi), 有可能是因?yàn)檫x取能量高的數(shù)據(jù)點(diǎn)過(guò)少, 則需放寬能量點(diǎn)的選擇范圍, 篩選更多的能量點(diǎn), 通過(guò)上述的方法直至擬合出在散射范圍內(nèi)的直線方程. 具體的判斷流程如圖1所示.
圖1 無(wú)用散射的確定過(guò)程流程圖Fig. 1 The flowchart of detecting the useless scatter
對(duì)于光譜數(shù)據(jù), 通過(guò)針對(duì)每個(gè)Em值上不同Ex對(duì)應(yīng)的強(qiáng)度Z, 實(shí)現(xiàn)散射寬度的確定. 首先, 通過(guò)一維數(shù)據(jù)說(shuō)明無(wú)用散射的信息確定過(guò)程. 如圖2(A)顯示的是特定Em值, 強(qiáng)度Z隨Ex的變化的數(shù)據(jù). 由于已經(jīng)經(jīng)過(guò)2D的平滑處理, 強(qiáng)度曲線中已經(jīng)不存在散點(diǎn)噪聲, 但曲線依舊不平滑. 本文采用1D的平滑處理, 使曲線保持其原有的變化趨勢(shì), 但能平滑掉細(xì)小的凹凸不平, 具體的如圖2(B)所示. 因?yàn)镋m已知, 根據(jù)之前確定的散射方程, 可以得到無(wú)用散射的峰值的粗略范圍,Sp在本論文中同時(shí)考慮曲線的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)判斷散射峰的范圍.
針對(duì)平滑后的數(shù)據(jù)求解能量強(qiáng)度Z, 對(duì)于Ex的一階導(dǎo)數(shù)和二階導(dǎo)數(shù), 分別在圖2(C)和圖2(D)所示. 其中,距離Sp最近的一階導(dǎo)數(shù)為0的點(diǎn)為無(wú)用散射的寬度范圍,二階導(dǎo)數(shù)為0的點(diǎn)用于進(jìn)一步判斷寬度范圍是否準(zhǔn)確.
圖2 無(wú)用散射信息確定過(guò)程的示意圖Fig.2 The illustration of deciding the range of useless scatterA.隨Ex的變化的2D平滑后的強(qiáng)度值(特定Em);B.1D平滑后的強(qiáng)度值;C.強(qiáng)度的一階導(dǎo)數(shù)變化;D.強(qiáng)度的二階導(dǎo)數(shù)變化
在確定無(wú)用散射的寬度后, 將在確定的無(wú)用散射范圍內(nèi)的強(qiáng)度值設(shè)為空(NaN).
在去除無(wú)用散射的能量后, 通過(guò)插值的方式, 將NaN區(qū)域進(jìn)行補(bǔ)齊, 以確保熒光光譜的完整性. 本文中采用的是三次多項(xiàng)式的插值實(shí)現(xiàn).
對(duì)于一個(gè)特定Em值對(duì)應(yīng)的能量曲線, 分別針對(duì)拉曼和瑞利散射實(shí)現(xiàn)上述過(guò)程, 完成單條能量曲線上的兩種無(wú)用散射位置的補(bǔ)齊. 對(duì)于每個(gè)Em值均完成上述處理, 即完成整個(gè)光譜的無(wú)用散射的處理工作.算法的流程圖如圖3所示.對(duì)數(shù)據(jù)的處理示意圖如圖4所示.
圖3 三維熒光光譜數(shù)據(jù)去除無(wú)用散射的實(shí)現(xiàn)步驟Fig. 3 The steps of deleting the useless scatter in 3D EEM fluorescence
圖4 三維熒光光譜數(shù)據(jù)去除無(wú)用散射的實(shí)現(xiàn)流程圖Fig. 4 The illustrations of deleting the useless scatter in 3D EEM fluorescence
針對(duì)新的去散射算法, 完全基于實(shí)驗(yàn)所采集的光譜數(shù)據(jù)進(jìn)行驗(yàn)證需要消耗大量的資源. 并且由于真實(shí)的實(shí)驗(yàn)環(huán)境所限, 絕大部分的實(shí)驗(yàn)過(guò)程都無(wú)法保證實(shí)驗(yàn)所使用數(shù)據(jù)的完備性, 于是本文嘗試使用依據(jù)理論生成的熒光光譜數(shù)據(jù)來(lái)驗(yàn)證所提算法針對(duì)不同特點(diǎn)數(shù)據(jù)的魯棒性.
首先, 對(duì)于要生成的光譜數(shù)據(jù), 確定其中目標(biāo)能量的位置. 如前所述, 在光譜數(shù)據(jù)中拉曼瑞利兩種散射生成機(jī)制相對(duì)固定, 其中,不同譜之間無(wú)用散射改變的是其對(duì)應(yīng)的長(zhǎng)度、寬度、強(qiáng)度和分散程度等性質(zhì). 為了與現(xiàn)實(shí)中的光譜數(shù)據(jù)更加接近, 在生成譜的過(guò)程中還在數(shù)據(jù)中加入散點(diǎn)噪聲和半徑小于Rnoise的圓形噪聲. 為了驗(yàn)證所提算法對(duì)無(wú)用散射和目標(biāo)能量的區(qū)分能力, 針對(duì)上述信息隨機(jī)生成具有不同性質(zhì)的無(wú)用散射的光譜數(shù)據(jù).
將目標(biāo)物對(duì)應(yīng)的能量生成在光譜數(shù)據(jù)的有效范圍中, 其中, 拉曼散射和瑞利散射包圍范圍之外的部分不生成目標(biāo)物的能量, 目標(biāo)物的能量采用ntag個(gè)二維高斯分布代替. 其中,σ1,σ2在一定的范圍內(nèi)選取在本數(shù)值實(shí)驗(yàn)中選擇ntag=1,2,3.
目標(biāo)散射和無(wú)用散射基本存在三種位置關(guān)系, 分別是相距較遠(yuǎn), 部分相交和部分覆蓋.
在圖5(A)中顯示的是目標(biāo)物的能量與兩種散射均不相交的情況.在圖5(B)中顯示的是目標(biāo)物的能量只部分與散射相交且散射的能量覆蓋目標(biāo)物能量. 在圖5(C)中顯示的是目標(biāo)物的能量散射能量覆蓋目標(biāo)物.圖5(D)~圖5(F)分別對(duì)應(yīng)著子圖5(A)~圖5(C)中固定Em值能量強(qiáng)度對(duì)應(yīng)Ex的變化過(guò)程. 基于生成的熒光光譜數(shù)據(jù),采用本文提出的去噪算法,會(huì)得到去除無(wú)用散射后的光譜數(shù)據(jù).針對(duì)三種不同的情況,分別生成若干個(gè)測(cè)試用光譜數(shù)據(jù),圖6~圖8分別針對(duì)每種情況選擇三組數(shù)據(jù)用于顯示和說(shuō)明.每個(gè)圖的子圖中,左側(cè)子圖是依據(jù)理論生成的光譜數(shù)據(jù),側(cè)子圖是去散射之后,目標(biāo)能量的分布.由于目標(biāo)能量相比于無(wú)用散射低所以一般的右圖中的能量范圍要小于左圖中的能量范圍.三種情況中,本論文算法均能很準(zhǔn)確地判斷無(wú)用散射的位置和能量,實(shí)現(xiàn)無(wú)用散射的去除和補(bǔ)全.
圖5 目標(biāo)能量和無(wú)用散射的位置關(guān)系Fig. 5 The position relationship of target energy and useless scatterA.目標(biāo)物的能量與無(wú)用散射均不相交的三維光譜圖;B.目標(biāo)物的能量只部分與無(wú)用散射相交的三維光譜圖;C.無(wú)用散射能量覆蓋大部分目標(biāo)物能量的三維光譜圖;D.基于A圖數(shù)據(jù)下固定Em值能量強(qiáng)度對(duì)應(yīng)Ex的變化過(guò)程;E.基于B圖數(shù)據(jù)下固定Em值能量強(qiáng)度對(duì)應(yīng)Ex的變化過(guò)程;F.基于C圖數(shù)據(jù)下固定Em值能量強(qiáng)度對(duì)應(yīng)Ex的變化過(guò)程
具體如圖6所示, 目標(biāo)能量在散射之間, 且分別距離兩種散射較遠(yuǎn), 這使得對(duì)無(wú)用散射的判斷不受目標(biāo)能量影響, 容易確定其覆蓋范圍. 于是, 具有較高能量的無(wú)用散射被剔除后, 基本沒(méi)有影響目標(biāo)物的能量. 在三組生成的光譜數(shù)據(jù)中, 所提算法均很準(zhǔn)確地實(shí)現(xiàn)了無(wú)用散射的剔除.
圖6 去無(wú)用散射前后光譜數(shù)據(jù)的對(duì)比圖. 目標(biāo)能量和無(wú)用散射相距較遠(yuǎn)Fig. 6 The comparison between the fluorescence data before and after deleting the useless scatter. Large distance between target energy and useless scatter
在下面的各個(gè)光譜數(shù)據(jù)圖像中, 橫軸為Em, 縱軸為Ex, 光譜強(qiáng)度以等高線的形式顯示, 激發(fā)波長(zhǎng)和發(fā)射波長(zhǎng)單位為nm,光譜強(qiáng)度單位為a.u.,其中,等高線顏色對(duì)應(yīng)的光譜強(qiáng)度由每個(gè)子圖右側(cè)的colorbar顯示. 之后生成的光譜數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)的圖像均以此種方式表達(dá).
如圖7所示, 當(dāng)目標(biāo)能量存在一部分與無(wú)用散射相交的情況時(shí), 目標(biāo)能量對(duì)無(wú)用散射的判斷也產(chǎn)生影響, 但這種影響相對(duì)于無(wú)用散射的高能量, 基本可以忽略. 目標(biāo)能量中, 能量較低的部分由插值得到. 于是, 本文所提算法依舊可以準(zhǔn)確地實(shí)現(xiàn)無(wú)用散射的剔除.
圖7 去無(wú)用散射前后光譜數(shù)據(jù)的對(duì)比圖.目標(biāo)能量和無(wú)用散射部分相交Fig.7 The comparison between the fluorescence data before and after deleting the useless scatter. Partly intersection of target energy and useless scatter
如圖8所示, 部分的目標(biāo)能量與無(wú)用散射重疊, 這使得對(duì)無(wú)用散射的范圍的判斷難度提升. 在目標(biāo)能量中, 存在一部分通過(guò)插值得到的數(shù)據(jù), 但根據(jù)光譜數(shù)據(jù)進(jìn)行插值, 可以確保保留目標(biāo)物的能量變化趨勢(shì), 于是, 所提算法還是可以準(zhǔn)確實(shí)現(xiàn)無(wú)用散射的剔除.
圖8 去無(wú)用散射前后光譜數(shù)據(jù)的對(duì)比圖.目標(biāo)能量和無(wú)用散射部分重疊Fig.8 The comparison between the fluorescence data before and after deleting the useless scatter. Partly overlapping of target energy and useless scatter
通過(guò)生成的熒光光譜可以驗(yàn)證所提算法的可行性. 下面將該算法用于實(shí)驗(yàn)過(guò)程中得到的真實(shí)的光譜數(shù)據(jù)中.
對(duì)比于生成的光譜數(shù)據(jù), 真實(shí)的熒光光譜數(shù)據(jù)具有更強(qiáng)的隨機(jī)性, 其中目標(biāo)函數(shù)的范圍也更加的不規(guī)則, 這給去除無(wú)用散射增加了難度.
如圖9所示, 在光譜數(shù)據(jù)中, 目標(biāo)能量覆蓋的范圍更大, 且只存在一組無(wú)用散射的影響. 對(duì)于每個(gè)Em值, 判斷無(wú)用散射的難度加大. 但由于散射與目標(biāo)能量相互獨(dú)立, 所以所提算法很準(zhǔn)確地去除了無(wú)用散射, 并保留下大范圍的目標(biāo)能量.
圖9 去無(wú)用散射前后光譜數(shù)據(jù)的對(duì)比圖. 目標(biāo)能量和無(wú)用散射相距較遠(yuǎn)(實(shí)驗(yàn)數(shù)據(jù))Fig.9 The comparison between the fluorescence data before and after deleting the useless scatter. Large distance between target energy and useless scatter(experiment)
如圖10所示, 目標(biāo)能量有一部分與無(wú)用散射相交, 而且無(wú)用散射以很高的能量影響目標(biāo)能量. 即便如此, 目標(biāo)能量也被準(zhǔn)確的保留, 得到較好的無(wú)用散射去除結(jié)果.
圖10 去無(wú)用散射前后光譜數(shù)據(jù)的對(duì)比圖.目標(biāo)能量和無(wú)用散射部分相交(實(shí)驗(yàn)數(shù)據(jù))Fig.10 The partly intersection of target energy and useless scatter (experiment). Partly intersection of target energy and useless scatter
本文提出一種基于光譜數(shù)據(jù)判斷無(wú)用散射的去除算法. 針對(duì)生成的光譜數(shù)據(jù)和實(shí)驗(yàn)得到的光譜數(shù)據(jù), 均得到了較好的無(wú)用散射去除效果, 本算法為進(jìn)一步的高通量自動(dòng)去除無(wú)用散射提供可能. 本文所提出的算法, 暫時(shí)只針對(duì)一階瑞利和拉曼散射. 在未來(lái)的工作中, 如何基于現(xiàn)有機(jī)制實(shí)現(xiàn)高階無(wú)用散射的去除, 是我們要進(jìn)一步研究和探討的主要內(nèi)容.
遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年4期