李 明,趙 迎,崔飛鵬,劉 佳
1. 鋼鐵研究總院,北京 100081 2. 鋼研納克檢測(cè)技術(shù)股份有限公司,北京 100094
拉曼光譜中的噪聲主要有來自電子元器件隨機(jī)熱運(yùn)動(dòng)而造成的電子噪聲,在譜圖中表現(xiàn)為高頻頻段; 外部雜散光以及樣品在入射光的作用下產(chǎn)生的熒光或其他雜散光,在譜圖中表現(xiàn)為低頻頻段。趙肖宇等應(yīng)用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和集合平均經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)方法處理了含噪光譜信號(hào),獲得了不錯(cuò)的效果,但僅應(yīng)用于信號(hào)的去噪處理。EEMD方法最大的優(yōu)勢(shì)就是根據(jù)時(shí)頻特性將信號(hào)本身的特征成分自適應(yīng)的分解為具有物理意義的特征分量,本文利用EEMD方法對(duì)拉曼信號(hào)進(jìn)行自適應(yīng)時(shí)頻特征分解,得到有物理意義的高頻噪聲段,拉曼有效信號(hào)段和熒光背景段,通過增強(qiáng)有效信號(hào)并重構(gòu)拉曼信號(hào)獲得了更好的特征譜圖[1],該方法應(yīng)用于食用油的分析,取得了較好的效果,為拉曼光譜信號(hào)處理提供了一種新的方法。
Huang等[2]于1998年提出一種信號(hào)時(shí)頻分析方法—EMD,該方法能自適應(yīng)的將信號(hào)分解成有限個(gè)具有物理意義的分量—固有模態(tài)函數(shù)(intrinsic mode function,IMF)。EMD方法的一個(gè)重要缺陷就是模態(tài)混疊,為了克服這個(gè)問題,Wu和Huang在對(duì)白噪聲進(jìn)行EMD分解深入研究的基礎(chǔ)上,提出了EEMD方法,其基本思路[3]為: 將高斯白噪聲加入被分析信號(hào),使信號(hào)和噪聲成為一個(gè)“集合”,在EMD的分解過程中,當(dāng)被分析信號(hào)加在這些一致分布的白色背景上時(shí),不同尺度的信號(hào),會(huì)自適應(yīng)的映射到合適的頻率范圍上; 同時(shí),由于白噪聲的零均值特性,加入多次白噪聲分解,將這些多次分解的結(jié)果取“平均”后,噪聲最終被相互抵消而消除,即集合平均的分解結(jié)果被當(dāng)做是被分析信號(hào)的EMD分解結(jié)果。
EEMD方法的基本步驟[4]為:
步驟1: 給被分析信號(hào)x(t)加入一組白噪聲w(t)來獲得一個(gè)總體X(t)
X(t)=x(t)+w(t)
(1)
步驟2: 對(duì)X(t)進(jìn)行EMD分解,得到相應(yīng)的各階IMF
(2)
步驟3: 給被分析信號(hào)x(t)加入一組不同的白噪聲wj(t)來獲得另一個(gè)總體Xj(t),對(duì)Xj(t)進(jìn)行EMD分解后,得到相應(yīng)的各階IMF
(3)
步驟4: 求得各個(gè)IMF的均值作為最終信號(hào)的IMF
(4)
式中,N為加入白噪聲的次數(shù),即總體的個(gè)數(shù),ε是加入白噪聲的幅度,εn是原始信號(hào)和由最終的IMF之和所得信號(hào)的誤差。
(5)
EEMD方法較之EMD方法,有效的克服了模態(tài)混疊現(xiàn)象,能更加清晰的將信號(hào)中不同頻率的成分劃分開來,因此更加適合頻率成分豐富的拉曼信號(hào)的特征分析和處理。
本研究用的食用油采購市場常見的品牌,其中大豆油5種,花生油5種,玉米油5種,葵花籽油5種,如圖1所示,所有食用油樣品置于不含熒光背景的5 mL樣品瓶中。
實(shí)驗(yàn)儀器為美國Bayspec公司的AgilityTM拉曼光譜儀,如圖2所示,參數(shù)設(shè)置: 激發(fā)波長785 nm,激光器功率450 mW,積分時(shí)間1 000 ms,掃描波數(shù)范圍: 100~2 700 cm-1。
實(shí)驗(yàn)室環(huán)境溫度25 ℃,每種樣品分裝在2個(gè)樣品瓶中,直接測(cè)量,一共獲得的40張拉曼光譜原始譜圖,如圖3所示,圖示曲線從上到下,1—10為大豆油拉曼譜圖; 11—20為花生油拉曼譜圖; 21—30為玉米油拉曼譜圖; 31—40為葵花籽油拉曼譜圖。
選取原始拉曼譜圖作為信號(hào)處理對(duì)象,經(jīng)EEMD分解,自適應(yīng)的得到了10個(gè)IMF,如圖4所示,其特征頻率從高到低排布,其中IMF1頻率最高,IMF10[即信號(hào)的趨勢(shì)r(t)]最低。根據(jù)信號(hào)的能量分布以及幅值特性,IMF1和IMF2表征為信號(hào)中的噪聲部分; IMF3—IMF7表征為拉曼特征信號(hào)部分; 最后一階IMF10表征為熒光背景成分,IMF8和IMF9為其他物理意義的頻率成分。由此可見,EEMD方法可以完整的將拉曼信號(hào)中各個(gè)有物理意義的特征頻率成分分解出來。
圖1 食用油樣品
圖2 拉曼光譜儀
圖3 食用油原始拉曼譜圖
圖4 原始拉曼信號(hào)的EEMD分解
上述處理結(jié)果,IMF1和IMF2為信號(hào)中的噪聲部分,IMF10為熒光頻率段,通過增強(qiáng)IMF3—IMF7段可有效增加信噪比,而拉曼信號(hào)的噪聲及熒光背景不變,獲得特征增強(qiáng)后的拉曼信號(hào)Y(t),其中k定義為增強(qiáng)因子。
(6)
如圖5所示,為特征增強(qiáng)后的拉曼信號(hào)和原始拉曼信號(hào),圖中可見,信號(hào)的高頻噪聲和熒光背景與原始譜圖一致,在k=3的有效信號(hào)特征增強(qiáng)下獲得了信噪比2~5倍的提升。
圖5 原始拉曼信號(hào)和增強(qiáng)后的拉曼信號(hào)對(duì)比
如圖6所示,結(jié)合基于連續(xù)小波變換的懲罰最小二乘法[5](continuous wavelet transform-penalized least squares, CWT-PLS)進(jìn)行進(jìn)一步處理,可見有效特征峰均得到不同程度的增強(qiáng),其中,食用油中難以探測(cè)的酯鍵羰基伸縮振動(dòng)位于1 745 cm-1的譜峰得到了顯著的增強(qiáng)。
圖6 原始拉曼信號(hào)和增強(qiáng)后的拉曼信號(hào)二次處理后對(duì)比
將試驗(yàn)的拉曼譜圖均按上述方法進(jìn)行信號(hào)特征增強(qiáng)后,獲得了4種食用油各10張?jiān)鰪?qiáng)后的拉曼譜圖,如圖7所示。
上述數(shù)據(jù)僅從拉曼譜圖上無法鑒別食用油樣本類型,本文結(jié)合PCA(主成分分析)方法后進(jìn)一步進(jìn)行判別,選取信噪比較高拉曼位移為300~1 800 cm-1的譜段作為PCA分析的主要分析數(shù)據(jù),圖8顯示為原始信號(hào)以及使用EEND方法的特征增強(qiáng)后的信號(hào)經(jīng)過CWT-PLS方法處理后的PCA分析結(jié)果對(duì)比。結(jié)果顯示: 原始信號(hào)直接經(jīng)過CWT-PLS方法處理后獲得的結(jié)果比較分散,不同類樣本也有重疊,不存在明顯的類間距,很難完整的區(qū)分4種類型的食用油; 基于EEMD特征增強(qiáng)后經(jīng)過CWT-PLS方法處理的數(shù)據(jù)樣本各自聚集,每種食用油樣本都可以相互鑒別。
圖7 食用油增強(qiáng)拉曼譜圖
圖8 PCA結(jié)果對(duì)比
將集合經(jīng)驗(yàn)?zāi)B(tài)分解應(yīng)用于食用油樣本的拉曼光譜信號(hào)的特征提取,增強(qiáng)后并重構(gòu)拉曼光譜信號(hào),可得如下結(jié)論:
(1)集合經(jīng)驗(yàn)?zāi)B(tài)分解方法可自適應(yīng)的將食用油拉曼光譜信號(hào)分解成10階IMF,其IMF1和IMF2表征為信號(hào)中的噪聲部分; IMF3—IMF7表征為拉曼特征信號(hào)的部分; 最后一階IMF10表征為熒光背景部分。
(2)基于EEMD的拉曼特征增強(qiáng)方法具有自適應(yīng)的特點(diǎn),不需要預(yù)先設(shè)置其他參數(shù),通過應(yīng)用于食用油拉曼特征增強(qiáng),獲得了拉曼特征更強(qiáng)的信號(hào),可以清晰的鑒別4種類別的食用油,為拉曼光譜的數(shù)據(jù)處理提供了新的方式。