武 進(jìn)
(四川工商學(xué)院云計(jì)算與智能信息處理重點(diǎn)實(shí)驗(yàn)室,四川 成都 611745)
在客觀條件下采集的光譜數(shù)據(jù)會(huì)含有噪聲,因此需要在數(shù)據(jù)分析之前對(duì)數(shù)據(jù)采取濾波處理。而由于高光譜數(shù)據(jù)的特性,一般實(shí)用方法如小波變換等濾波法都存在著一定的不足之處。EMD 算法本質(zhì)上是以時(shí)間特征尺度為度量,以信號(hào)為極值的時(shí)空濾波器,能夠清晰地反映數(shù)據(jù)信號(hào)的波動(dòng)和趨勢(shì),所以在理論上可以將EMD 應(yīng)用于信號(hào)數(shù)據(jù)去噪[4,9]。
2003年,Huang 等人對(duì)白噪聲進(jìn)行EMD 分解試驗(yàn),研究了白噪聲的IMF 特性,認(rèn)為其能量密度和平均周期是一個(gè)常數(shù),該研究成果為以后人們將EMD 應(yīng)用于信號(hào)去噪領(lǐng)域打下了基礎(chǔ)。法國(guó)學(xué)者Flandrin 將EMD 看作是類似小波分解的二進(jìn)濾波器組,并建立了信號(hào)被白噪聲污染時(shí)的去噪方法。Rilling 將EMD 方法應(yīng)用于研究分形高斯噪聲的赫斯特指數(shù)與分解分量序數(shù)之間旳關(guān)系,認(rèn)為可以根據(jù)分解分量序數(shù)估計(jì)出分形高斯噪聲的赫斯特指數(shù)[2,8]。
經(jīng)EMD 分解后,原始信號(hào)的局部特征在各分量中都得到了反映,從相關(guān)文獻(xiàn)中可知信號(hào)噪聲主要處于高頻部分,而能量主要處于低頻,由此可以通過(guò)將高頻和低頻進(jìn)行分離從而達(dá)到對(duì)噪聲和能量進(jìn)行區(qū)分的目的。據(jù)此原理,考慮高光譜數(shù)據(jù)的光譜特征,本文運(yùn)用EMD 分解對(duì)高光譜數(shù)據(jù)進(jìn)行去噪處理。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)法是黃鍔(N.E.Huang)于1998年提出的一種新型自適應(yīng)信號(hào)時(shí)頻處理方法,特別適用于非線性非平穩(wěn)信號(hào)的分析處理。
EMD 方法與傅里葉變換、小波變換的核心思想一致:將信號(hào)分解為各個(gè)相互獨(dú)立的成分的疊加,不同點(diǎn)在于EMD 進(jìn)行信號(hào)分解是根據(jù)信號(hào)本身的時(shí)間尺度特征,具備自適應(yīng)性,而傅里葉變換和小波變換都需選擇合適的基函數(shù),因此EMD 分解適用范圍更廣。
EMD 分解是將信號(hào)分解為多個(gè)本征模函數(shù)(IMF)的疊加。IMF 必需要滿足下面兩點(diǎn):
(1)函數(shù)在整個(gè)時(shí)間范圍內(nèi),局部極值點(diǎn)和過(guò)零點(diǎn)的數(shù)目必須相等,或最多相差一個(gè);
(2)在任意時(shí)刻點(diǎn),局部最大值的包絡(luò)(上包絡(luò)線) 和局部最小值的包絡(luò)(下包絡(luò)線) 平均必須為零。
經(jīng)驗(yàn)?zāi)B(tài)分解過(guò)程實(shí)質(zhì)上是基于自適應(yīng)二進(jìn)濾波器組的一種濾波。因此具有基于其自適應(yīng)濾波的性質(zhì)創(chuàng)設(shè)新型的自適應(yīng)濾波器的可行性。在實(shí)際應(yīng)用中,可以依所選原始數(shù)據(jù)的性質(zhì),舍棄對(duì)應(yīng)的特征模態(tài)函數(shù),由剩余的進(jìn)行重構(gòu)[5,7]。
根據(jù)上述原理,如果簡(jiǎn)簡(jiǎn)單單的對(duì)原始數(shù)據(jù)進(jìn)行舍棄,很有可能濾除有用成分;再者,其施行EMD分解由于信號(hào)本身的特征差異,從而也導(dǎo)致所得的IMF 分量數(shù)量也不同;最后,因?yàn)樵肼曨愋偷牟煌?,所以其具體分布也不一致。綜上,采取EMD 分解原理進(jìn)行數(shù)據(jù)去噪處理由于結(jié)果的誤差較大因此在此原理的基礎(chǔ)上還需進(jìn)行改進(jìn)。
為了對(duì)上述原理進(jìn)行改進(jìn),即判斷選取的IMF個(gè)數(shù),文章采用了連續(xù)均方誤差的方法。該方法通過(guò)計(jì)算兩個(gè)相鄰特征模態(tài)函數(shù)間的均方誤差,從而達(dá)到判斷舍棄IMF 個(gè)數(shù)的目的[3,4],計(jì)算如式(1):
根據(jù)式(1),結(jié)合EMD 分解原理,可以計(jì)算出具有噪聲能量分布突變的第k 個(gè)IMF 分量,計(jì)算出k 值后,再舍棄前面高頻相應(yīng)的IMF 分量,重構(gòu)剩余的IMF,因此實(shí)現(xiàn)對(duì)數(shù)據(jù)的去噪處理。其中,
為了得到噪聲和主導(dǎo)信號(hào)的分界點(diǎn)k,即能量密度的全局極小值,定義全局極小值k 為:
根據(jù)式(3)確定出分界點(diǎn)k 后,由于在第k 個(gè)IMF 分量中有可能出現(xiàn)能量密度低于噪聲分量的情況。為了消除這種影響,在確定分界點(diǎn)K 時(shí),可以采取下列式子:
設(shè)原始信號(hào)為:
對(duì)上式信號(hào)添加高斯白噪聲,信噪比為25dB,如圖1:
經(jīng)EMD 分解,IMF 分量如圖2和圖3。
經(jīng)過(guò)連續(xù)均方誤差方法計(jì)算,計(jì)算結(jié)果如表1所示。表中為各IMF 分量的均方誤差,從高頻到低頻,第一個(gè)最小的均方誤差出現(xiàn)在第2 個(gè)IMF,根據(jù)原理將局部極小值后移一位,從而重構(gòu)第3 個(gè)至最后一個(gè)IMF 分量,如圖4所示(藍(lán)色是原始數(shù)據(jù),紅色是重構(gòu)數(shù)據(jù))。從圖中可以直觀地看出,重構(gòu)數(shù)據(jù)在一定程度上能夠重現(xiàn)原始數(shù)據(jù)的波動(dòng)走勢(shì)。據(jù)此,采用此方法在信號(hào)去噪種能夠達(dá)到較好的效果。
為了驗(yàn)證連續(xù)均方誤差方法的實(shí)用性,本文選取文獻(xiàn)1 中的巖心高光譜數(shù)據(jù),數(shù)據(jù)波譜范圍為350 納米-2500 納米,本小節(jié)各圖中縱坐標(biāo)為反射率(范圍0-1),橫坐標(biāo)為波長(zhǎng)(單位納米)。
圖1 原始信號(hào)以及加噪信號(hào)
圖2 原始信號(hào)EMD 分解圖
圖3 加噪信號(hào)EMD 分解圖
圖4 高信噪比下EMD 去噪效果圖
表1 各IMF 分量的連續(xù)均方誤差
圖5 本文去噪法信號(hào)重構(gòu)圖
圖6 db8 小波去噪信號(hào)重構(gòu)圖
圖7 db3 小波去噪信號(hào)重構(gòu)圖
需濾波信號(hào)為實(shí)測(cè)的方解石高光譜數(shù)據(jù),經(jīng)過(guò)連續(xù)均方誤差方法處理,確定分界點(diǎn)舍棄對(duì)應(yīng)的IMF 分量,重構(gòu)剩余IMF 得到去噪信號(hào),結(jié)果如圖5所示。同時(shí),利用小波方法將實(shí)測(cè)數(shù)據(jù)進(jìn)行去噪,選取其中效果較好的db8 小波(圖6)和db3 小波(圖7)。圖中藍(lán)色曲線為原始信號(hào),紅色曲線為重構(gòu)信號(hào)。
表2 不同方法去噪后信噪比
從表2的信噪比可以看出,在db3 小波去噪法下,去噪效果差,重構(gòu)信號(hào)中局部波形發(fā)生畸變,這是因?yàn)橛杏脭?shù)據(jù)中的突鋒和突變部分由于小波去噪不具有自適應(yīng)性,在濾波過(guò)程中被其當(dāng)成噪聲從而被平滑掉;db8 小波去噪效果優(yōu)于db3 小波,但是由于相同原因,即也不具有自適應(yīng)性,其去噪效果也較差。而本文采用的EMD 去噪方法根據(jù)信噪比,明顯要優(yōu)于小波去噪方法。從圖中可以直觀看出:本文采用的方法有效地去除了高光譜曲線由于各種原因污染的噪聲,在消除毛噪現(xiàn)象的同時(shí)又保持了光譜曲線的各種特征,如吸收峰位置和吸收面積等,所重構(gòu)的光譜曲線趨勢(shì)特征幾乎維持不變,準(zhǔn)確的確定出了曲線突變或緩變的位置,且不用去考慮小波閾值去噪中關(guān)于怎么選擇基函數(shù),參數(shù)的設(shè)置等問(wèn)題,可以看出,不管是去噪過(guò)程還是去噪結(jié)果,本文方法更佳。
本文探討了EMD 的濾波特性,在面對(duì)EMD 分解原理和小波去噪方法的局限時(shí),采用了根據(jù)連續(xù)均方誤差方法而確定分界點(diǎn)的EMD 重構(gòu)去噪方法。EMD 分解后,信號(hào)有用成分主要位于低頻IMF分量中,而噪聲成分主要混疊于高頻分量中,通過(guò)EMD 分解進(jìn)行去噪,關(guān)鍵在于確定出信號(hào)與噪聲的IMF 分量的最優(yōu)分界點(diǎn)。根據(jù)本文中的數(shù)據(jù)和分析可以得出:連續(xù)均方誤差方法無(wú)論是在去噪過(guò)程或去噪效果上,都比常用方法如小波去噪更佳。在去噪過(guò)程中,不用考慮基函數(shù)選取或參數(shù)設(shè)置的問(wèn)題;在去噪結(jié)果上,在消除噪聲尖峰和突變情況的同時(shí),光譜曲線的各種特征又能得到很好的還原。因此,應(yīng)用此方法可以更加方便地對(duì)各種信號(hào),特別是非平穩(wěn)或非線性的進(jìn)行處理。
雖然從某種意義上說(shuō),噪聲與有用信號(hào)分界點(diǎn)難以確定的問(wèn)題,在此方法中得到了較好的解決。但是如果將本文方法應(yīng)用在噪聲污染嚴(yán)重情況下,此時(shí)就會(huì)出現(xiàn)有用信號(hào)能量太低的問(wèn)題,這是由于原始信號(hào)噪聲污染嚴(yán)重所致,從而就會(huì)使噪聲在各IMF 上的分布規(guī)律基本一致,因此應(yīng)用此方法可能不能找出全局極小值;即使全局極小值存在,起主導(dǎo)作用的信號(hào)由于污染嚴(yán)重的噪聲干擾也不能確定一定是噪聲,從而使得舍棄對(duì)應(yīng)個(gè)數(shù)的高頻IMF 的同時(shí)也會(huì)導(dǎo)致有用信號(hào)的丟失。
四川工商學(xué)院學(xué)術(shù)新視野2019年1期