湯書路,趙春暉,崔 穎
(哈爾濱工程大學 信息與通信工程學院,哈爾濱 150001)
高光譜圖像包含二維空間信息和一維光譜信息,具有“圖譜合一”的特點[1]。高光譜圖像具有光譜分辨率高的特點,包含非常豐富的地物光譜信息[2],為地物分類、檢測、識別提供了很大的可能[3]。目前,在軍事、農林業(yè)、土地資源管理和海洋遙感等領域已得到廣泛的使用[4-6]。
對高光譜圖像中的目標進行檢測可以分為:有先驗信息的目標檢測和沒有先驗信息的異常目標檢測?!爱惓!敝改繕伺c背景的光譜信息存在很大的差異性[7],這種異常目標在高光譜圖像中存在的比例較小。通常在異常檢測的算法中需要找到異常目標與背景的差異,達到檢測出異常目標的目的。
在高光譜圖像異常檢測的算法中,Reed I S[8]提出的 RX 算法最為經典。由于異常目標和背景在高維特征空間的分布差異性,一種基于核方法的異常檢測算法應運而生了,如核 RX(KRX)[9]。Banerjee A等[10]提出了一種新的基于支持向量域描述的非線性檢測算法 (Support Vector Domain Description,SVDD)。近年,基于表示理論的異常算法逐漸被提出,這些算法摒棄了經典算法中對目標、背景和噪聲做出的假設,如基于協(xié)同表示的異常目標檢測算法(Collaborative-Representation-based Detecter,CRD)[11]。此外還有基于稀疏表示的異常目標檢測算法[12],該算法根據像元的稀疏表示其系數向量的非零系數位置來判別該像元是背景還是異常目標。上述方法均用到了地物的光譜信息,由于高光譜圖像蘊含著豐富的空間信息,利用空間信息有利于提升算法的精度和效果。如Du B等[13]提出的局部和異常檢測(Local Summation Anomaly Detection, LSAD)把測試點近鄰域局部窗的多層局部分布與空間和光譜譜特性相結合,提高了異常目標檢測的性能。為了進一步提高檢測精度,Su H等[14]使用主成分分析方法(Principal Component Analysis,PCA)在局部區(qū)域提取背景的主要像素信息作為CRD的樣本,同時去除背景中的異常像素信息。
通常用矩形窗口來提取背景像元,在選定的背景像元中仍有少量的相關像元及噪聲,對背景估計產生影響,降低異常檢測算法的檢測精度[15]。為了解決這個問題,提出了一種改進的基于密度峰值背景純化的高光譜圖像異常目標檢測算法。由于高光譜圖像的維度較高,會造成信息冗余[16]。提出用極限學習機對原始高光譜圖像進行降維,得到一個低維的特征空間;用基于密度峰值背景純化的算法去除噪聲和異常目標的干擾,得到純背景集;用 CRD 算法進行異常目標檢測,避免了對背景進行假設估計。
對高光譜圖像進行目標檢測時,直接對原始的高光譜數據進行處理,只用到了高光譜數據的光譜信息。高光譜圖像光譜維度高,容易造成信息冗余的問題,會對最終的異常檢測結果產生影響。利用極限學習機網絡將原始的高光譜數據映射到低維的非線性特征空間,避免了“同物異譜,同譜異物”對檢測結果的影響。進行異常目標檢測時,會受到噪聲和異常目標的干擾,影響最終的檢測效果。因此,本文提出利用基于密度峰值背景純化(Density Peak Background Purification,DPBP)的方法獲取純背景集并對其進行異常檢測(DPBP_AD)算法框圖見圖1。
新加坡南洋理工大學的黃廣斌教授提出的極限學習機(Extreme Learning Machine,ELM)是一種新型單隱層前饋神經網絡(Single-hidden Layer Feed forward neural Networks,SLFNs)學習算法[17]。SLFNs逼近擬合理論指出,對于輸入網絡中的N個樣本,確定了激活函數和隱藏層的節(jié)點數,對隱藏層權重和偏置隨機賦值,可無限地接近N個樣本。ELM是隨機確定隱藏層權重和偏置,找到最優(yōu)的隱藏層和輸出層間的參數,使輸出的誤差盡可能最小,與神經網絡的算法相比,ELM網絡不需要調節(jié)隱藏層參數。ELM的網絡結構見圖2。p,l和m分別為輸入層、隱藏層和輸出層的節(jié)點個數;a和b分別為輸入層與隱藏層間的連接權重和偏置,通過隨機初始化賦值;β為隱藏層與輸出層間的連接權值。
圖2 ELM的網絡結構
(1)
則ELM的輸出表示為
(2)
其中:g(·)為激勵函數,是任意有界的分段連續(xù)函數。
β*=H+T
(3)
其中:H+為矩陣H的Moore-Penrose 廣義逆。可以證明,求得的最小二乘解β*的范數最小且具有唯一性。
輸入待測試的高光譜影像XHSI,根據式(2),利用訓練樣本所求得的最優(yōu)輸出矩陣β*,計算XHSI在嵌入空間的特征映射:
YHSI(XHSI)=HHSIβ*
(4)
其中,HHSI與訓練樣本的H計算方法相同,通過隨機初始化賦值。
由于 ELM 網絡是一個有監(jiān)督的網絡,而異常檢測中沒有異常點的先驗信息,因此需要一個帶標簽參考數據來訓練網絡。參考數據需滿足以下2個要求:①參考數據必須是與待測圖像同源(同源指由同樣的傳感器接收到的高光譜圖像)的帶有標簽的數據集;②數據的維度相同。ELM網絡訓練好后,輸入待測圖像,得到測試數據的特征空間。
1.2.1 基于密度峰值快速搜索的聚類算法
傳統(tǒng)的聚類方法,如 Kmeans 聚類算法,優(yōu)點是計算效率高且收斂速度快,適用于實時的聚類背景[18]。缺點是結果差異性較大,算法的魯棒性較差[19]。其他的聚類算法,如啟發(fā)式聚類算法和全局智能優(yōu)化聚類方法等,這些算法的復雜度較高[20],不適用于較高次數重復聚類的高光譜異常探測。因此 Rodrigurez A等[21]提出了一種基于密度峰值快速搜索的聚類算法(Clustering by Fast Search and Find of Density Peaks,CFSDP),簡稱密度聚類算法(Density Cluster,DC)。該算法計算速度快,能夠對任意形狀的分布進行聚類,適合對于維度較高,成分復雜的高光譜圖像。
該算法假設:①聚類中心由局部密度較低的鄰域像元包圍;②聚類中心與局部密度較大的像元間的距離較大。通過計算最小鄰域距離來確定聚類中心,根據密度將剩余的點歸到相應的類別中。假設待聚類的高光譜數據為X=(x1,x2,…,xi,…,xn),n為數據的像元總數。局部密度可表示為
(5)
當δ值高時,ρ值相對高的點為聚類中心,ρ值低的點是異常點。確定了聚類中心后,剩余的像元將被歸為最近鄰密度最高的簇。與其他優(yōu)化目標函數的迭代算法不同,該算法的集群分配可以一步完成。
1.2.2 純背景集的獲取
1)計算中心像元與內外窗間所有像元的歐氏距離,構造距離向量,即
(6)
2)在雙窗內計算局部密度,即
(7)
(8)
其中:p為自由參數,表示選取像元的比例。
不同于經典的算法對異常目標、背景和噪聲的假設,CRD 算法是任意背景像元可以近似地由其鄰域像元線性表示,而異常像元則不能。因此待測像元的估計值為
(9)
(10)
式中:λ為拉格朗日乘子;Γy為 Tikhonov 正則化矩陣,即
(11)
異常檢測算子為
(12)
獲取純背景集后,改進的檢測算子為
(13)
如果δ大于閾值,則γ為異常目標;反之γ為背景像元。
實驗中所用的數據集均來自機場—海灘—城市(airport-beach-urban)數據集,分別在3個場景中選取一個數據集來驗證算法的有效性。其中 Dataset1 和 Dataset3 均是由機載可見、紅外成像光譜儀(AVIRIS)傳感器采集的數據集,Dataset2 是由德國的機載反射光學光譜成像儀(ROSIS-03)傳感器采集的數據集[22]。由于極限學習機是有監(jiān)督的網絡,需要帶有標簽的同源且光譜維度相同的數據集先對網絡進行訓練。因此,截取測試圖像的1/10作為訓練集。各個數據集的信息、偽彩圖和真值圖見表1和圖3。
表1 各個數據集的基本信息
圖3 3個數據集的偽彩圖和真值圖
實驗中以 ROC(Receiver Operating Characteristic)曲線、ROC 曲線下面積 AUC(Area Under Curve)的值和檢測時間作為評價指標[23],實驗使用的硬件環(huán)境是 Intel(R) Core(TM) i5-5200U 處理器,內存 8 GB,軟件環(huán)境為 Windows 8.1。
2.2.1 檢測結果
將提出的方法與5個經典算法(分別為 RX、KRX、CRD、KCRD、BACON 算法)進行比較。以 ROC 曲線、AUC 值和檢測時間作為不同算法的檢測性能評價指標,給出了各個算法對不同數據集的檢測結果,見表2。
由表2可見,提出的方法對2個傳感器獲取的3個不同的數據集均能在一定程度上提高檢測精度。對 AVIRIS 傳感器和 ROSIS-03 傳感器分別獲取的 Dataset1、Dataset2 和 Dataset3 數據集,提出的算法在一定程度上縮短了檢測時間,與對比算法中檢測精度最高的算法相比,檢測時間分別縮短了 74.4 s、27.77 s和33.19 s。其中,對 Dataset1 和 Dataset2 來說提出的算法的檢測時間最短,而對 Dataset3 數據集,提出的算法較 KCRD 算法用時較長,這可能是由于異常目標較大,導致 DPBP_AD 選取的內外窗口尺寸較大,影響了檢測時間??傊岢龅姆椒▽?個傳感器獲得的數據集都能提高檢測精度。在只要求檢測精度高時,可選用提出的算法。不同算法對3個數據集檢測結果的 ROC 曲線見圖4。由圖4可見,提出的算法在一定程度上提高了檢測精度。
表2 各個算法對不同數據集的檢測效果
圖4 3個數據集檢測的ROC曲線
不同算法對各個數據集的檢測效果圖見圖5~圖7,由圖5~圖7可見,提出的算法其檢測效果優(yōu)于其他幾種算法。DPBP_AD算法能有效地檢測出大多數異常目標,并能保持異常形狀。相反,RX、KRX 方法獲得的檢測圖中很難見到異常目標。RX 算法存在許多錯誤警報(圖5(c));與圖5(g) 相比可見局部密度信息能進一步純化背景光譜信息。
圖5 Dataset1的彩色合成圖和比較方法的檢測圖(第二列為通過人工標記獲得的參考檢測圖)
圖6 Dataset2的彩色合成圖和比較方法的檢測圖(第二列為通過人工標記獲得的參考檢測圖)
2.2.2 DPBP_AD算法的參數選擇
根據 AUC 值分析了不同參數的設置對算法性能的影響,在提出的方法中分別有4個參數:特征空間維數m;純背景集選取的比例p;內外窗口尺寸ωin和ωout。
特征空間維數的選取,影響背景和異常目標的可分性,也對異常檢測的結果產生影響。選取最優(yōu)特征空間維數能很大程度上去除冗余信息的同時最大限度地保留原始信息。3個數據集的最優(yōu)特征空間維數檢測結果由 AUC 值給出,見表3 。由表3可見,當最優(yōu)特征空間維數分別為 10、6 和 13 時,檢測精度最高,分別為 0.988 7、0.989 0 和 0.964 0。
表3 各個數據集的最優(yōu)特征空間維數
參數p的選擇是為了保證選取的背景集的純凈性。3個數據集的特征空間維數均為上述分析結果下最優(yōu)特征空間維數,改變參數p的值(從 0.1 到 1)分別對3組數據進行異常檢測,探測結果同樣由 AUC 值給出見表4。由表4可見,各個數據集中背景集選取的比例對檢測結果的影響。數據集 Dataset1、Dataset2 和 Dataset3 的純背景集選取的最佳比例均為 0.8,此時檢測性能最好,分別是 0.988 7、0.989 0 和 0.964 0。參數p的值越接近于 1 的原因在于異常目標的分布比較集中。
表4 各個數據集中純背景集選取的比例對檢測性能的影響
內窗口的大小是由中心像元的均勻區(qū)域的大小決定的,外窗口的大小由用于表示中心像元的信息量決定的。即窗口的大小是根據不同場景中的異常目標的大小而改變的。設置內窗口的大小,以滿足中心像元周圍的均勻區(qū)域可以適當去除的條件。當外窗口足夠大時,說明背景像元能更加精確地表示中心像元。因此,當外窗口較大時,算法將獲得較高的 AUC 值。各個數據集內外窗口尺寸的選取見表5。由表5可見,數據集 Dataset1 和 Dataset2 的最佳窗口尺寸均為ωin=3,ωout=5。而數據集 Dataset3 的最佳窗口尺寸為ωin=13,ωout=15。
表5 內外窗尺寸對不同數據集檢測結果
高光譜圖像異常目標檢測的效果會受到噪聲和異常目標的干擾、由光譜維度較高導致的信息冗余以及“同物異譜,同譜異物”的影響。提出了一種改進的基于密度峰值背景純化的高光譜圖像異常目標檢測算法。利用基于極限學習機的特征空間提取,獲得了低維的非線性特征空間,不僅避免了“同物異譜,同譜異物”的影響,更避免了由于光譜維度較高所帶來的信息冗余的影響,提高了檢測精度。并且極限學習機結構簡單,擁有快速的學習能力,縮短了檢測時間。密度峰值背景純化的方法避免了噪聲和異常目標對檢測結果的影響,同時也有效地挖掘了像元間的空間信息,提高了檢測精度。DPBP_AD算法不需要對背景進行假設估計,對不同的高光譜圖像都具有較好的檢測結果,同時也更適用于真實的高光譜數據。實驗表明,所提的 DPBP_AD算法相比于其他算法,提高了檢測精度。同時與 RX、CRD 和 BACON 算法相比,所用的檢測時間較短。