余岸竹,劉 冰,邢志鵬,楊 帆,楊其淼
1.信息工程大學(xué),河南 鄭州 450001;2.32023部隊,遼寧 大連 116000
近年來,隨著遙感平臺和傳感器的不斷進步,人們獲取高光譜遙感影像的能力不斷提高。但在完成數(shù)據(jù)獲取以后,數(shù)據(jù)的處理與分析將真正決定地物探測的水平。高光譜影像分類能夠為高光譜影像的進一步應(yīng)用提供基礎(chǔ),是高光譜遙感中的關(guān)鍵技術(shù)和研究熱點之一[1]。高光譜影像中可以獲取每個像素近似連續(xù)的光譜曲線,這些光譜曲線能夠較好地反映地物的屬性信息,這就為地物的精細分類提供了可能。但近似連續(xù)的光譜曲線導(dǎo)致了高光譜影像具有高維的數(shù)據(jù)特點,且在高光譜影像中獲取標記數(shù)據(jù)較為困難,可用于訓(xùn)練的標記樣本數(shù)量較少。高維的數(shù)據(jù)結(jié)構(gòu)和較少的訓(xùn)練樣本數(shù)量給高光譜影像分類帶來了極大的挑戰(zhàn)[2]。
早期的高光譜影像分類方法通過提取光譜特征,并結(jié)合支持向量機、決策樹、邏輯回歸等分類器進行分類[3]。但在高光譜影像中“同譜異物”和“同物異譜”的現(xiàn)象廣泛存在,這就導(dǎo)致僅僅利用光譜信息進行分類具有一定的局限性。高光譜影像具有“圖譜合一”的特點,在提供光譜特征的同時,也提供了豐富的空間信息。而大量的研究表明,在分類過程中引入空間信息能夠降低地物分類的不確定性,從而能夠提高高光譜影像分類的精度[4]。拓展形態(tài)學(xué)屬性剖面[5](extended morphological profile,EMP)通過形態(tài)學(xué)操作提取高光譜影像的空間結(jié)構(gòu)信息,并與光譜特征結(jié)合進行分類,有效地改善了高光譜影像的分類效果。除了EMP,還可以應(yīng)用濾波半徑依次增加的引導(dǎo)濾波器來獲得影像不同尺度的結(jié)構(gòu)信息,進而提高分類精度[6]。紋理特征也是一種能夠有效利用空間信息的方法,常用于高光譜影像分類的紋理特征有Gabor特征[7]、局部二值模式[8]紋理特征等。除了上述在特征提取過程中考慮空間鄰域信息,也可以利用聚類獲得的空間信息來提高高光譜影像的分類精度。文獻[9]利用聚類信息對支持向量機的分類結(jié)果進行后處理,進一步提高了高光譜影像的分類精度。文獻[10]在利用支持向量機對Gabor特征進行分類的基礎(chǔ)上,采用多數(shù)投票策略進一步融合超像素分割結(jié)果,在訓(xùn)練樣本數(shù)量較少的情況下取得了較為理想的分類精度。文獻[11]提出利用邊緣保持濾波對分類結(jié)果進行處理,既能濾除分類結(jié)果中孤立的分類噪聲,又能較好地保持分類結(jié)果的邊緣,因此能夠提高分類精度。
近年來,隨著計算能力和數(shù)據(jù)獲取能力的不斷提高,深度學(xué)習(xí)方法得到了快速發(fā)展,已經(jīng)被廣泛應(yīng)用于自然語言處理、圖像分類識別、高分辨率遙感影像處理、高光譜影像分類等領(lǐng)域。最早用于高光譜影像分類的深度學(xué)習(xí)模型是堆棧式自編碼器,該方法先利用主成分分析對高光譜影像進行降維處理,然后選取一定的鄰域范圍,并展成一維特征向量輸入到堆棧式自編碼器中進行分類[12]。隨后,利用光譜特征的一維卷積神經(jīng)網(wǎng)絡(luò)模型也被引入到了高光譜分類領(lǐng)域中[13]。為了進一步提高高光譜影像的分類精度,二維卷積神經(jīng)網(wǎng)絡(luò)被用于提取高光譜影像的空間特征,并將空間特征與光譜特征結(jié)合進行分類,取得了較為理想的分類結(jié)果[14-16]。此外,研究人員還利用三維卷積神經(jīng)網(wǎng)絡(luò)[17]和循環(huán)神經(jīng)網(wǎng)絡(luò)[18]提取高光譜影像的空-譜特征進行分類?;谏疃葘W(xué)習(xí)的高光譜影像分類方法能夠自動從數(shù)據(jù)中學(xué)習(xí)如何提取特征,簡化了高光譜影像分類的處理流程,但仍然面臨小樣本問題的挑戰(zhàn)。
視覺顯著性是人類視覺系統(tǒng)的重要機制,其能夠快速準確地提取場景中最感興趣的區(qū)域,并忽略冗余的信息[19]。視覺顯著性估計已經(jīng)被廣泛應(yīng)用于遙感圖像處理和分析中,例如文獻[20]聯(lián)合顯著性和多層卷積神經(jīng)網(wǎng)絡(luò)進行高分辨率遙感影像場景分類;文獻[21]對高光譜影像進行顯著性波段選擇,從而提高高光譜影像的分類精度。為充分利用空間信息提高高光譜影像分類精度,本文以顯著性濾波器為基礎(chǔ),提出了一種用于高光譜影像分類的顯著性特征提取方法,并進一步結(jié)合光譜特征進行分類。最后利用Pavia大學(xué)、Indian Pines和Salinas 3組高光譜數(shù)據(jù)集驗證了本文算法的有效性。
視覺顯著性估計中通常以彩色圖像為輸入[22],因此,本文以3個相鄰波段的高光譜影像為輸入,進行顯著性特征提取,然后沿光譜維度利用滑窗法獲取各個波段的顯著性特征,最后將各個波段的顯著性特征進行堆疊形成最終用于分類的顯著性特征。如圖1所示,3個相鄰波段的高光譜影像顯著性特征提取主要包括超像素分割、對比度計算和顯著性分配3個步驟。
基于像素的視覺顯著性估計方法對噪聲較為敏感,而超像素以相對簡單的方式表示圖像并能減少圖像的冗余,同時每個超像素塊具有相同的性質(zhì)[23]。為了更加有效地提取顯著性特征,首先將輸入的三波段高光譜影像根據(jù)顏色相似性分割為若干個超像素,每個超像素由區(qū)域內(nèi)的顏色均值表示,進而以超像素為基礎(chǔ)進行視覺顯著性估計。本文采用SLIC[24](simple linear iterative cluster)方法對輸入的三波段高光譜影像進行超像素分割。
(1)
式中,l、a、b為CIE LAB顏色空間對應(yīng)的3個通道變量;i和j為超像素的索引;Nc和Ns分別為最大的顏色距離和種子點之間最大的距離。
圖1 3個波段顯著性特征提取流程Fig.1 Salient feature extraction of three adjacent bands
SLIC算法能夠有效地將圖像分割為若干個超像素塊,每個超像素塊內(nèi)部像素屬性趨于一致,并由顏色均值表示。這樣可以在特征提取的過程中充分考慮像素周圍的局部空間信息,同時能夠降低噪聲對特征提取的影響。
視覺顯著性檢測中通常通過計算對比度來進行顯著性估計,為了更加充分地利用全局空間信息,以分割后的超像素為基礎(chǔ),定義顏色獨立性和空間顏色分布兩種對比度。顏色獨立性定義如下
(2)
進一步可將式(2)改寫為
(3)
空間顏色分布定義如下
(4)
式(4)可以改寫為
(5)
根據(jù)顏色獨立性和空間顏色分布計算每個超像素的顯著性為
Si=Uiexp(-kDi)
(6)
由式(6)可知空間顏色分布Di越大即顏色分布越廣,對應(yīng)顯著性值越??;顏色獨立性Ui越大,則對應(yīng)顯著性值越大。最終定義每個像素的顯著性如下
(7)
由于高光譜影像具有眾多波段,因此需要沿光譜方向依次獲取各個波段的顯著性特征。最后將各個波段獲得的顯著性特征圖進行堆疊,形成維度為B-2的顯著性特征向量,其中B為波段數(shù)。為進一步提高分類精度,將每個像素的顯著性特征向量和光譜特征向量進行連接形成最終用于分類的特征。
大量的研究已經(jīng)表明支持向量機是一種快速可靠的分類器,因此本文采用支持向量機作為最終的分類器。其中支持向量機的核函數(shù)采用高斯核函數(shù),核函數(shù)參數(shù)和懲罰系數(shù)在2-2,2-1,…,27范圍內(nèi)通過5折交叉驗證確定。
參照文獻[26],采用Pavia大學(xué)、Indian Pines和Salinas 3組高光譜數(shù)據(jù)集進行分類試驗來驗證顯著性特征提取方法的有效性。Pavia大學(xué)數(shù)據(jù)集由ROSIS傳感器獲得,Indian Pines和Salinas數(shù)據(jù)集由AVIRIS傳感器獲得。Pavia大學(xué)數(shù)據(jù)集的影像大小為610×340像素,空間分辨率為1.3 m,光譜覆蓋范圍為430~860 nm,有103個有效波段可用于分類試驗。Indian Pines數(shù)據(jù)集的影像大小為145×145像素,空間分辨率為20 m,光譜覆蓋范圍為400~2500 nm,有200個有效波段可用于分類。Salinas數(shù)據(jù)集的影像大小為512×217像素,空間分辨率為3.7 m,光譜覆蓋范圍為430~860 nm,有204個有效波段可用于分類。3組高光譜影像數(shù)據(jù)集的地物類別、選取的訓(xùn)練樣本數(shù)量和測試樣本數(shù)量分別如表1—表3所示。
表1 Pavia大學(xué)數(shù)據(jù)集樣本信息Tab.1 The information of samples on the University of Pavia dataset
表2 Indian Pines數(shù)據(jù)集樣本信息Tab.2 The information of samples on the Indian Pines dataset
表3 Salinas數(shù)據(jù)集樣本信息Tab.3 The information of samples on the Salinas dataset
本文提出的高光譜影像顯著性特征提取涉及的參數(shù)主要包括:顏色獨立性調(diào)節(jié)參數(shù)σp、空間顏色分布調(diào)節(jié)參數(shù)σc和分割超像素的個數(shù)K。本小節(jié)以Pavia大學(xué)數(shù)據(jù)集為例分析不同的參數(shù)設(shè)置對最終分類結(jié)果的影響。需要指出的是本小節(jié)的分類試驗沒有結(jié)合光譜特征,僅采用了顯著性特征。
圖2所示為在Pavia大學(xué)數(shù)據(jù)集中設(shè)置不同的K值對應(yīng)的總體分類精度和特征提取所需時間。由圖2可知,當K值較少時(例如100、200),分類精度較低;而當K值大于500時,均能夠取得較為理想的分類精度;但隨著K值的增大,特征提取所需時間也相應(yīng)增加,而分類精度提升卻不明顯。在實際應(yīng)用過程中應(yīng)該根據(jù)高光譜影像大小適當增大K。本文綜合考慮分類精度和計算效率統(tǒng)一設(shè)置K=500。
圖2 Pavia大學(xué)數(shù)據(jù)集不同的K值對應(yīng)的總體分類精度和計算時間Fig.2 Overall accuracy and computing time with different number of elements decomposed by SLIC on the University of Pavia dataset
為了分析σc和σp對最終分類精度的影響,分別設(shè)置σc和σp為0.25、1、5、10、20。圖3所示為在Pavia大學(xué)數(shù)據(jù)集中設(shè)置不同的σc和σp值對應(yīng)的總體分類精度。分析圖3可知,當σp值固定時,總體分類精度隨著σc的增加而增加,而當σc固定時,總體分類精度大體上隨著σp的減小而增加。這說明為了獲取更高的分類精度,應(yīng)該設(shè)置較大σc的值和較小σp的值。根據(jù)圖3,最終設(shè)置σc=20、σp=0.25。
通過以上分析,本文提出的高光譜影像顯著性特征提取方法對于分割超像素的個數(shù)K、顏色獨立性調(diào)節(jié)參數(shù)σp、空間顏色分布調(diào)節(jié)參數(shù)σc3個參數(shù)較為敏感。實際應(yīng)用中應(yīng)該根據(jù)高光譜影像的大小適當調(diào)節(jié)K值的大小,即影像越大,K的值也越大。需要指出的是,過小的K值會導(dǎo)致精度下降,根據(jù)本文結(jié)果建議設(shè)置K≥500較為合理。對于σc和σp,應(yīng)該設(shè)置較大的σc值和較小的σp值。根據(jù)本文試驗結(jié)果設(shè)置σc=20、σp=0.25較為合理。
圖3 Pavia大學(xué)數(shù)據(jù)集不同的σc和σp值對應(yīng)的總體分類精度Fig.3 Overall accuracy with different σc and σp on the University of Pavia dataset
表4給出了分別利用顏色獨立性和顏色空間分布特征以及綜合利用顏色獨立性和顏色空間分布特征進行分類的總體分類精度。由表4可知綜合利用兩種對比度有利于提高分類精度。
表4 Pavia大學(xué)數(shù)據(jù)集中采用不同的特征進行分類的總體分類精度Tab.4 Overall accuracy with different features on the University of Pavia dataset (%)
通常來說對高光譜影像進行特征提取前,可以進行波段隨機排序、PCA變換等預(yù)處理操作,以期進一步提高分類精度。表5給出了采用不同的波段數(shù)量進行超像素分割和采用不同預(yù)處理操作,進而提取顯著性特征對應(yīng)的總體分類精度。其中“PCA”表示對高光譜數(shù)據(jù)進行PCA變換后,再選取相鄰波段進行顯著性特征提??;“隨機排列”表示對高光譜影像不同波段進行隨機排列后再選取相鄰波段進行顯著性特征提取。
表5 Pavia大學(xué)數(shù)據(jù)集中采用不同的波段數(shù)進行特征提取的總體分類精度Tab.5 Overall accuracy of feature extraction using different band numbers in the University of Pavia dataset (%)
觀察表5可知采用單波段進行顯著性特征提取的分類精度略低于采用3個連續(xù)波段進行顯著性特征提取的分類精度。這是由于采用單波段進行顯著性特征提取僅僅考慮了空間鄰域信息,而采用3個連續(xù)的波段進行顯著性特征提取不僅在特征提取的過程中引入了鄰域空間信息,還能夠充分考慮相鄰波段的影響。進一步采用5個相鄰波段進行顯著性特征提取對于分類精度的提升效果不明顯,且會極大地增加特征提取的時間。此外,事先對高光譜數(shù)據(jù)進行PCA變換,使各波段相互獨立,再進行顯著性特征提取,會極大地降低分類精度。而波段隨機排列操作對于分類精度的提升并沒有幫助。為了簡化特征提取過程,本文不對高光譜影像進行隨機排序或PCA變換等預(yù)處理操作。且最終采用3個連續(xù)的波段進行顯著性特征提取,即沿著光譜方向采用大小為3、步長為1的滑窗法獲得所有波段的顯著性特征。
為了驗證顯著性特征(SF+SVM)的有效性,分別與SVM、EMPs[5]、Gabor[27]、2D-CNN[11]和3D-CNN[26,28]、Gabor+SVM+SLIC[10]算法進行對比分析,并進一步將顯著性特征和光譜特征結(jié)合輸入到SVM中進行分類(Spec-SF+SVM)。SVM采用光譜特征進行分類;EMPs取前3個主成分波段進行特征提取,每個波段分別利用4個開運算和4個閉運算構(gòu)建形態(tài)學(xué)屬性剖面特征,開閉運算的半徑分別為3、5、7、9;Gabor濾波器的帶寬設(shè)置為1,波長設(shè)置為1.4,方向角分別取0°、30°、60°、90°,偏移相位為0,濾波窗口大小為11×11;2D-CNN采用3個卷積層和3個池化層,3個卷積層的卷積核大小分別為5×5、6×6、4×4;3D-CNN采用7個三維卷積層、2個三維池化層和1個全連接層,且引入了兩個殘差模塊,三維卷積層的卷積核大小設(shè)置為3×3×3;Gabor+SVM+SLIC中的SLIC分割數(shù)設(shè)置為500。SVM、EMPs、Gabor、Gabor+SVM+SLIC、SF+SVM和Spec-SF+SVM均采用支持向量機作為分類器,支持向量機核函數(shù)采用高斯核函數(shù),核函數(shù)參數(shù)和懲罰系數(shù)通過5折交叉驗證確定;2D-CNN和3D-CNN均從訓(xùn)練樣本中隨機選取10%的樣本作為確認樣本,并選擇在確認樣本上分類精度最高的模型進行測試。
表6—表8給出了不同算法在3組高光譜數(shù)據(jù)集上的分類結(jié)果。觀察分類結(jié)果可知,采用空間特征進行分類的EMPs、Gabor、2D-CNN、3D-CNN和SF+SVM的總體分類精度、平均分類精度、Kappa系數(shù)均優(yōu)于僅利用光譜特征進行分類的SVM,這說明在分類過程中引入空間信息有助于提高高光譜影像分類精度;2D-CNN和3D-CNN由于訓(xùn)練樣本數(shù)量較少,其分類精度較EMPs和Gabor并無明顯優(yōu)勢;Gabor+SVM+SLIC除了使用SVM對Gabor特征進行分類,還利用SLIC超像素分割結(jié)果采用多數(shù)投票的策略對分類結(jié)果進行修正,因此能夠獲得較其他對比方法更高的分類精度。SF+SVM在Pavia大學(xué)數(shù)據(jù)集上的分類精度高于SVM、EMPs、Gabor和2D-CNN,略低于3D-CNN和Gabor+SVM+SLIC,且在Indian Pines和Salinas數(shù)據(jù)上均能獲得較其他方法更高的分類精度。這說明了本文所提出的顯著性特征是一種有效的特征提取方法,能夠提高高光譜影像的分類精度,且將顯著性特征與光譜特征結(jié)合(Spec-SF+SVM)能夠進一步提高高光譜影像的分類精度。
表6 不同算法在Pavia大學(xué)數(shù)據(jù)集的分類結(jié)果Tab.6 The classification results with different methods on the University of Pavia dataset (%)
表7 不同算法在Indian Pines數(shù)據(jù)集的分類結(jié)果Tab.7 The classification results with different methods on the Indian Pines dataset (%)
表8 不同算法在Salinas數(shù)據(jù)集的分類結(jié)果Tab.8 The classification results with different methods on the Salinas dataset (%)
為了更好地觀察分類結(jié)果,圖4—圖6給出了3組高光譜影像數(shù)據(jù)采用不同的算法獲得的分類圖。觀察圖4—圖6可知,SF+SVM和Spec-SF+SVM獲得的分類圖噪聲明顯少于其他對比算法,具有更好的視覺效果。這也進一步說明了本文算法的有效性。
圖4 各算法在Pavia大學(xué)數(shù)據(jù)集上的分類結(jié)果及其對應(yīng)的總體分類精度Fig.4 Classification maps and overall accuracy with different methods on the University of Pavia dataset
圖5 各算法在Indian Pines數(shù)據(jù)集上的分類結(jié)果及其對應(yīng)的總體分類精度Fig.5 Classification maps and overall accuracy with different methods on the Indian Pines dataset
圖6 各算法在Salinas數(shù)據(jù)集上的分類結(jié)果圖及其對應(yīng)的總體分類精度Fig.6 Classification maps and overall accuracy with different methods on the Salinas dataset
高光譜影像中可用于分類的標記樣本數(shù)量通常較少,因此小樣本問題是高光譜影像分類面臨的主要挑戰(zhàn)之一。本小節(jié)進一步減少訓(xùn)練樣本數(shù)量進行試驗分析,以驗證所提出算法在小樣本情況下的有效性。如圖7所示為3組高光譜數(shù)據(jù)集中選取不同數(shù)量的訓(xùn)練樣本對應(yīng)的分類結(jié)果。觀察圖7可知,不同算法的分類精度均隨著訓(xùn)練樣本數(shù)量的減少而降低,但SF+SVM和Spec-SF+SVM均能取得較SVM、EMPs、Gabor、2D-CNN和3D-CNN更高的分類精度,尤其是當每類地物選取20個訓(xùn)練樣本時,SF+SVM和Spec-SF+SVM的分類精度依然高于其他對比算法,這證明了所提出方法在小樣本情況下的有效性。
圖7 不同訓(xùn)練樣本數(shù)目對應(yīng)的總體分類精度Fig.7 Overall accuracy with different number of training samples
本文提出了一種高光譜影像顯著性特征提取方法,能夠充分地利用局部和全局的空間信息來提高高光譜影像分類的精度。采用Pavia大學(xué)、Indian Pines和Salinas 3組高光譜影像數(shù)據(jù)集進行試驗驗證。試驗結(jié)果表明:①與EMPs、Gabor、2D-CNN、3D-CNN等空間特征提取方法相比,采用顯著性特征進行分類能夠獲取更高的分類精度,且將顯著性特征與光譜特征結(jié)合能夠進一步提高分類精度;②本文提出的顯著性特征提取方法對小樣本有較好的適應(yīng)性,在訓(xùn)練樣本較少的情況下,采用顯著性特征進行分類仍然能夠取得較為理想的分類結(jié)果。