趙瑩瑩,潘兆杰,付航,張愛竹,姚延娟,孫根云
(1.長(zhǎng)沙市規(guī)劃勘測(cè)設(shè)計(jì)研究院,長(zhǎng)沙 410007;(2.海洋國(guó)家實(shí)驗(yàn)室 海洋礦產(chǎn)資源評(píng)價(jià)與探測(cè)技術(shù)功能實(shí)驗(yàn)室,山東 青島 266071;(3.中國(guó)石油大學(xué)(華東)海洋與空間信息學(xué)院,山東 青島 266580;(4.生態(tài)環(huán)境部衛(wèi)星環(huán)境應(yīng)用中心 國(guó)家環(huán)境保護(hù)衛(wèi)星遙感重點(diǎn)實(shí)驗(yàn)室,北京 100094)
高光譜圖像(hyperspectral image,HSI)包含數(shù)百個(gè)甚至上千個(gè)連續(xù)的光譜波段,可以有效地識(shí)別不同材料的細(xì)微變化。高光譜影像被廣泛應(yīng)用于目標(biāo)識(shí)別[1]、環(huán)境管理[2]和礦產(chǎn)測(cè)繪[3]等領(lǐng)域,其中,地物分類是當(dāng)前的一個(gè)研究熱點(diǎn)[4]。然而,HSI分類還存在較多的問題,如“同物異譜、同譜異物”現(xiàn)象,巨大的維度造成分類中的“Hughes現(xiàn)象”,這給影像的解譯帶來了挑戰(zhàn)。因此,對(duì)HSI數(shù)據(jù)進(jìn)行有效的特征提取是必要的[5]。
特征提取可以將高維數(shù)據(jù)投影到低維空間,保留原始數(shù)據(jù)基本結(jié)構(gòu)信息的同時(shí)降低數(shù)據(jù)的維數(shù)。近些年來,研究人員提出了一系列特征提取方法,如廣泛應(yīng)用的主成分分析(principal component analysis,PCA)[6]和線性判別分析(linear discriminant analysis,LDA)[7],一些基于流形學(xué)習(xí)的方法被提出,如局部保持投影(locality preserving projection,LPP)[8]、局部線性嵌入(locally linear embedding,LLE)[9]等,這些方法可以更好地挖掘高維數(shù)據(jù)中潛在的低維流形結(jié)構(gòu)??紤]到上述方法均為無監(jiān)督方法,分類性能有限,研究人員進(jìn)一步提出監(jiān)督的特征提取方法,如局部Fisher判別分析(local Fisher discriminant analysis,LFDA)[10],其主要思路是最大化類間分離的同時(shí)保留類內(nèi)精細(xì)復(fù)雜的局部結(jié)構(gòu),有效提高了分類精度。
然而,上述特征提取方法主要作用于光譜域,仍然受到“同物異譜、同譜異物”的影響。高光譜影像包含的地物空間特征對(duì)點(diǎn)狀誤分類的現(xiàn)象具有潛在的幫助。為此,研究人員提出了一系列聯(lián)合光譜-空間的分類方法,這些方法可大致分為兩類:基于機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法[11]。基于機(jī)器學(xué)習(xí)的方法主要包括特征提取和分類器兩個(gè)階段,特征提取是通過一種或融合幾種不同的處理技術(shù)來共同挖掘影像的光譜-空間特征,并利用高效的分類器獲得分類結(jié)果?;谏疃葘W(xué)習(xí)的方法主要利用多個(gè)非線性網(wǎng)絡(luò),分層提取HSI的抽象特征和鑒別特征,近些年來逐漸成為研究的主流[12-16]。然而,深度學(xué)習(xí)方法存在樣本需求量大、計(jì)算耗時(shí)昂貴、難以解釋模型內(nèi)的動(dòng)態(tài)變化等[17]問題。機(jī)器學(xué)習(xí)方法側(cè)重于特征提取方式和分類器的選取,通常結(jié)構(gòu)比較簡(jiǎn)單、參數(shù)少,仍然是提高分類精度的重要突破。因此,本文主要關(guān)注基于機(jī)器學(xué)習(xí)的方法。
在基于機(jī)器學(xué)習(xí)的分類方法方面,研究人員提出了一系列高效的光譜-空間特征提取算法。如Zabalza等[18]將二維奇異譜分析(two-dimensional singular spectrum analysis,2DSSA)用于高光譜逐波段的特征提取,該方法通過分離不同的空間信息成分,來獲取單波段的主要空間上下文特征。Kang等[19]提出一種結(jié)合平均降維和本征圖像分解的特征提取方式,可以有效去除影像中的無用信息,如陰影和圖像噪聲,提高了影像的分類精度。Li等[20]結(jié)合分段主成分分析(segmented PCA)和高斯金字塔,提出了一種高效的多尺度空間融合分類框架,取得了優(yōu)異的分類效果。
然而,這些光譜-空間特征提取方法大多數(shù)作用于規(guī)則形狀或固定大小的空間區(qū)域,忽略了影像地物形狀和尺度的復(fù)雜性,即用于空間特征提取的區(qū)域與圖像的空間結(jié)構(gòu)不匹配[21]。圖像超像素分割能夠獲取不同大小和形狀的圖像局部均質(zhì)區(qū)域,在一定程度上可以解決上述問題[22]。
為了充分挖掘高光譜影像豐富的地物尺度特征,本文提出了一種結(jié)合超像素和2DSSA的空間特征提取方法即超像素2DSSA(S2DSSA),將2DSSA的作用域從整幅圖像變換到超像素區(qū)域,可以自適應(yīng)地挖掘不同形狀地物的空間上下文特征,能夠提高類內(nèi)光譜的一致性并增強(qiáng)類間差異。為了進(jìn)一步挖掘影像的光譜非線性結(jié)構(gòu),本文將提出的S2DSSA與LFDA相結(jié)合,在空間特征的基礎(chǔ)上提取光譜流形特征,進(jìn)一步提升類間相似性,提高地物的區(qū)分性。選取支持向量機(jī)(support vector machine,SVM)對(duì)得到的光譜-空間特征進(jìn)行分類,將本文的處理流程記為S2DSSA-LFDA-SVM方法。
本文提出的S2DSSA-LFDA-SVM方法主要包含4個(gè)步驟:1)對(duì)原始的HSI進(jìn)行PCA分解,在得到的第一主成分圖上進(jìn)行熵率分割(ERS)[23],得到分割圖;2)分割圖引導(dǎo)2DSSA對(duì)每個(gè)波段的超像素區(qū)域進(jìn)行特征提取,得到空間特征;3)LFDA作用于空間特征的光譜域,得到降維后的光譜-空間特征;4)SVM對(duì)光譜-空間特征進(jìn)行分類。具體過程如圖1所示。
圖1 提出的S2DSSA-LFDA-SVM方法的框架流程
熵率分割(entropy rate segmentation,ERS)是一種基于圖論的分割方法,在圖像處理中得到廣泛應(yīng)用[24]。具體來講,ERS首先將PCA第一主成分圖像映射為一個(gè)圖G=(V,E),其中V是圖的頂點(diǎn),E是圖的邊緣集合。在某一超像素?cái)?shù)量下,選擇子邊緣集A使得圖G恰好包含S個(gè)離散的子圖,其中每個(gè)子圖代表一個(gè)超像素。然后,使用構(gòu)造的熵率項(xiàng)函數(shù)H(·)和平衡項(xiàng)函數(shù)B(·)得到目標(biāo)函數(shù),通過最優(yōu)化目標(biāo)函數(shù)來獲得S個(gè)超像素,目標(biāo)函數(shù)如式(1)所示。
(1)
式中:λ≥0是平衡項(xiàng)函數(shù)的權(quán)重調(diào)節(jié)參數(shù)。上式的優(yōu)化問題一般通過貪心算法求解[25]。最后,通過基于稀疏表示的距離度量為每個(gè)超像素指定一個(gè)公共標(biāo)簽。
S2DSSA作用于單個(gè)波段的每個(gè)超像素區(qū)域。對(duì)于某一超像素區(qū)域,首先為其構(gòu)建一個(gè)規(guī)則的作用區(qū),即根據(jù)超像素的行數(shù)和列數(shù),結(jié)合鄰域像素來補(bǔ)充超像素區(qū)域,如圖2所示。
圖2 S2DSSA的處理方式
然后,對(duì)于每個(gè)規(guī)則的超像素區(qū)域,使用2DSSA對(duì)其進(jìn)行特征提取,它旨在提取最大特征值分量所反映的空間信息。對(duì)于尺寸為Nx×Ny的規(guī)則超像素區(qū)域,定義一個(gè)大小為L(zhǎng)=l×l(l∈min[Nx/2,Ny/2])的二維嵌入窗口。該窗口從圖像的左上角滑動(dòng)到右下角,不同位置處窗口內(nèi)所有像素按列拉伸為向量Vi,j∈L×1,將其作為軌跡矩陣P的列向量,可得式(2)。
P=(V1,1,V1,2,…,V1,Ny-Ly+1,V2,1,…,VNx-lx+1,Ny-ly+1)∈RL×(Nx-lx+1)(Ny-ly+1)
(2)
計(jì)算協(xié)方差矩陣PPT的特征值和相應(yīng)的特征向量,軌跡矩陣可以寫成式(3)。
(3)
式中:Ui和Vi分別為軌跡矩陣的左奇異向量和右奇異向量。選擇P1成分作為P的近似值,通過兩步對(duì)角平均處理操作,可將矩陣P1再次轉(zhuǎn)換為Nx×Ny大小的規(guī)則區(qū)域。
經(jīng)過每個(gè)超像素區(qū)域的2DSSA特征提取后,將原始超像素位置處的像素提取出來,作為特征提取后的超像素,如圖2所示。相比于原始超像素,該特征超像素有較好的區(qū)域均勻性,并且消除了噪聲的影像。
局部Fisher 判別分析(LFDA)用于空間特征的光譜流形結(jié)構(gòu)降維,其基本思想是最大化類間分離的同時(shí)保留類內(nèi)精細(xì)復(fù)雜的局部結(jié)構(gòu)。假設(shè)xi∈B×1表示輸入空間特征的單個(gè)光譜向量,B為高光譜數(shù)據(jù)的維度,首先計(jì)算樣本xi和xj的相似度矩陣,如式(4)所示。
(4)
(5)
(6)
式中:Wlb和Wlw為用來保留數(shù)據(jù)局部信息的加權(quán)矩陣。它們的第(i,j)個(gè)元素可表示為式(7)、式(8)。
(7)
(8)
最后,通過計(jì)算局部Fisher 比率的最優(yōu)值得到投影變換矩陣WLFDA,可表示為式(9)。
(9)
特征提取后,使用SVM分類器進(jìn)行基于像素的HSI分類,主要是因?yàn)镾VM對(duì)數(shù)據(jù)的維數(shù)問題有較高的魯棒性,核函數(shù)選取RBF核函數(shù)。
實(shí)驗(yàn)主要使用了兩個(gè)包含地面真值圖的經(jīng)典數(shù)據(jù)集,Indian pines和Pavia centre數(shù)據(jù),其詳細(xì)信息如下。
Indian pines數(shù)據(jù):由機(jī)載可見光/紅外成像光譜儀(AVIRIS)獲取的高光譜影像,空間分辨率為20 m,光譜范圍為400~2 500 nm,包含145像素×145像素的圖像尺寸和200個(gè)波段。
Pavia centre數(shù)據(jù):由反射光學(xué)系統(tǒng)成像光譜儀(ROSIS-03)傳感器獲取的數(shù)據(jù)集,光譜覆蓋范圍從0.43~0.86 μm。該數(shù)據(jù)集包含103個(gè)波段,空間分辨率為1.3 m,使用了510像素×490像素大小的子場(chǎng)景,共有9個(gè)土地覆蓋類。
SVM分類器算法在LIBSVM library庫[26]中通過使用高斯RBF核函數(shù)來實(shí)現(xiàn),10倍交叉驗(yàn)證方法獲取最優(yōu)核函數(shù)參數(shù)。在分類過程中,采用分層的隨機(jī)取樣方式獲取訓(xùn)練和測(cè)試樣本,并且每類的采樣比率或數(shù)量相同。另外,為了定量地評(píng)價(jià)分類的結(jié)果,選取5個(gè)客觀質(zhì)量指標(biāo):總體精度(OA)、平均精度(AA)、每類地物的精度、Kappa系數(shù),以及運(yùn)行時(shí)間。
本節(jié)對(duì)所提出算法的參數(shù)進(jìn)行分析,主要包括3個(gè)參數(shù):S2DSSA的超像素?cái)?shù)量S、窗口大小L,以及LFDA的降維成分?jǐn)?shù)。
在空間域,S2DSSA的超像素?cái)?shù)量以及窗口大小的組合至關(guān)重要。為此,設(shè)計(jì)實(shí)驗(yàn)來評(píng)估超像素?cái)?shù)量和窗口大小的組合效果,其中超像素?cái)?shù)量S的選取范圍為{10,25,50,100,150,200},窗口大小L范圍為{3×3,5×5,7×7,9×9},不同組合的分類精度如圖3所示。根據(jù)圖3可以看出,兩個(gè)數(shù)據(jù)集由于地物覆蓋的大小形狀不同,最優(yōu)參數(shù)組合也存在差異。對(duì)于較小超像素區(qū)域,較小的S2DSSA窗口能夠很好地平滑超像素內(nèi)部,提高區(qū)域一致性;而較大的窗口會(huì)因無法處理,只保留原始的區(qū)域特征,精度下降。在參數(shù)S和L分別為50和7的情況下,兩個(gè)數(shù)據(jù)集都能取得不錯(cuò)的分類精度。
圖3 S2DSSA的參數(shù)(窗口大小及超像素?cái)?shù)量)敏感性分析
在光譜域,LFDA的降維成分?jǐn)?shù)能夠衡量光譜特征的利用程度。評(píng)估實(shí)驗(yàn)的結(jié)果如圖4所示。根據(jù)結(jié)果可知,隨著維度的增加,兩個(gè)數(shù)據(jù)集的精度均有上升趨勢(shì),在維度為15時(shí)取得最高精度;隨著降維成分的繼續(xù)增加,精度呈下降趨勢(shì)。為了保證所提出方法在不同數(shù)據(jù)集上的適用性,將上述3個(gè)參數(shù)分別固定為50、7和15,即針對(duì)一副給定的高光譜影像,提出方法的參數(shù)是可遷移的。
圖4 LFDA的降維數(shù)量分析
為了驗(yàn)證所提出算法的有效性,本節(jié)選取了幾種先進(jìn)的分類方法進(jìn)行了精度對(duì)比。原始像素級(jí)SVM分類作為基準(zhǔn),記為SP-SVM。LFDA-SVM和2DSSA-SVM分別作為光譜、空間特征提取方法。光譜-空間分類算法上,選擇了本征圖像分解(IID)的融合、高斯金字塔的多尺度融合(SPCA-GPs),二者分別使用相應(yīng)文獻(xiàn)中的默認(rèn)參數(shù)。此外,2DSSA-LFDA-SVM、S2DSSA-SVM也分別作為特征提取方法與S2DSSA-LFDA-SVM進(jìn)行對(duì)比,從而驗(yàn)證S2DSSA的有效性。
首先,比較所有方法在不同比例訓(xùn)練樣本數(shù)量下的分類結(jié)果。如圖5所示,隨著訓(xùn)練樣本數(shù)量的增加,所有算法的分類精度都逐漸提高。此外,在所有的訓(xùn)練樣本數(shù)量下,提出的S2DSSA-LFDA-SVM方法都取得了最高的分類精度,這證明了所提出算法的有效性。
圖5 不同訓(xùn)練樣本數(shù)量下的精度對(duì)比
為了進(jìn)一步定量化評(píng)估S2DSSA-LFDA-SVM的有效性,對(duì)比了所有算法的每類詳細(xì)精度以及運(yùn)行效率,如表1~表4所示,相應(yīng)的分類結(jié)果如圖6、圖7所示。
表1 Indian pines數(shù)據(jù)集的分類精度對(duì)比1(2%訓(xùn)練樣本) %
續(xù)表
表2 Indian pines數(shù)據(jù)集的分類精度對(duì)比2(2%訓(xùn)練樣本)
1)Indian pines數(shù)據(jù)。如表1、表2所示,在 OA、AA和Kappa 3個(gè)總體指標(biāo)上,S2DSSA-LFDA-SVM都取得了最高的精度,并且在絕大多數(shù)的地物類別上都有不錯(cuò)的分類效果,其中玉米、燕麥和石鐵堡3種地物的分類準(zhǔn)確率達(dá)到100%。相比于基準(zhǔn)方法SP-SVM,S2DSSA-LFDA-SVM的OA從64.86%提升到96.34%,比LFDA-SVM和2DSSA-SVM的OA分別高約27.83%和13.3%。S2DSSA相比于2DSSA,很好地考慮了地物的不同空間尺度特征,因而取得了優(yōu)于后者的分類精度,OA提升了3.95%。與其他幾種光譜-空間分類算法IID-SVM、SPCA-GPs-SVM和2DSSA-LFDA-SVM相比,S2DSSA-LFDA-SVM仍然有4%~6%等不同程度的提升,主要是因?yàn)楹笳咛崛×擞行У目臻g尺度特征和光譜流形結(jié)構(gòu),增強(qiáng)了地物的可區(qū)分性。
表3 Pavia centre數(shù)據(jù)集的分類精度對(duì)比1(0.3%訓(xùn)練樣本) %
表4 Pavia centre數(shù)據(jù)集的分類精度對(duì)比2(0.3%訓(xùn)練樣本)
根據(jù)圖6所示,S2DSSA-LFDA-SVM的分類圖也優(yōu)于其他的對(duì)比算法。2DSSA-SVM利用空間信息減少了前者的點(diǎn)狀誤分類噪聲,但存在一些小塊或條狀誤分類,改進(jìn)的S2DSSA-SVM利用了超像素的自適應(yīng)能力,消除了條狀分類噪聲的現(xiàn)象。與其他3種光譜-空間方法相比,S2DSSA-LFDA-SVM在地物內(nèi)部和邊緣處均有較好的分類結(jié)果,這也體現(xiàn)了所提取的地物鑒別特征的有效性。
處理效率上,提出的S2DSSA比傳統(tǒng)的2DSSA花費(fèi)了更多的時(shí)間,主要原因在于2DSSA作用于每個(gè)波段的每個(gè)超像素區(qū)域,增加了運(yùn)算量。此外,相比于其他光譜-空間方法,所提出的S2DSSA-LFDA-SVM的計(jì)算效率較低,低于SPCA-GPs-SVM和2DSSA-LFDA-SVM,僅優(yōu)于IID-SVM,主要原因是IID通過優(yōu)化能量函數(shù),經(jīng)多次迭代后才能獲取影像的反射率成分,會(huì)花費(fèi)較高的時(shí)間。此外,IID逐波段進(jìn)行全圖迭代,計(jì)算時(shí)間會(huì)隨著影像尺寸的增大而增加。
圖6 Indian pines數(shù)據(jù)分類圖
圖7 Pavia centre數(shù)據(jù)分類圖
2)Pavia centre數(shù)據(jù)。該數(shù)據(jù)集存在一些較小且不規(guī)則的地物類別,如樹木、沼澤、道路等,給分類帶來了一些困難。根據(jù)表3、表4的定量結(jié)果,提出的S2DSSA-LFDA-SVM依然延續(xù)了它的有效性,在OA、AA、Kappa和大部分的地類中均取得了最高的分類精度,包括瀝青和草地兩種地物分類準(zhǔn)確率達(dá)到100%。S2DSSA-LFDA-SVM的OA比基準(zhǔn)方法SP-SVM的OA提升12.98%,比傳統(tǒng)的LFDA-SVM和2DSSA-SVM分別提升12.08%和8.75%。S2DSSA-SVM仍然優(yōu)于2DSSA-SVM方法,這也證明了前者的魯棒性。S2DSSA-LFDA-SVM仍然優(yōu)于其他的光譜-空間分類方法,在OA上比IID-SVM、SPCA-GPs-SVM和2DSSA-LFDA-SVM分別提升4.43%,2.4%和2.78%。根據(jù)圖7的分類圖,S2DSSA-LFDA-SVM能夠有效消除大面積地物內(nèi)部的分類噪聲,并且保留了不規(guī)則較小地物的形狀和邊緣,因而獲得了與地面真值圖最接近的分類結(jié)果圖。此外,由于該影像數(shù)據(jù)尺寸較大,所提出的S2DSSA-LFDA-SVM方法效率較低,主要因?yàn)樵赟=50的情況下,每個(gè)超像素區(qū)域相對(duì)較大,S2DSSA對(duì)于每個(gè)超像素的處理時(shí)間增加。
本文提出的S2DSSA-LFDA-SVM結(jié)合了改進(jìn)的S2DSSA和LFDA,能夠有效地提取影像的光譜-空間特征,并且可以消除影像內(nèi)部的諸多噪聲。
S2DSSA充分考慮了影像地物的形狀多樣性,在每個(gè)超像素內(nèi)部進(jìn)行2DSSA空間特征提取,可以進(jìn)一步提升地物內(nèi)部像素的差異,提高一致性,不同地物的邊緣處也得到增強(qiáng),對(duì)于地物的區(qū)分有重要作用。LFDA作為一種流形學(xué)習(xí)方法,可以充分挖掘光譜維度的非線性結(jié)構(gòu),但是其單獨(dú)作用效果受光譜異質(zhì)性的限制。將其作用于勻質(zhì)的S2DSSA空間特征,可以充分發(fā)揮LFDA的效果。
該方法仍然會(huì)存在一些不足。首先,超像素的分割無法完全適用于地物的形狀結(jié)構(gòu),最優(yōu)超像素個(gè)數(shù)因不同的影像而存在差異。此外,2DSSA使用了固定的窗口,這對(duì)于不同超像素區(qū)域的特征提取可能是不合適的。因而,未來我們將進(jìn)一步開發(fā)自適應(yīng)的S2DSSA來提取空間特征。
本文提出了一種結(jié)合改進(jìn)的S2DSSA和LFDA的光譜-空間分類方法,用來表征高光譜影像的內(nèi)在結(jié)構(gòu)特征。二者的有效融合,可以有效地提取高光譜影像的空間和光譜特征,大幅提升后續(xù)的分類性能。相關(guān)結(jié)論主要如下。
1)本文提出的S2DSSA空間特征提取方法結(jié)合了超像素和2DSSA的優(yōu)勢(shì),可以自適應(yīng)地提取復(fù)雜多樣的地物空間特征。實(shí)驗(yàn)結(jié)果證明,S2DSSA取得了比2DSSA更高的分類精度。
2)S2DSSA用于空間特征提取,LFDA用于挖掘光譜流形結(jié)構(gòu),二者的結(jié)合可以消除高光譜分類中“同物異譜、同譜異物”和“Hughes現(xiàn)象”,并且克服了單一方法在特征提取方面的有限性,提升了特征提取效果。
3)在兩個(gè)經(jīng)典高光譜數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文方法提取的特征要遠(yuǎn)優(yōu)于原始的高光譜數(shù)據(jù),并且要好于其他先進(jìn)的光譜-空間提取技術(shù)。此外,本文算法的參數(shù)較少,并且可以使用一套相同的參數(shù)處理不同的數(shù)據(jù)集,這使得該方法在實(shí)際的高光譜影像處理中有較大的應(yīng)用潛力。
4)通過機(jī)器學(xué)習(xí)的方法可以提取高光譜數(shù)據(jù)的諸多特征,但是這些特征主要是淺層特征,蘊(yùn)含的信息比較有限。深層的特征具有良好的不變性和抽象性,對(duì)于影像分類具有更大的意義。因此,下一步的工作主要是結(jié)合輕而小的深度學(xué)習(xí)模型,來挖掘高光譜內(nèi)在結(jié)構(gòu)的深層特征。