黃 鴻,陳美利,王麗華,李政英
重慶大學(xué)光電技術(shù)與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,重慶 400044
高光譜遙感圖像通過(guò)從可見(jiàn)光到短波紅外區(qū)域的密集光譜采樣,可在數(shù)百個(gè)窄而連續(xù)的相鄰光譜波段中提供空間場(chǎng)景,包含了豐富的空間、輻射和光譜信息,為地物精細(xì)分類(lèi)提供了強(qiáng)有力的探測(cè)手段,目前已廣泛應(yīng)用于礦物勘探、環(huán)境監(jiān)測(cè)、精準(zhǔn)農(nóng)業(yè)和目標(biāo)識(shí)別等領(lǐng)域[1-2]。然而,高光譜數(shù)據(jù)具有數(shù)據(jù)量大、波段數(shù)多、波段間相關(guān)性強(qiáng)等特點(diǎn),傳統(tǒng)方法易導(dǎo)致“維數(shù)災(zāi)難”問(wèn)題[3-4]。因此,如何減少波段數(shù)且盡量保留有用信息已成為高光譜遙感領(lǐng)域的研究熱點(diǎn)問(wèn)題。
維數(shù)約簡(jiǎn)是克服數(shù)據(jù)冗余的有效方法,可在降低數(shù)據(jù)維數(shù)的同時(shí)盡可能保留數(shù)據(jù)中的本征信息[5]。目前學(xué)者們提出了一系列的維數(shù)約簡(jiǎn)方法,如主成分分析(principal component analysis,PCA)[6]、線(xiàn)性判別分析(linear discriminant analysis,LDA)[7]、等距映射(isometric feature mapping,ISOMAP)[8]、局部線(xiàn)性嵌入(local linear embedding,LLE)[9]、鄰域保持嵌入(neighborhood preserving embedding,NPE)[10]、拉普拉斯等距離映射(Laplacian eigenmaps,LE)[11]及局部保持投影(locality preserving projection,LPP)[12]。上述方法可統(tǒng)一在圖嵌入框架(graph embedding,GE)[13-14]下,其異于如何定義本征圖和懲罰圖,但都為非監(jiān)督方法,其分類(lèi)性能受限。針對(duì)此問(wèn)題,學(xué)者們通過(guò)將樣本先驗(yàn)知識(shí)引入到圖嵌入框架來(lái)改善分類(lèi)性能,提出了邊緣Fisher分析(marginal Fisher analysis,MFA)[15]和正則化局部判別嵌入(regularized local discriminant embedding,RLDE)[16]等監(jiān)督學(xué)習(xí)方法,以提升分類(lèi)精度。
然而,直接圖嵌入方法只考慮數(shù)據(jù)間一元關(guān)系,在實(shí)際應(yīng)用中高維數(shù)據(jù)通常具有復(fù)雜的多元幾何結(jié)構(gòu)[17-18]。為表征高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu),學(xué)者們?cè)噲D引入超圖學(xué)習(xí)來(lái)表示高光譜數(shù)據(jù)間的高階關(guān)系。文獻(xiàn)[19]提出了一種判別超-拉普拉斯投影(discriminant hyper-Laplacian projections,DHLP)方法,通過(guò)構(gòu)造超圖來(lái)獲得超-拉普拉斯矩陣,實(shí)現(xiàn)維數(shù)約簡(jiǎn)。文獻(xiàn)[20]提出了一種超圖拉普拉斯聯(lián)合稀疏化處理方法來(lái)分析像元的內(nèi)在關(guān)系,以提取低維特征進(jìn)行分類(lèi)。
上述方法僅利用了樣本的光譜信息,卻忽略了像元之間的空間位置關(guān)系,而研究表明空-譜聯(lián)合維數(shù)約簡(jiǎn)方法可明顯提高地物分類(lèi)性能。文獻(xiàn)[21]通過(guò)空間自適應(yīng)方法提取影像的空間特征和光譜特征,在分類(lèi)精度和計(jì)算效率上均取得了較好效果。文獻(xiàn)[22]提出了一種空-譜協(xié)同嵌入方法(spatial-spectral coordination embedding,SSCE),利用樣本空間塊替代單個(gè)樣本度量數(shù)據(jù)間相似性,降低異類(lèi)地物被選為近鄰的概率,從而改善地物分類(lèi)效果。與此同時(shí),空間信息也被引入超圖模型中,文獻(xiàn)[17]提出了一種融合空-譜信息的超圖嵌入方法,利用像元空間鄰域構(gòu)造超邊,能有效提取低維特征,但忽視了像元的類(lèi)別信息。在文獻(xiàn)[23]中,通過(guò)像元波段選取提取擴(kuò)展形態(tài)學(xué)特征,并與光譜信息融合來(lái)構(gòu)建超圖模型,提取嵌入特征以提升地物分類(lèi)性能。上述空-譜聯(lián)合維數(shù)約簡(jiǎn)方法,或是忽略了像元間多元幾何結(jié)構(gòu)關(guān)系,或是在構(gòu)造超圖模型時(shí)沒(méi)有充分利用樣本標(biāo)簽信息,限制了分類(lèi)性能的進(jìn)一步提升。
針對(duì)上述問(wèn)題,本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入方法(spatial-spectral regularized sparse hypergraph embedding,SSRSHE)。該方法運(yùn)用稀疏系數(shù)自適應(yīng)揭示數(shù)據(jù)間近鄰關(guān)系,并結(jié)合類(lèi)別信息構(gòu)建正則化稀疏超圖,從而有效表征高光譜數(shù)據(jù)的多元幾何結(jié)構(gòu)。同時(shí),融入圖像的空間信息,構(gòu)造局部空間鄰域散度來(lái)表征樣本局部鄰域結(jié)構(gòu),同時(shí)定義樣本總體散度矩陣來(lái)保證數(shù)據(jù)全局信息,提取有效鑒別特征,實(shí)現(xiàn)維數(shù)約簡(jiǎn)。在Indian Pines和PaviaU高光譜數(shù)據(jù)集上驗(yàn)證了本文算法的有效性。
假設(shè)文中高光譜數(shù)據(jù)集Z=[z1,z2,…,zi,…,zn]∈Rd×n,其中d為波段數(shù),n為樣本數(shù),類(lèi)別標(biāo)簽集L=[l1,l2,…,li,…,ln],li∈{1,2,…,u},其中u為樣本類(lèi)別數(shù)。低維嵌入特征可表示為Y=PTZ,Y∈Rτ×n,τ(τ< 為更好地理解維數(shù)約簡(jiǎn)算法,學(xué)者們提出了一種圖嵌入框架(GE)來(lái)表示數(shù)據(jù)幾何結(jié)構(gòu),并將PCA、LDA、ISOMAP、LLE、LE、NPE及LPP等算法統(tǒng)一到該框架中。在圖嵌入框架下,需構(gòu)建本征圖和懲罰圖兩個(gè)無(wú)向圖。本征圖GI(V,WI)表征數(shù)據(jù)中需要保持的統(tǒng)計(jì)或幾何性質(zhì),懲罰圖GP(V,WP)描述數(shù)據(jù)中應(yīng)避免的某種特性,其中V為頂點(diǎn)集,WI和WP分別為圖GI和GP的權(quán)重矩陣,可通過(guò)簡(jiǎn)單法或熱核函數(shù)來(lái)定義。 圖嵌入框架意在低維空間中保留數(shù)據(jù)集的某些統(tǒng)計(jì)或幾何屬性,其低維嵌入特征可通過(guò)優(yōu)化以下目標(biāo)函數(shù)得到 (1) 直接圖嵌入模型僅考慮了兩點(diǎn)間一階關(guān)系,而超圖模型能有效表征數(shù)據(jù)間的多元特性[17]。超圖模型可表示為GH=(VH,EH,WH),其中VH表示頂點(diǎn)集,EH為超邊集,對(duì)應(yīng)的相似權(quán)重矩陣是WH,以度量超邊內(nèi)各頂點(diǎn)間相關(guān)性。 為表示GH的內(nèi)在關(guān)系,假設(shè)每一超邊ei含有N(ei)個(gè)頂點(diǎn),其權(quán)重表示為w(ei)∈EH,則關(guān)聯(lián)矩陣H=[Hmn:h(em,vn)]∈R|EH|×|VH|、超邊em的度d(em)和頂點(diǎn)vn的度d(vn)可分別定義為 (2) (3) (4) 綜上,超圖內(nèi)每一超邊由某一像元與其近鄰點(diǎn)構(gòu)成,揭示數(shù)據(jù)間內(nèi)在多元關(guān)系。其對(duì)應(yīng)的關(guān)聯(lián)矩陣H,每行中的非零元素,描述每一超邊內(nèi)各點(diǎn)分布情況。超圖通過(guò)多對(duì)頂點(diǎn)連通以表征鄰域內(nèi)頂點(diǎn)間多元結(jié)構(gòu),因而可更好地描述數(shù)據(jù)中多元關(guān)系。 為表征高光譜數(shù)據(jù)中的多元幾何結(jié)構(gòu)關(guān)系,并聯(lián)合像元的空間-光譜信息,本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入(SSRSHE)方法。首先利用樣本的稀疏系數(shù)來(lái)自適應(yīng)性選擇其近鄰,構(gòu)建稀疏本征超圖和懲罰超圖來(lái)揭示高光譜數(shù)據(jù)間的多元結(jié)構(gòu)。同時(shí),依據(jù)空間一致性原理構(gòu)造局部空間鄰域散度以保持像元局部空間近鄰關(guān)系,并采用樣本總體散度來(lái)表征高光譜數(shù)據(jù)整體特性。在低維鑒別空間中,使類(lèi)內(nèi)數(shù)據(jù)盡可能聚集、類(lèi)間數(shù)據(jù)盡可能發(fā)散,提取鑒別特征,提升地物分類(lèi)性能。該算法的具體流程如圖1所示。 圖1 SSRSHE算法流程Fig.1 Flowchart of the proposed SSRSHE method 1.3.1 正則化稀疏超圖模型構(gòu)建 在構(gòu)建超圖時(shí),首先需要選擇合適的樣本近鄰點(diǎn)。目前的歐氏距離度量方法存在近鄰點(diǎn)選取不準(zhǔn)確及參數(shù)難以確定等問(wèn)題,而稀疏表示具有自然鑒別力能自適應(yīng)地揭示出數(shù)據(jù)的內(nèi)在關(guān)系。某個(gè)樣本可以由一個(gè)足夠大的樣本空間來(lái)近似線(xiàn)性表示,且表示系數(shù)大部分為零,只有極少數(shù)與該樣本同類(lèi)別數(shù)據(jù)對(duì)應(yīng)的系數(shù)為非零,因此可反映數(shù)據(jù)的本征屬性。 基于此,本文提出了一種正則化稀疏超圖模型,首先通過(guò)稀疏表示[24]得到數(shù)據(jù)的稀疏系數(shù)矩陣,揭示數(shù)據(jù)內(nèi)在關(guān)聯(lián)特性,以自適應(yīng)獲取像元近鄰。稀疏系數(shù)可通過(guò)以下l1范數(shù)求解 (5) 式中,ε為稀疏誤差;E是全為1的向量。在具體計(jì)算中,可通過(guò)將式(5)問(wèn)題進(jìn)一步轉(zhuǎn)化為L(zhǎng)asso問(wèn)題求解[25],即可得到稀疏系數(shù)矩陣S=[s1,s2,…,sn]T。 圖2為基于稀疏系數(shù)自適應(yīng)選取近鄰構(gòu)造超邊示意圖。因稀疏系數(shù)可反映數(shù)據(jù)間相似性,對(duì)應(yīng)系數(shù)非零則表示像元間具有相關(guān)性,其值越大則屬于同類(lèi)近鄰點(diǎn)可能性越大。因此相比歐氏度量,利用稀疏系數(shù)自適應(yīng)選擇近鄰能更為有效反映數(shù)據(jù)內(nèi)蘊(yùn)信息。 圖2 基于稀疏系數(shù)的自適應(yīng)選取近鄰構(gòu)造超邊Fig.2 Construction of sparse hyperedge (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) 在低維映射空間中,為提取鑒別特征,應(yīng)使同類(lèi)數(shù)據(jù)盡可能聚集、不同類(lèi)數(shù)據(jù)盡可能遠(yuǎn)離,因此目標(biāo)函數(shù)可表示為 (16) (17) 由式(16)、式(17)中的目標(biāo)函數(shù),可進(jìn)一步轉(zhuǎn)化為以下最優(yōu)化問(wèn)題 (18) 在訓(xùn)練樣本較少的情況下,式(18)易受奇異點(diǎn)影響。故在此引入正則化項(xiàng),則式(18)中的優(yōu)化問(wèn)題可拓展為 (19) 式中,η(0<η<1)表示正則化參數(shù)。正則項(xiàng)ZZT用于保持樣本的多樣性。將ZLwZT對(duì)角化,以改善式(19)問(wèn)題求解的穩(wěn)定性,即其對(duì)應(yīng)的特征值在較大時(shí)可自適應(yīng)減小,在極小或是零時(shí)增大。因此,式中分母項(xiàng)矩陣滿(mǎn)足非奇異性。假如η=0,式(19)即為式(18);若η=1,以單位矩陣替代對(duì)角矩陣,式(19)則等效為PCA。 1.3.2 局部空間鄰域散度和總體散度計(jì)算 鑒于高光譜圖像空間一致性特點(diǎn),即在空間局部鄰域內(nèi)近鄰屬于同類(lèi)概率較大。以像元zi:(xi,yi)為中心作方形窗口δ(zi),(xi,yi)為zi在圖像中的空間坐標(biāo)位置,則窗口為γ×γ(γ是正奇數(shù))的空間鄰域像元集可記作 δ(zi)={zim:(xm,ym)|xi-c yi-c (20) 式中,c=(γ-1)/2,zim:(xm,ym)對(duì)應(yīng)空間鄰域里第m個(gè)像元點(diǎn)。δ(zi)共有γ×γ個(gè)像元。則空間鄰域距離可定義為 (21) (22) 此外,為揭示影像數(shù)據(jù)多樣性,保持?jǐn)?shù)據(jù)的整體結(jié)構(gòu),定義總體散度矩陣 (23) 1.3.3 空-譜協(xié)同低維嵌入 為在嵌入空間中提取低維空-譜鑒別特征,不僅要保持高光譜數(shù)據(jù)局部空間近鄰結(jié)構(gòu),還需使超圖中的類(lèi)內(nèi)數(shù)據(jù)聚集、類(lèi)間數(shù)據(jù)遠(yuǎn)離。因此,式(19)、式(22)和式(23)可進(jìn)一步轉(zhuǎn)化為以下優(yōu)化問(wèn)題 (24) 式中,參數(shù)η,ξ∈[0,1];Mw=ξ[(1-η)Nw+ηdiag(diag(Nw))]+(1-ξ)A,用于表征類(lèi)內(nèi)與局部數(shù)據(jù)緊致性,Nw=ZLwZT;Mb=ξ[(1-η)Nb+ηZZT]+(1-ξ)B,用于表示類(lèi)間與全局?jǐn)?shù)據(jù)發(fā)散度,Nb=ZLbZT。 依據(jù)拉格朗日乘子法,式(24)可轉(zhuǎn)換為以下廣義特征值求解 MbP=λMwP (25) 將式(25)特征值降序排列,選取前τ個(gè)特征值對(duì)應(yīng)的特征向量構(gòu)成最優(yōu)映射矩陣P=[p1,p2,…,pτ-1,pτ]。在低維空間里,測(cè)試樣本ztest的空-譜協(xié)同特征是ytest=PTztest。 為驗(yàn)證本文算法的有效性,在公開(kāi)的Indian Pines和PaviaU高光譜數(shù)據(jù)集上進(jìn)行分類(lèi)試驗(yàn),并與相關(guān)的維數(shù)約簡(jiǎn)算法進(jìn)行了對(duì)比。 (1) Indian Pines數(shù)據(jù)集為美國(guó)宇航局在1992年利用AVIRIS傳感器拍攝位于美國(guó)Indian州西北100 km2范圍的高光譜遙感影像,其尺寸為145×145像素,共220個(gè)波段,空間分辨率為20 m,剔除受水氣(噪聲)影響的波段后,余下200個(gè)波段用于試驗(yàn)。該數(shù)據(jù)集主要包含16類(lèi)地物,其假彩色圖和真實(shí)地物圖如圖3所示。 圖3 Indian Pines高光譜圖像Fig.3 Indian Pines hyperspectral image (2) PaviaU數(shù)據(jù)集為2002年采用ROSIS傳感器拍攝的意大利北部的帕維亞大學(xué)周?chē)母吖庾V影像,其尺寸為610×340像素,空間分辨率為1.3 m,共有115個(gè)波段,去除受噪聲影響嚴(yán)重的12個(gè)波段后,剩余103個(gè)波段用于對(duì)比試驗(yàn)。該數(shù)據(jù)集包括道路、磚塊、屋頂和裸土等9類(lèi)地物,圖4為其假彩色圖和真實(shí)地物圖。 圖4 PaviaU 高光譜圖像Fig.4 University of Pavia hyperspectral image 在試驗(yàn)中,每次試驗(yàn)隨機(jī)選取一定數(shù)目的樣本用于訓(xùn)練,其余進(jìn)行測(cè)試。鑒于在實(shí)際應(yīng)用中,高光譜圖像中存在部分地物類(lèi)別樣本數(shù)量非常少,例如在Indian Pines數(shù)據(jù)集中,Alfalfa(46)、Oats(20)、Stone-steel towers(93),括號(hào)中為對(duì)應(yīng)的樣本數(shù)。為避免出現(xiàn)某些類(lèi)別選取訓(xùn)練樣本所占比例過(guò)高或數(shù)量過(guò)少,在試驗(yàn)中設(shè)置如下:假設(shè)每類(lèi)地物隨機(jī)選取樣本量為ni,Ni表示某類(lèi)地物的總樣本數(shù),若ni≥Ni/2,則ni=Ni/2;若ni≤10,則定ni=10。通過(guò)采用各維數(shù)約簡(jiǎn)算法得到投影矩陣后,將所有樣本投影到低維空間得到嵌入特征,并通過(guò)利用最近鄰分類(lèi)器(1-NN)進(jìn)行分類(lèi)。在每種試驗(yàn)條件下均進(jìn)行10次重復(fù)試驗(yàn),將總體分類(lèi)精度(the overall accuracies,OAs)、平均分類(lèi)精度(the average accuracies,AAs)及Kappa系數(shù)作為分類(lèi)結(jié)果的評(píng)價(jià)指標(biāo)。 試驗(yàn)中,將本文方法與PCA、LDA、MFA、LPP、RLDE、DHLP、SSCE、LPSNPE等維數(shù)約簡(jiǎn)算法進(jìn)行比較,采用交叉驗(yàn)證方法獲得各算法的最佳參數(shù)。SSCE在兩個(gè)數(shù)據(jù)集中空間窗口均設(shè)置為5,SSCE和LPP的最近鄰取5,DHLP中近鄰數(shù)為9;RLDE和MFA的類(lèi)內(nèi)和類(lèi)間近鄰數(shù)分別為3、5,8、60。LDA的嵌入維數(shù)為u-1,u為類(lèi)別數(shù),其他算法的嵌入維數(shù)均設(shè)置為30。 為探索本文方法中參數(shù)η、ξ,空間窗口γ對(duì)分類(lèi)精度的影響,從數(shù)據(jù)集中每類(lèi)地物中隨機(jī)選取5個(gè)樣本進(jìn)行訓(xùn)練,其余樣本作為測(cè)試樣本。令α=10,ε=0.006,η與ξ的取值范圍均設(shè)置為{0,0.01,0.05,0.1,0.2,…,0.9,1},γ={3,5,…,39}。圖5為本文SSRSHE算法在不同η和ξ值下的分類(lèi)結(jié)果,圖6是本文SSRSHE算法在不同γ下的分類(lèi)結(jié)果。 由圖5可知,隨著ξ的增加,其分類(lèi)精度隨之增加而后達(dá)到平穩(wěn),但是ξ值過(guò)大時(shí),分類(lèi)精度有所下降。這是因?yàn)樵赟SRSHE中,ξ用于平衡光譜信息和空間結(jié)構(gòu)在特征提取中作用,ξ過(guò)小時(shí)未能有效利用超圖所表征的像元間的復(fù)雜多元結(jié)構(gòu)關(guān)系,過(guò)大時(shí)則忽略了空間結(jié)構(gòu),也不利于鑒別特征提取。與此同時(shí),盡管試驗(yàn)中每類(lèi)樣本數(shù)量?jī)H有5個(gè),但是在同一η值下,分類(lèi)結(jié)果比較穩(wěn)定,有利于實(shí)際場(chǎng)景應(yīng)用。為平衡光譜信息與空間信息對(duì)分類(lèi)性能的影響,依據(jù)試驗(yàn)結(jié)果,本文在Indian Pines數(shù)據(jù)集設(shè)置ξ為0.3,η為0.7;對(duì)于PaviaU數(shù)據(jù)集,設(shè)置η=0.5及ξ=0.2。 圖5 SSRSHE在不同η和ξ參數(shù)值下的總體分類(lèi)精度Fig.5 OAs of SSRSHE with different values of parameters η and ξ on Indian Pines and PaviaU data sets 圖6 SSRSHE在不同空間窗口γ下的總體分類(lèi)精度Fig.6 OAs of SSRSHE with different size γ on different data sets 由圖6知,隨著空間窗口γ變大,能利用的空間信息愈發(fā)豐富,分類(lèi)精度隨之增加;但γ過(guò)大時(shí),空間窗口內(nèi)包含來(lái)自于不同類(lèi)數(shù)據(jù)的可能性增大,導(dǎo)致分類(lèi)性能下降,且窗口過(guò)大,會(huì)導(dǎo)致計(jì)算復(fù)雜度增加。因此,綜合考慮算法性能及計(jì)算效率,在Indian Pines數(shù)據(jù)集上設(shè)置γ=7,在PaviaU數(shù)據(jù)集上γ=15。 試驗(yàn)中,從Indian Pines數(shù)據(jù)集的每類(lèi)地物里分別按照5、20、50、100、200樣本數(shù)隨機(jī)選取數(shù)據(jù)用于訓(xùn)練,剩余樣本用于測(cè)試。采用各維數(shù)約簡(jiǎn)算法訓(xùn)練得到嵌入特征后,采用1-NN進(jìn)行分類(lèi)。表1為在不同樣本數(shù)量下不同算法的總體分類(lèi)精度和Kappa系數(shù)值。 表1 不同降維算法在Indian Pines數(shù)據(jù)集上的分類(lèi)效果 Tab.1 Classification with different numbers of training data via different DR methods on Indian Pines data set 5總體分類(lèi)精準(zhǔn)度/(%)Kappa20總體分類(lèi)精準(zhǔn)度/(%)Kappa50總體分類(lèi)精準(zhǔn)度/(%)Kappa100總體分類(lèi)精準(zhǔn)度/(%)Kappa200總體分類(lèi)精準(zhǔn)度/(%)KappaRAW43.6±2.80.37254.9±1.70.49560.1±1.40.55263.6±0.90.58866.9±0.60.622PCA43.4±2.70.37054.9±1.60.49560.2±1.20.55363.9±0.80.59167.0±0.60.622LDA32.5±4.80.25351.6±1.90.45964.4±1.20.59971.0±0.50.67274.4±0.70.706LPP43.6±3.70.37154.5±1.80.49159.7±1.20.54662.7±1.00.57865.8±0.50.609MFA44.1±4.00.37757.1±1.60.52066.8±1.90.62570.8±1.10.66972.0±1.00.680RLDE41.7±3.70.35160.9±1.50.56169.8±1.40.65974.6±0.70.71178.4±0.60.751RSHE48.6±3.40.42263.2±1.90.58771.0±1.70.67277.1±0.90.73980.0±0.70.770DHLP44.1±3.80.37757.2±2.10.52268.9±1.20.64973.8±0.80.70277.6±0.70.741SSCE30.2±4.50.23069.7±1.00.65876.3±0.90.73079.1±0.50.76082.9±0.60.801LPSNPE60.2±3.50.59474.0±1.40.70679.3±0.70.75981.6±0.60.79184.2±0.60.817SSRSHE65.6±2.30.61574.8±1.20.70680.0±1.00.76582.9±1.00.80386.7±1.00.829 從表1可得知,各種維數(shù)約簡(jiǎn)算法的分類(lèi)性能都隨著訓(xùn)練樣本數(shù)目的增大而不斷提高,這是由于隨著訓(xùn)練數(shù)據(jù)量的增加,蘊(yùn)含的信息就越豐富,有利于特征提取。DHLP、RSHE等超圖方法的分類(lèi)精度大多數(shù)情況下均優(yōu)于傳統(tǒng)圖嵌入方法,表明利用數(shù)據(jù)間的多元幾何結(jié)構(gòu)特性可有效提高分類(lèi)精度。與此同時(shí),SSCE、LPSNPE等空-譜類(lèi)方法,通過(guò)融合樣本數(shù)據(jù)的空間信息,其分類(lèi)性能要優(yōu)于PCA、LDA、LPP、MFA、RLDE等僅利用了光譜信息的圖嵌入方法。在各種訓(xùn)練條件下SSRSHE方法的分類(lèi)性能均優(yōu)于其他算法,因?yàn)樗昧顺瑘D框架來(lái)表示各樣本鄰域內(nèi)頂點(diǎn)間的多元幾何關(guān)系,因而可更好描述數(shù)據(jù)中復(fù)雜鄰域結(jié)構(gòu)。同時(shí)SSRSHE將樣本類(lèi)別信息融入超圖框架,分別構(gòu)建了稀疏本征超圖和懲罰超圖,能充分揭示數(shù)據(jù)間的復(fù)雜判別多元關(guān)系,提取出更有效的低維鑒別特征,進(jìn)一步提升分類(lèi)精度。 為進(jìn)一步探索SSRSHE對(duì)每種地物的分類(lèi)性能,從Indian Pines數(shù)據(jù)集每一類(lèi)里隨機(jī)選擇3%的像元為訓(xùn)練樣本,余下數(shù)據(jù)用于測(cè)試。表2為不同維數(shù)約簡(jiǎn)算法對(duì)于每一種地物的總體分類(lèi)精度、平均分類(lèi)精度、Kappa系數(shù)及降維運(yùn)行時(shí)間,其對(duì)應(yīng)在整個(gè)數(shù)據(jù)集上的分類(lèi)結(jié)果如圖7所示。 表2 不同算法在Indian Pines數(shù)據(jù)集每類(lèi)地物上的分類(lèi)精度 Tab.2 Classification accuracy of different types of features on Indian Pines data set by different algorithms (%) 圖7 在Indian Pines數(shù)據(jù)集上,各降維算法對(duì)應(yīng)的全分類(lèi)結(jié)果Fig.7 Classification map of different DR methods on Indian Pines data set 從表2可發(fā)現(xiàn),SSRSHE的分類(lèi)性能表現(xiàn)最佳,在每類(lèi)上的總體分類(lèi)精度、平均分類(lèi)精度、Kappa值均優(yōu)于其他方法,且對(duì)比SSCE算法,其運(yùn)行效率快,優(yōu)勢(shì)明顯。這是因?yàn)镾SRSHE算超圖學(xué)習(xí),充分揭示了數(shù)據(jù)間高階關(guān)系,以及像元空間特征的有效利用,有效表征了影像內(nèi)蘊(yùn)特性,提取的嵌入特征更具鑒別力,更有助于地物分類(lèi)。同時(shí),從圖7可以看到,本文算法相比其他算法,在其分類(lèi)結(jié)果圖更趨于平滑,尤其在“Alfalfa”、“Soybeans-min”、“Stone-steel towers”等區(qū)域更明顯。由此可見(jiàn),本文算法基于空-譜信息與超圖模型協(xié)同學(xué)習(xí),實(shí)現(xiàn)有效鑒別特征提取,改善影像分類(lèi)精度,確實(shí)具有一定實(shí)踐意義。 在試驗(yàn)中,從每種地物中隨機(jī)選取5、20、50、100、200個(gè)樣本用于訓(xùn)練,其余數(shù)據(jù)用來(lái)測(cè)試,采用最近鄰分類(lèi)器進(jìn)行分類(lèi)。表3為在不同的訓(xùn)練樣本數(shù)目下各維數(shù)約簡(jiǎn)算法對(duì)應(yīng)的總體分類(lèi)精度及Kappa值。 依據(jù)表3,在大多數(shù)訓(xùn)練條件下,DHLP、RSHE等超圖方法和SSCE、LPSNPE等空-譜聯(lián)合方法的分類(lèi)結(jié)果要優(yōu)于直接圖嵌入方法,這表明超圖學(xué)習(xí)和空-譜融合信息均有利于高光譜數(shù)據(jù)鑒別特征提取,有效改善地物分類(lèi)性能。本文提出的SSRSHE方法在各種試驗(yàn)條件下,均具有最佳分類(lèi)性能,這是因?yàn)槠洳粌H通過(guò)超圖學(xué)習(xí)發(fā)現(xiàn)高光譜數(shù)據(jù)中復(fù)雜結(jié)構(gòu),且有效融入了空間信息,在低維空間中使同類(lèi)信息聚集、非同類(lèi)信息遠(yuǎn)離,提高了數(shù)據(jù)可分性,進(jìn)而有效提高地物分類(lèi)效果。 為進(jìn)一步分析SSRSHE方法在每種地物上的分類(lèi)性能,從每類(lèi)地物里隨機(jī)選擇5%的像元組成訓(xùn)練樣本集,其他部分為測(cè)試樣本集。表4反映了不同維數(shù)約簡(jiǎn)方法在每類(lèi)地物的分類(lèi)效果,圖8則為各方法對(duì)整個(gè)PaviaU遙感圖像分類(lèi)的結(jié)果圖。由表4可以看到,SSRSHE在大多數(shù)地物類(lèi)別中的分類(lèi)性能要優(yōu)于其他方法,表明在影像地物分類(lèi)過(guò)程中,SSRSHE算法可使同類(lèi)數(shù)據(jù)的關(guān)聯(lián)性,異物數(shù)據(jù)間奇異性增強(qiáng),鑒別特征尤為突出,分類(lèi)性能更佳。同時(shí),在圖8中,本文方法在“Asphalt”,“Meadows”,“Gravel”等地物區(qū)域的分類(lèi)結(jié)果較為光滑,誤分點(diǎn)較少,且運(yùn)行時(shí)間并沒(méi)大幅度增加,表明聯(lián)合空-譜特性與超圖學(xué)習(xí)的SSRSHE算法的地物分類(lèi)性能有明顯提升,更適合實(shí)際應(yīng)用場(chǎng)景。 圖8 在PaviaU數(shù)據(jù)集上,各降維算法對(duì)應(yīng)的全分類(lèi)結(jié)果Fig.8 Classification map of different DR methods on PaviaU data set 算法5總體分類(lèi)精準(zhǔn)度/(%)Kappa20總體分類(lèi)精準(zhǔn)度/(%)Kappa50總體分類(lèi)精準(zhǔn)度/(%)Kappa100總體分類(lèi)精準(zhǔn)度/(%)Kappa200總體分類(lèi)精準(zhǔn)度/(%)KappaRAW60.5±4.20.51266.4±2.40.58373.5±1.60.66376.4±0.80.69878.8±0.80.724PCA60.5±4.20.51266.5±2.20.58373.4±1.60.66276.4±0.80.69778.7±0.80.724LDA46.7±6.40.35159.6±1.80.49573.5±1.40.66278.9±0.90.72783.4±0.60.782LPP47.0±5.60.35459.3±2.60.50072.8±2.30.65478.3±1.30.72282.2±1.20.768MFA64.5±4.30.55569.2±4.50.61376.4±2.00.69978.1±2.40.71579.1±2.20.730RLDE64.4±3.20.55574.6±2.70.67777.9±2.20.71882.1±1.00.77084.8±1.00.802RSHE63.2±4.10.54075.4±2.30.68578.3±1.40.72083.4±0.90.78484.9±1.30.802DHLP56.8±8.00.47162.2±3.60.53070.8±2.10.62977.5±2.70.71180.2±1.50.742SSCE42.3±5.30.30963.3±2.90.54375.8±1.70.69282.7±1.20.81487.0±0.80.828LPSNPE68.0±4.20.60680.0±2.20.74786.3±1.30.82287.9±0.90.84289.9±0.60.877SSRSHE71.6±2.70.64682.6±2.30.77687.5±1.10.83790.0±1.50.88292.2±0.20.908 表4 不同算法在PaviaU數(shù)據(jù)集每種地物上的分類(lèi)精度 針對(duì)傳統(tǒng)圖嵌入降維方法存在不能表征高光譜數(shù)據(jù)中的多元關(guān)系且未有效利用空間信息等問(wèn)題,本文提出了一種空-譜協(xié)同正則化稀疏超圖嵌入算法。本文算法利用稀疏系數(shù)實(shí)現(xiàn)自適應(yīng)近鄰選取,構(gòu)建正則化稀疏超圖模型來(lái)揭示高光譜數(shù)據(jù)間的多元幾何結(jié)構(gòu)。此外,考慮到保持樣本的全局特性和局部鄰域結(jié)構(gòu)分別定義樣本總體散度與局部空間鄰域散度,實(shí)現(xiàn)空-譜鑒別特征提取。在Indian Pines和PaviaU高光譜數(shù)據(jù)集上試驗(yàn)結(jié)果表明,相比其他算法,在訓(xùn)練樣本數(shù)較少時(shí),SSRSHE地物分類(lèi)性能仍有明顯提升。但本文方法僅運(yùn)用光譜信息構(gòu)建超圖,在下一步工作將考慮空-譜聯(lián)合超圖模型構(gòu)建,以進(jìn)一步提升地物分類(lèi)效果。1.1 圖嵌入學(xué)習(xí)
1.2 超圖模型
1.3 SSRSHE算法
2 試驗(yàn)結(jié)果與分析
2.1 數(shù)據(jù)集
2.2 試驗(yàn)設(shè)置
2.3 Indian Pines試驗(yàn)結(jié)果與分析
2.4 PaviaU試驗(yàn)結(jié)果與分析
3 總 結(jié)