王金甲
(燕山大學(xué)信息科學(xué)與工程學(xué)院 秦皇島 066004)
?
基于子空間字典偶學(xué)習(xí)的高光譜圖像分類①
王金甲②
(燕山大學(xué)信息科學(xué)與工程學(xué)院 秦皇島 066004)
針對(duì)高光譜高分辨率帶來(lái)巨大數(shù)據(jù)量和空間分辨率引起混合像元的問(wèn)題,提出了基于子空間(subspace)的字典偶學(xué)習(xí)(DPL)算法,簡(jiǎn)稱DPLsub算法。DPL算法是對(duì)字典學(xué)習(xí)的改進(jìn),它通過(guò)學(xué)習(xí)得到綜合字典和分析字典,在模式識(shí)別中體現(xiàn)了高效性,而子空間投影的方法能更好地表征噪聲和高度混合的像元。將光譜和空間特征融合的方法用于分類研究試驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)是兩幅高光譜影像,比較了子空間字典偶學(xué)習(xí)(DPLsub)模型和其他三種分類器即最小二乘支持向量機(jī)(LS-SVM)、稀疏多分類回歸(SMLR)和字典學(xué)習(xí)(DL-OMP)的分類結(jié)果。實(shí)驗(yàn)結(jié)果顯示,DPLsub算法無(wú)論在時(shí)間上還是精度上都優(yōu)于其他算法,證明了這種子空間字典偶學(xué)習(xí)方法對(duì)高光譜圖像分類的可行性與高效性。
高光譜圖像分類, 子空間投影, 混合像元, 字典偶學(xué)習(xí)(DPL), 多特征融合
隨著傳感器與成像技術(shù)的發(fā)展,遙感影像在軍事、農(nóng)業(yè)等方面發(fā)揮的重要作用日益明顯。但由于高光譜數(shù)據(jù)具有上百個(gè)通道,數(shù)據(jù)量非常大,存在大量的混合像元和數(shù)據(jù)冗余現(xiàn)象,給圖像傳輸和存儲(chǔ)帶來(lái)了困難,另外,由于波段間強(qiáng)的相關(guān)性和類內(nèi)多樣性的存在使高光譜圖像有很多特征提取方面的困難和分類效果不理想等問(wèn)題,針對(duì)這些具體問(wèn)題研究學(xué)者們已提出了很多解決方法[1],例如高空間高分辨率的遙感圖像分類方法,其主要特點(diǎn)是先降維再提特征實(shí)現(xiàn)分類研究[2,3]。同時(shí)在現(xiàn)實(shí)中,由于種種原因,在像元對(duì)應(yīng)的瞬間視角內(nèi)包含多于一種地物,因此形成了混合像元,早在2008年羅文斐等人就提出了基于子空間距離解混高光譜圖像的算法[4],之后更多關(guān)于子空間投影的方法應(yīng)用到圖像分類[5,6]。同時(shí)為了彌補(bǔ)光譜特征信息的不足,消除“同譜異類,異類同譜”的現(xiàn)象,聯(lián)合空間-光譜的多特征方法廣泛的應(yīng)用于高光譜圖像分類[7,8],其中形態(tài)學(xué)方法是一種有效提取空間特征的方法。圖像的分類也依賴于高效的分類器,支持向量機(jī)及其改進(jìn)方法一直被廣泛應(yīng)用,包括趙春暉等人提出的基于改進(jìn)的最小二乘支持向量機(jī)(least squares support vector machine, LS-SVM)[9],還有稀疏的多分類回歸(sparse multinomial logistic regression, SMLR)算法也多次用于遙感圖像的分類[10],都取得良好的效果。
稀疏表示分類(sparse representation classification, SRC)因?yàn)槠渚哂械颓謹(jǐn)_、高特異性和高識(shí)別率的性質(zhì)而得到了廣泛關(guān)注[11,12]。高光譜的稀疏表示主要包括兩方面:完備的字典稀疏編碼和分類。字典學(xué)習(xí)的目的是通過(guò)學(xué)習(xí)得到綜合字典,大多數(shù)稀疏字典算法由于l0或l1稀疏限制使時(shí)間開(kāi)銷很大。本文提出了基于子空間(subspace)的字典偶學(xué)習(xí)(dictionary pair learning, DPL)模型和算法,簡(jiǎn)稱DPLsub模型和算法。DPL模型在模式分類過(guò)程中同時(shí)得到綜合字典和分析字典,沒(méi)有l(wèi)0和l1范數(shù)約束,可以在線性投影中計(jì)算稀疏表示系數(shù),與在非線性空間相比大大降低了所用的時(shí)間,同時(shí)基于子空間的投影算法可以大大降低計(jì)算的維度。
1.1 光譜特征
高光譜遙感的光譜分辨率很高,地物光譜信息豐富,有很多光譜波段,一般從可見(jiàn)光到紅外范圍就設(shè)置了200多個(gè)波段,本文提取的高光譜圖像光譜特征就是去除掉水吸收波段范圍內(nèi)不好的波段,保留剩下波段全部作為光譜特征輸入,記為L(zhǎng)linear,不再做任何非線性變換提取特征。
1.2 擴(kuò)展的屬性特征
早在2001年Benediktsson就提出了形態(tài)學(xué)(morphological profile, MP)方法用于圖像的預(yù)處理[13],之后Benediktsson又提出了擴(kuò)展的形態(tài)特征(extend morphological profile,EMP),即通過(guò)降低原始光譜數(shù)據(jù)的維數(shù),再在每一個(gè)主成分上提取形態(tài)學(xué)特征[14]。2010年Benediktsson又提出了擴(kuò)展的屬性特征(extend attribute profile,EAP)[15],它是EMP的延伸,是在提取主成分基礎(chǔ)上提取屬性特征,其定義為
EAP={AP(PC1), AP(PC2),…,AP(PCc)]
(1)
式中c表示主成分(principal component, PC)的個(gè)數(shù)。
EMAPs是基于單一屬性的PCs上的多層次分析,然而EMAP考慮了多個(gè)屬性,雖然它導(dǎo)致了特征提取時(shí)維數(shù)的增加,但是它精確地建立了空間特征模型。本實(shí)驗(yàn)有4種屬性[16]可用于屬性特征提取,以這4種屬性構(gòu)建高光譜圖像的擴(kuò)展屬性特征,記為L(zhǎng)EMAP。
X={X1, X2,…,Xn}表示輸入的圖像,n表示像元的個(gè)數(shù),Xi∈Rd,d表示維數(shù),y=(y1, y2,…, yn)是類標(biāo)簽,yi∈{1,2,…,K}。
2.1 獨(dú)立的類子空間的學(xué)習(xí)過(guò)程:
R(k)= E(k)Λ(k)E(k)T
(2)
(3)
維子空間獨(dú)立類的估計(jì),r(k) 根據(jù)1.1節(jié)去除不好的波段,然后把剩下的光譜波段信息投影到子空間,再輸入到字典偶學(xué)習(xí)器中。 2.2 字典偶的學(xué)習(xí)過(guò)程 Gu等人提出了具有綜合字典D和分析字典P的DPL模型[17]: (4) 式中,ψ(D,P,X,Y)是識(shí)別函數(shù),分析字典P用于X的編碼分析,綜合字典D用于重構(gòu)X。DPL模型的識(shí)別力取決于識(shí)別函數(shù)ψ(D,P,X,Y)的設(shè)計(jì)。分析字典P的子字典Pk對(duì)第i, (i≠k)類樣本進(jìn)行投影,約為空集,即 PkXi≈0, ?k≠i (5) 由式(5)可知,系數(shù)矩陣PX近似是塊對(duì)角化的,可以從投影編碼矩陣PkXk中利用D中的子字典Dk重構(gòu)矩陣Pk即得到的字典偶可以使得重構(gòu)誤差最?。?/p> 護(hù)理工作也要面對(duì)復(fù)雜的人際關(guān)系,如:醫(yī)護(hù)、護(hù)護(hù)、醫(yī)技、后勤、職能等相關(guān)部門,稍不注意就會(huì)困于人際關(guān)系的處理之中。任何一種人際關(guān)系都會(huì)直接影響護(hù)士的身心健康,其中最為明顯的便是護(hù)患關(guān)系,有責(zé)任心的護(hù)士為病患做了許多,但由于許多的患者及其家屬不理解護(hù)士的工作性質(zhì),時(shí)有辱罵、甚至毆打護(hù)士的事件發(fā)生,近年來(lái),醫(yī)患關(guān)系也是日益緊張,在高壓的工作環(huán)境中,護(hù)士的身心更加緊張、焦慮、疲憊。 (6) 綜合式(4)(5)(6)可得DPL模型描述為 (7) 具體的優(yōu)化DPL的過(guò)程[17]不再詳述,本文根據(jù)字典偶的殘差最小原則對(duì)實(shí)現(xiàn)高光譜圖像進(jìn)行分類。圖1所示是本研究實(shí)現(xiàn)高光譜圖像分類算法的流程圖。 圖1 高光譜圖像分類的流程圖 本實(shí)驗(yàn)數(shù)據(jù)包括兩幅高光譜圖像,分別是AVIRIS Indian Pines數(shù)據(jù)和HYDICE Washington DC數(shù)據(jù)。根據(jù)第2節(jié)介紹,在兩組原數(shù)據(jù)的基礎(chǔ)上分別提取了光譜與空間兩種類型特征,本文所有的實(shí)驗(yàn)重復(fù)50次,具體實(shí)驗(yàn)內(nèi)容如圖2所示。 圖2 第三章實(shí)驗(yàn)的流程圖 3.1 AVIRIS Indian Pines數(shù)據(jù)的實(shí)驗(yàn) 3.1.1 實(shí)驗(yàn)概述 在實(shí)驗(yàn)中使用的第一個(gè)高光譜圖像是1992年通過(guò)AVIRIS傳感器在Indian Pines的西北區(qū)域采集的數(shù)據(jù),其大小為145×145,包括有220個(gè)連續(xù)波段(400~2500nm),去除水吸收波段范圍的900~1400nm,還剩下200個(gè)波段作為本實(shí)驗(yàn)數(shù)據(jù)。HYDICE高光譜圖像波段標(biāo)準(zhǔn)假彩色合成圖如圖3(a)所示。該數(shù)據(jù)共包括16類,各個(gè)類別和各個(gè)類別樣本的數(shù)量如圖3(b)所示。 圖3 Indian Pines高光譜圖像 3.1.2 實(shí)驗(yàn)結(jié)果及討論 實(shí)驗(yàn)1: 當(dāng)僅將光譜特征(Llinear)用于高光譜圖像分類時(shí),隨著每類訓(xùn)練樣本數(shù)量的增加,比較字典偶學(xué)習(xí)(DPL)和子空間字典偶學(xué)習(xí)(DPLsub)的分類結(jié)果如表1所示。從表1可以看出:(1)當(dāng)僅有Llinear用于圖像分類時(shí),這兩種分類器分類的效果都不盡如意,最高僅達(dá)到73%;(2)當(dāng)訓(xùn)練樣本數(shù)量相 表1 不同訓(xùn)練樣本的個(gè)數(shù)的分類精度 同時(shí),DPLsub分類效果遠(yuǎn)遠(yuǎn)優(yōu)于DPL。例如當(dāng)共560個(gè)訓(xùn)練樣本時(shí),DPLsub的總體分類精度是71.49%,比DPL分類效果高出7%,說(shuō)明子空間投影確實(shí)有效地提取了原始影像的光譜信息,同時(shí)發(fā)現(xiàn)即使訓(xùn)練樣本數(shù)量很大時(shí),DPLsub也可以快速地實(shí)現(xiàn)分類,比傳統(tǒng)的DPL相比大大降低了消耗的時(shí)間。 實(shí)驗(yàn)2: 為了消除“同物異譜,異物同譜”現(xiàn)象對(duì)分類的影響,本次實(shí)驗(yàn)融合了空間特征(LEMAP)到DPLsub分類器,每類的訓(xùn)練樣本個(gè)數(shù)是50,實(shí)驗(yàn)結(jié)果如表2所示:當(dāng)僅有光譜特征分類時(shí),總體分類準(zhǔn)確度是73.23%;融合了空間特征后DPLsub的分類精度達(dá)到94%以上,大大提高了分類精度。實(shí)驗(yàn)結(jié)果證明了聯(lián)合空間-光譜特征時(shí)可以彌補(bǔ)光譜特征的不足,明顯改善其分類結(jié)果。圖4顯示了融合空間特征后,不同的訓(xùn)練樣本的總體、平均分類精度及Kappa系數(shù),隨著每類訓(xùn)練樣本的增加,分類精度也會(huì)有所提高。當(dāng)每類樣本達(dá)到50個(gè)時(shí),總體分類精度可達(dá)94%,可見(jiàn)有足夠的標(biāo)簽樣本作為訓(xùn)練樣本的重要性。 表2 融合空間特征到子空間字典偶學(xué)習(xí)的分類結(jié)果 圖4 隨著每類訓(xùn)練樣本個(gè)數(shù)的增加,我們算法的分類精度 實(shí)驗(yàn)3: 本實(shí)驗(yàn)比較了DPLsub和DPL及其他三種分類器分類結(jié)果。當(dāng)每類訓(xùn)練樣本的個(gè)數(shù)從20向50增加時(shí),各個(gè)分類器的總體分類結(jié)果如圖5所示。從圖5中看出,普通的字典學(xué)習(xí)分類效果最差,當(dāng)每類訓(xùn)練樣本低于25個(gè)時(shí),DPLsub和稀疏多分類回歸(SMLR)分類效果相近,當(dāng)增加訓(xùn)練樣本時(shí),本文提出的PDLsub增長(zhǎng)速度最快。當(dāng)每類訓(xùn)練樣本是50個(gè)時(shí),各個(gè)分類器的分類精度的結(jié)果如表3所示,其分類效果圖如圖6所示。從圖6(a)可 以看出Corn-no-till、soybeans-no-till和soybeans-min-till三種類別出現(xiàn)較多的誤分類,其他類別分類效果很好。從圖6(b)可以看出Corn-no-till、soybeans-no-till和soybeans-min-till三種類別的混淆現(xiàn)象嚴(yán)重,oats、Wood、Grass/trees的分類幾乎無(wú)誤,其他類別有少量的樣本被誤分類。從圖6(c)看出Corn-no-till、soybeans-no-till和soybeans-min-till的混淆分類情況也很多,soybeans-no-till和soybeans-clean-till之 圖5 隨著訓(xùn)練樣本個(gè)數(shù)增加時(shí)各個(gè)分類器的分類結(jié)果 圖6 不同分類器基于空間-光譜特征的分類結(jié)果圖 間也出現(xiàn)誤分類,其他類別分類效果很好。從圖6(d)看出相對(duì)于前兩種PDL和SMLR而言,LS-SVM對(duì)Corn-no-till、soybeans-no-till和soybeans-min-till識(shí)別率較高,但是其它類別的樣本識(shí)別率有所下降,而從圖6(e)看出,DL-OMP分類效果較差,各類別的分類精度都很低。 表3 不同分類器基于空間-光譜特征的分類結(jié)果 3.2 HYDICE Washington DC數(shù)據(jù)的試驗(yàn) 3.2.1 實(shí)驗(yàn)概述 在實(shí)驗(yàn)中使用的第二個(gè)高光譜圖像是HYDICE高光譜傳感器系統(tǒng)在Washington DC Mall上空的拍攝,數(shù)據(jù)大小為1280×307,包括有210個(gè)連續(xù)波段(400~2400nm),去除水吸收波段范圍的900~1400nm,還剩下191個(gè)波段用于本實(shí)驗(yàn)分析。HYDICE高光譜圖像的標(biāo)準(zhǔn)假彩色合成圖如圖7(a)所示。該數(shù)據(jù)共包括7類,各個(gè)類別和各個(gè)類別樣本的數(shù)量如圖7(b)所示。 圖7 HYDICE Washington DC圖像 3.2.2 實(shí)驗(yàn)結(jié)果及討論 本次使用第二組實(shí)驗(yàn)數(shù)據(jù)比較DPLsub和DPL及其他三種分類器分類結(jié)果。當(dāng)每類訓(xùn)練樣本的個(gè)數(shù)為30時(shí),各個(gè)分類器的總體分類結(jié)果如表4所示,其分類效果圖如圖8所示。從表4中看出,本文提出的DPLsub分類效果較好。從圖8(a)看出,PDLsub分類效果圖最好,尤其是對(duì)Path、Grass和Tress的識(shí)別,其他分類器對(duì)Path的識(shí)別率效果都不近如人意。從圖8(b)看出PDL對(duì)Roofs和Street兩種類別混淆較多,對(duì)Water、Grass和Tress的識(shí)別率較高。從圖8(c)看出SMLR對(duì)Water和Roofs的識(shí)別率相對(duì)較低,對(duì)Grass和Tress識(shí)別率相對(duì)良好。從圖8(d)看出LS-SVM對(duì)Roofs、Street及Shadow類別的識(shí)別率較低,對(duì)Water和Grass的識(shí)別率較良好,從圖8(e)看出,DL-OMP識(shí)別效果最差,而Water有較高的識(shí)別率,但是DL-OMP識(shí)別時(shí)間很長(zhǎng)。 表4 不同分類器基于空間-光譜特征的分類結(jié)果 圖8 不同分類器基于空間-光譜特征的分類結(jié)果圖 本文將字典偶學(xué)習(xí)(DPL)算法用于高光譜圖像分類,它通過(guò)學(xué)習(xí)得到綜合字典和分析字典,從而進(jìn)行特征的表示和識(shí)別,在提高分類的準(zhǔn)確性的同時(shí)大大降低了訓(xùn)練和測(cè)試階段的計(jì)算時(shí)長(zhǎng)。其次,字典偶學(xué)習(xí)算法利用了類標(biāo)簽信息,提升了編碼的識(shí)別能力。當(dāng)子空間添加到字典偶學(xué)習(xí)中時(shí),不僅可以更好地表征噪聲和高度混合的像元,而且降低了光譜特征的維度,實(shí)驗(yàn)結(jié)果表明這種分類器結(jié)構(gòu)簡(jiǎn)單、容易訓(xùn)練、收斂速度快,是一種有效的遙感圖像分類方法。 利用字典偶學(xué)習(xí)模型和算法的進(jìn)一步研究工作是:(1) 為了更好地區(qū)分易混淆的類別,可以選取更具有代表性的地物特征用于訓(xùn)練,有利于分類精度提高和速度提升;(2) 可以添加紋理信息助于區(qū)分地物;(3) 可以針對(duì)不同的類別使用的不同的分類器,聯(lián)合多種分類器進(jìn)一步提高分類效果。 [1] 蘇紅軍, 杜培軍, 盛業(yè)華. 高光譜遙感數(shù)據(jù)光譜特征提取算法與分類研究. 計(jì)算機(jī)應(yīng)用學(xué)報(bào), 2008,25(2):390-395 [2] Falco N,Benediktsson J A,Bruzzone L. A study on the effectiveness of different independent component analysis algorithms for hyperspectral image classification.IEEEjournalofselectedtopicsinappliedearthobservationsandRemoteSensing, 2014,7(6):2183-2198 [3] Zhou Y, PengY, Chen C L P. Dimension reduction using spatial and spectral regularized local discriminant embedding for hyperspectral image classification.IEEETransactionsonGeoscienceandRemoteSensing, 2015,53(2):1082-1094 [4] 羅文斐, 鐘亮, 張兵等. 基于子空間距離的高光譜圖像光譜解混算法. 自然科學(xué)進(jìn)展, 2008,18(10):1175-1180 [5] Khodadadzadeh M, Li J, Plaza A, et al. A subspace-based multinomial logistic regression for hyperspectral image classification.IEEEgeoscienceandremotesensingletters, 2014,11(12):2105-2109 [6] Gao L, Li J, Khodadadzadeh M, et al. Subspace-based support vector machines for hyperspectral image classification.IEEEgeoscienceandremotesensingletters, 2015,12(12):349-353 [7] Fang L, Li S, Kang X, et al. Spectral-spatial hyperspectral image classification via multiscale adaptive sparse representation.IEEETransactionsongeoscienceandremotesensing, 2014,52(12):7738-7749 [8] Fauvel M, Tarabalka Y, Benedktsson J A, et al. Advances in spectral-spatial classification of hyperspectralimages.ProceedingsoftheIEEE, 2013,101(3):652-675 [9] 趙春暉, 喬蕾. 基于改進(jìn)的最小二乘支持向量機(jī)的高光譜遙感圖像分類. 應(yīng)用科技, 2008,35(1):44-48 [10] Li J, Huang X, Gamba P, et al. Multiple feature learning for hyperspectral image classification.IEEETransactionsongeoscienceandremotesensing, 2015,53(3):1592-1605 [11] Zongze Y, Hao S, Kefeng J, et al. Hyperspectral image classification using discriminative dictionary learning.EarthandEnvironmentalscience, 2014,17(1).682-691 [12] Yuan H L, Tang Y Y, Lu Y, et al. Hyperspectral image classification based on regularized sparse representation.IEEEjournalofselectedtopicsinappliedearthobservationsandremotesensing, 2014,7(6):2174-2182 [13] Benediktsson J A, Pesaresi M. Feature extraction and classification of urban high-resolution satellite imagery based on morphological preprocessing.IEEEInternationalGeoscience&RemoteSensingSymposium, 2001,1:534-536 [14] Benediktsson J A, Palmason J A, Sveinsson J R. Classification of hyperspectral data from urban areas based on extended morphological profiles.IEEETransactionsonGeoscienceandRemoteSensing, 2005,43: 480-491 [15] Mura M D, Benediktsson J A, Waske B, et al. Extended profiles with morphological attribute filters for the analysis of hyperspectral data.InternationalJournalofRemoteSensing, 2010,31(22):5975-5991 [16] Li J, Bioucas-Dias J M, Plaza A. Spectral-spatial hyperspectral image segmentation using subspace multinomial logistic regression and Markov random fields.IEEETransactionsongeoscienceandremotesensing, 2012,50(3):809:822 [17] Gu S, Zhang L, Zuo W, et al. Projective dictionary pair learning for pattern classification.AdvancesinNeuralInformationProcessingSystems, 2014, 1: 793-801 Subspace-based dictionary pair learning for hyperspectral image classification Wang Jinjia, Jiang Xue, Yang Zhongyu (School of Information Science and Engineer, Yanshan University, Qinhuangdao, Hebei 066004) In view of the problem of huge data amount from hyperspectra’s high resolution and the mixed pixels problem from the spatial resolution, a subspace-based dictionary pair learning (DPL) algorithm, abbreviated to DPLsub algorithm, was presented. The DPL algorithm is an improvement of the dictionary learning, which reflects the high efficiency in pattern recognition through learning a synthesis dictionary and an analysis dictionary, while the subspace projection method better characterizes noise and highly mixed pixels. The fusion of spectra and spatial characteristics was applied to the classification experiment, and two hyperspectral images were used as the experimental data to compare the classification result of the DPLsub model with that of the other three classifiers of least squares support vector machine (LS-SVM), sparsemultinomial logistic regression (SMLR) and dictionary learning (DL-OMP). The experimental results verifies the feasibility and effectiveness of the proposed DPLsub algorithm in classification of hyperspectral images, and show that it outperforms other current algorithms in time and accuracy. hyperspectral image classification, subspace projection, mixed pixels, dictionary pair learning (DPL), fusion features 10.3772/j.issn.1002-0470.2016.05.008 ①國(guó)家自然科學(xué)基金(61273019, 61473339),河北省自然科學(xué)基金(F2013203368),中國(guó)博士后科學(xué)基金面上項(xiàng)目(2014M561202),河北省博士后專項(xiàng)項(xiàng)目(B2014010005)和河北省青年拔尖人才支持計(jì)劃([2013]17)資助項(xiàng)目。 2016-03-07) 姜 雪 楊中玉 ②男,1979年生,博士,教授;研究方向:模式識(shí)別與圖像處理;聯(lián)系人,E-mail: wjj@ysu.edu.cn3 實(shí)驗(yàn)與討論
4 結(jié) 論