劉建軍 吳澤彬 韋志輝 肖 亮 孫 樂
(南京理工大學(xué)計(jì)算機(jī)學(xué)院 南京 210094)
在高光譜場(chǎng)景中,遙感器可以從可見光到紅外光譜區(qū)域數(shù)百個(gè)狹窄且連續(xù)的波段上,獲取數(shù)字圖像。高光譜圖像中的每個(gè)像元都以向量形成存在,其不同元素對(duì)應(yīng)不同波段下的光譜響應(yīng)值。通常不同的物質(zhì)在特定的波段上反射不同的電磁能量,從而可以根據(jù)光譜特征來區(qū)別不同的物質(zhì)。高光譜圖像在軍事監(jiān)視、環(huán)境監(jiān)測(cè)、礦物識(shí)別等領(lǐng)域得到廣泛的應(yīng)用[1-4],其中分類是高光譜圖像分析的最重要內(nèi)容之一。在現(xiàn)有的分類方法中,支持向量機(jī)(Support Vector Machines, SVM)是高維數(shù)據(jù)監(jiān)督分類的有效方法,且在高光譜分類中得到了好的分類效果[5]。然而SVM方法只利用了高光譜圖像的光譜維信息,沒有考慮高光譜數(shù)據(jù)的圖像特征,在分類的過程中沒有充分挖掘圖像空間相鄰數(shù)據(jù)之間的信息。有學(xué)者嘗試對(duì) SVM 方法進(jìn)行改進(jìn),采用修改核函數(shù)的方法[6,7],將高光譜圖像的空間信息加入分類中,獲得了較好的分類結(jié)果。
隨著壓縮感知和稀疏表示理論的發(fā)展,一些學(xué)者提出采用稀疏表示進(jìn)行分類[8,9],其假設(shè)高光譜像元可以由一些訓(xùn)練樣本組成的結(jié)構(gòu)化字典的線性組合稀疏表示。該方法首先通過求解稀疏度約束的最優(yōu)化重構(gòu)模型,得到字典原子權(quán)值組成的稀疏向量,然后根據(jù)恢復(fù)稀疏向量的特征,確定測(cè)試像元的類別。
高光譜圖像中往往包含一些相似的區(qū)域,這些區(qū)域內(nèi)相鄰的像元通常包含相同的物質(zhì),因而具有相似的光譜特征[7]?,F(xiàn)有研究表明,利用上下文信息進(jìn)行高光譜圖像分類可以有效提高分類精度[6-8]。為此,本文提出了一種基于空間相關(guān)性約束稀疏表示的高光譜圖像分類方法。首先建立高光譜圖像分類的稀疏表示模型,然后通過添加像元間的光滑性約束和訓(xùn)練樣本的空間位置信息,用以提高分類精度,最后采用交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)[10,11]求解模型。
其中為實(shí)數(shù),?i=1,2,…,Nn。
對(duì)于一個(gè)測(cè)試樣本x,它的類別是未知的。定義這N類的J個(gè)訓(xùn)練樣本的聯(lián)合為矩陣A∈RL×J。
則測(cè)試樣本x的線性表示可以重寫為
通過求解以下最優(yōu)化模型:
可以得到等式x=As的稀疏解,其中λ>0 用于平衡稀疏度和重構(gòu)精度。
對(duì)于一個(gè)未知類別的向量x,通過分析恢復(fù)的稀疏向量,可以確定其類別[8,9]。定義第n類的冗余為
高光譜圖像相鄰像元通常包含相似的物質(zhì),其光譜特征具有相似性,利用高光譜圖像像元間的這種相關(guān)性,可以有效提高分類的準(zhǔn)確性[6-8]。進(jìn)一步分析像元間的空間相關(guān)性,可以發(fā)現(xiàn)這種相關(guān)性通常表現(xiàn)為像元間的平滑性。為此,本文引入Tikhonov正則項(xiàng)[12],則基于空間相關(guān)性約束的稀疏表示模型可表示為
其中l(wèi)0(x)表示示性函數(shù)(當(dāng)x=0,l0(x)=0 ;x≠0,l0(x)=∞),SΛ表示X中訓(xùn)練樣本A對(duì)應(yīng)的系數(shù)矩陣(有XΛ=A),I為單位矩陣。通過重寫最優(yōu)化問題式(8),我們得到
最優(yōu)化問題式(9)亦可以轉(zhuǎn)化為如下緊湊的形式:
其中
最優(yōu)化問題式(10)是一個(gè)典型的約束最優(yōu)化問題,可以采用交替方向乘子法(ADMM)求解。令
算法設(shè)計(jì)如下
(1)設(shè)置k=0,選擇μ>0,初始化S(0),V(0),D(0);
(2)計(jì)算S(k+1)← a rgminSL(S,V(k),D(k));
(3)計(jì)算V(k+1)←argminVL(S(k+1),V,D(k)),即求解以下3個(gè)優(yōu)化問題:
(5)如果滿足停止條件,結(jié)束算法;否則,k←k+1,算法轉(zhuǎn)至第(2)步。
上述算法中,步驟(2)中的最優(yōu)化問題可寫為
其解可以表示為
其中表示Λ的補(bǔ)集。步驟(3)中的第1個(gè)最優(yōu)化問題的解為典型的軟閾值:
其中soft(z,u)=sign(z)max{|z|-u,0}。在其它兩個(gè)優(yōu)化問題中,由于H算子獨(dú)立對(duì)矩陣每一行作變換,可以將它們按行分為多個(gè)子優(yōu)化問題。分解后的這些子問題都是凸優(yōu)化問題,其歐拉方程可采用Gauss-Seidel方法求解[13,14]。
在本節(jié)中,采用兩組高光譜遙感圖像數(shù)據(jù)集驗(yàn)證本文方法的有效性。本文提出方法與以下3個(gè)算法比較:SVM[5]、基于圖割核的 SVM(SVM-GK)[6]和L1稀疏表示分類方法[8,9]。實(shí)驗(yàn)從各類識(shí)別精度、總精度和Kappa系數(shù)方面進(jìn)行了量化分析,量化度量值采用 10次測(cè)試的平均值,最優(yōu)結(jié)果用粗體表示。
表1 Indian Pines實(shí)驗(yàn)數(shù)據(jù)和分類結(jié)果
實(shí)驗(yàn)采用的計(jì)算機(jī)硬件環(huán)境為Intel Xeon CPU W5590,內(nèi)存 12.0 GB,軟件環(huán)境為 Microsoft Windows 7, MATLAB 7.10。對(duì)于SVM和SVM-GK方法中的支持向量機(jī),其實(shí)現(xiàn)采用 MATLAB下的C語言混合編程。
實(shí)驗(yàn)中使用機(jī)載可見紅外成像光譜儀(AVIRIS)采集的美國(guó)印第安納州Indian Pines實(shí)驗(yàn)區(qū)的高光譜遙感圖像[7,8]。該圖像共包含220個(gè)波段,空間分辨率為20 m,圖像大小為145×145。去除20個(gè)水汽吸收和低信噪比波段后(波段號(hào)為 104-108,150-163, 220),選擇剩下的200個(gè)波段作為研究對(duì)象[8]。該地區(qū)共包含16種地物,隨機(jī)選擇其中標(biāo)定樣本的10%作為訓(xùn)練樣本,剩下的90%作為測(cè)試樣本[8]。表1中列出了這些地物及其訓(xùn)練測(cè)試樣本數(shù),各類地物真實(shí)分布圖如圖1(a)所示。
4種不同方法的分類結(jié)果如表1所示,圖1給出了它們的視覺比較??梢钥闯觯臻g相關(guān)性的加入可以大幅度提高算法的分類精度,SVM 方法從80.45%提高到 97.63%,稀疏表示方法從 73.24%提高到 98.67%。相對(duì)于 SVM-GK,本文方法的總精度和Kappa系數(shù)都較優(yōu),且對(duì)于大部分的地物其精度也較優(yōu)。與非空間相關(guān)性方法相比較,基于空間相關(guān)性的分類方法的錯(cuò)誤標(biāo)定僅局限在邊緣區(qū)域。
圖1 Indian Pines 數(shù)據(jù)集
為了測(cè)試各個(gè)方法受訓(xùn)練樣本數(shù)目的影響,我們采用不同百分比的訓(xùn)練樣本。在每次測(cè)試中,隨機(jī)選擇標(biāo)定數(shù)據(jù)的1%到25%作為訓(xùn)練樣本,且每類訓(xùn)練樣本數(shù)至少為 1,剩下的作為測(cè)試樣本。圖 2給出了比較結(jié)果。隨著樣本數(shù)的增加,各類方法的分類精度都有所提高。相對(duì)于非空間相關(guān)性方法,基于空間相關(guān)性的方法明顯較優(yōu)。本文方法在大部分情況下都優(yōu)于SVM-GK,受訓(xùn)練樣本數(shù)的限制,僅在1%的情況下低于SVM-GK。
圖2 各個(gè)算法不同訓(xùn)練樣本數(shù)下的比較
表2 各種分類方法的運(yùn)行時(shí)間(s)
為了直觀比較各類方法花費(fèi)的代價(jià),使用計(jì)算時(shí)間作為計(jì)算復(fù)雜度的度量。表2給出了幾種方法在不同訓(xùn)練樣本數(shù)下的運(yùn)行時(shí)間。從表中可以看出,SVM 的時(shí)間開銷最小,表現(xiàn)出了較低的計(jì)算復(fù)雜度。由于需要構(gòu)造復(fù)雜的核矩陣,基于空間相關(guān)性的SVM-GK的時(shí)間開銷高于其它幾種方法,計(jì)算復(fù)雜度較高。雖然本文方法復(fù)雜度明顯高于L1方法,但由于空間相關(guān)性的加入,減少了算法需要的迭代步數(shù),僅在較小訓(xùn)練樣本時(shí)運(yùn)算時(shí)間大于L1方法。
實(shí)驗(yàn)中使用反射光學(xué)光譜成像儀(ROSIS)采集的意大利帕維亞大學(xué)的高光譜遙感圖像[7,8]。該圖像共包含115個(gè)波段,波長(zhǎng)范圍為0.43-0.86μm,空間分辨率為1.3 m,圖像大小為610×340。在去除噪聲波段之后,選擇剩下的103個(gè)波段作為研究對(duì)象[7,8]。如表3所示,該地區(qū)共包含9種典型地物。我們選擇其中大約9%的標(biāo)定數(shù)據(jù)作為訓(xùn)練樣本,剩下的作為測(cè)試樣本[8]。圖 3(a)為各類地物真實(shí)分布圖,表3中給出對(duì)應(yīng)的訓(xùn)練測(cè)試樣本數(shù)。
表3 帕維亞大學(xué)實(shí)驗(yàn)數(shù)據(jù)和分類結(jié)果
圖3 帕維亞大學(xué)數(shù)據(jù)集
各種方法的分類結(jié)果如表3所示,圖3中給出了它們之間的視覺比較。可以看出,從視覺和定量化角度空間相關(guān)性方法都明顯優(yōu)于非空間相關(guān)性方法。本文方法獲得了較高的精度和Kappa系數(shù),在各類方法中表現(xiàn)最優(yōu)。
通過深入分析高光譜數(shù)據(jù)像元間的空間相關(guān)性問題,本文提出基于空間相關(guān)性約束稀疏表示的高光譜圖像分類方法。將空間相關(guān)性和訓(xùn)練數(shù)據(jù)的位置信息融入稀疏表示分類模型中,同時(shí)采用快速的交替方向乘子法求解模型。實(shí)驗(yàn)結(jié)果表明,本文方法不僅提高了稀疏表示分類方法的精度,而且優(yōu)于包含空間信息的支持向量機(jī)方法。在訓(xùn)練樣本數(shù)較少的情況下,其分類結(jié)果也比較穩(wěn)定。然而相對(duì)于SVM方法,基于稀疏表示分類方法的計(jì)算復(fù)雜度比較高,實(shí)時(shí)性較低。因此,如何設(shè)計(jì)稀疏表示分類方法的快速算法,將是本文下一步的研究重點(diǎn)。
[1]童慶禧, 張兵, 鄭蘭芬. 高光譜遙感: 原理、技術(shù)與應(yīng)用[M].北京: 高等教育出版社, 2006: 166-238.
Tong Qing-xi, Zhang Bing, and Zheng Lan-fen. Hyperspectral Remote Sensing: Theory, Technology and Applications [M].Beijing: Higher Education Press, 2006: 166-238.
[2]吳澤彬, 韋志輝, 孫樂, 等. 基于迭代加權(quán)L1正則化的高光譜混合像元分解[J]. 南京理工大學(xué)學(xué)報(bào), 2011, 35(4): 431-435.
Wu Ze-bin, Wei Zhi-hui, Sun Le,et al.. Hyperspectral unmixing based on iterative weightedL1regularization[J].Journal of Nanjing University of Science and Technology,2011, 35(4): 431-435.
[3]宋娟, 吳成柯, 張靜, 等. 基于分類和陪集碼的高光譜圖像無損壓縮[J]. 電子與信息學(xué)報(bào), 2011, 33(1): 231-234.
Song Juan, Wu Cheng-ke, Zhang Jing,et al.. Lossless compression of hyperspectral images based on classification and coset coding[J].Journal of Electronics&Information Technology, 2011, 33(1): 231-234.
[4]宋相法, 焦李成. 基于稀疏表示及光譜信息的高光譜遙感圖像分類[J]. 電子與信息學(xué)報(bào), 2012, 34(2): 268-272.
Song Xiang-fa and Jiao Li-cheng. Classification of hyperspectral remote sensing image based on sparse representation and spectral information[J].Journal of Electronics&Information Technology, 2012, 34(2): 268-272.
[5]Melgani F and Bruzzone L. Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing, 2004,42(8): 1778-1790.
[6]Valls C G, Shervashidze N, and Borgwardt K M. Spatiospectral remote sensing image classification with graph kernels[J].IEEE Geoscience and Remote Sensing Letters,2010, 7(4): 741-745.
[7]Plaza A, Benediktsson J A, Boardman J W,et al.. Recent advances in techniques for hyperspectral image processing [J].Remote Sensing of Environment, 2009, 113(9): 110-122.
[8]Chen Yi, Nasrabadi N M, and Tran T D. Hyperspectral image classification using dictionary based sparse representation[J].IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(10): 3973-3985.
[9]Wright J, Yang A Y, Ganesh A,et al.. Robust face recognition via sparse representation[J].IEEE Transaction on Pattern Analysis and Machine Intelligence, 2009, 31(2):210-227.
[10]Dias J M B and Figueiredo M A T. Alternating direction algorithms for constrained sparse regression: application to hyperspectral unmixing[C]. 2nd Workshop on Hyperspectral Image and Signal Processing: Evolution in Remote Sensing,Reykjavík, Iceland, 2010: 1-4.
[11]Deng Wei, Yin Wo-tao, and Zhang Yin. Group sparse optimization by alternating direction method [R].Department of Computational and Applied Mathematics,Rice University, 2011.
[12]Wen Y W, Michael K N, and Ching W K. Iterative algorithms based on decoupling of deblurring and denoising for image restoration[J].SIAM Journal on Scientific Computing, 2008, 30(5): 2655-2674.
[13]Goldstein T and Osher S. The split bregman method for l1 regularized problems[J].SIAM Journal on Imaging Sciences,2009, 2(2): 323-343.
[14]Iordache M D, Dias J M B, and Plaza A. Total variation spatial regularization for sparse hyperspectral unmixing[J].IEEE Transactions on Geoscience and Remote Sensing, 2011,DOI: 101109/TGRS.2012.2191590.