周 冰,李秉璇,賀 宣,劉賀雄,王法臻
陸軍工程大學石家莊校區(qū),河北 石家莊 050000
陸基條件下的高光譜成像一般指的是用手持或者小型無人機[1]為載體的成像光譜儀進行成像; 不同于傳統(tǒng)遙感光譜圖像分類,陸基條件下的高光譜目標分類,訓練樣本不僅較難獲得,并且在陸基條件下的高光譜圖像中,訓練樣本之間的相關性隨著目標類型、探測器參數(shù)以及成像環(huán)境等因素時刻發(fā)生變化。對于陸基高光譜圖像來說,使用基于固定范數(shù)約束的稀疏編碼策略無法適應陸基條件下高光譜成像多變的環(huán)境,針對這一問題,提出一種新的融合自適應稀疏表示與相關系數(shù)的高光譜圖像分類方法,有效解決陸基高光譜圖像分類的問題,通過兩組高光譜圖像實驗,驗證了本算法的有效性與魯棒性。
D=[D1,D2,D3,…,Dc]
=[a1, 1,a1, 2,a1, 3,…,ac, nc]
(1)
一個來自光譜空間的未知樣本x∈Rd可以通過聯(lián)合字典線性表示,如式(2)所示
x=Dα
(2)
其中,α=[0, …, 0,ai, 1,ai, 2, …,ai, ni, 0, …,0]T∈Rn為x的稀疏系數(shù)向量,稀疏系數(shù)向量α中的非零元素個數(shù)被稱為稀疏度,在給定聯(lián)合字典D的情況下,α可以通過式(3)來得到。
s.t. ‖α‖0≤K
(3)
(4)
在實際應用中,想完全獲得互不相關的訓練樣本難度比較大,并且在很多場景中往往難以獲得足夠的訓練樣本,基于聯(lián)合字典表示的方法能夠解決小樣本的問題[2]。聯(lián)合字典表示是用所有類別的字典來表示待測樣本x,所有c類的訓練樣本組成的聯(lián)合字典為D=[D1,D2, …,Dc], 待測樣本x可以由式(5)表示。
(5)
但用全部訓練樣本進行聯(lián)合表示在實際應用中可能無法獲得與待測樣本同類的訓練樣本,此時如何對待測樣本進行分類都將是錯誤的,聯(lián)合表示(collaborative representation based classification[3])將每一個樣本都使用聯(lián)合字典的所有元素進行表示,這導致無法分辨待測樣本的有效性。陸基條件下的高光譜圖像受太陽高度角、探測時間、探測器的天頂角、探測器與太陽的方位角都會影響地物的光譜曲線,同種地物在不同的成像條件下很容易出現(xiàn)不同譜的情況。同樣,陸基條件下的高光譜圖像的訓練樣本不僅較難獲取,而且訓練樣本隨著環(huán)境條件、成像條件、探測器參數(shù)也會不斷變化,單純使用稀疏表示或者聯(lián)合表示都不能滿足陸基條件下的使用要求。自適應稀疏表示(adaptive sparse representation based classification,ASRC)是融合了稀疏表示和聯(lián)合表示的稀疏表示方法,其模型為
(6)
其中diag()是對角化算符,‖Ddiag(α)‖*的定義如式(7)所示
(7)
訓練樣本的相關性隨著實際拍攝的場景變化而變化,當訓練樣本完全互不相關時,此時樣本字典的原子之間應該相互正交,即DTD=I,此時的稀疏表示模型變化為式(8),此時的自適應稀疏分類變?yōu)镾RC。
=‖α‖1
(8)
當實際場景中的訓練樣本之間相關系數(shù)為1時,樣本字典D=d1T,d為2范數(shù)的歸一化樣本,此時稀疏模型變化如式(9)所示,自適應稀疏分類變?yōu)镃RC。
=‖α‖2
(9)
由以上分析可知,自適應稀疏表示不使用固定的范數(shù)約束,能夠根據(jù)訓練樣本的變化并且自適應的調(diào)節(jié)稀疏項,能夠適用于陸基條件下訓練樣本的多變性,提高分類精度。
陸基條件下的高光譜圖像相比于遙感圖像的光譜間相關性更大,強相關的像素更多,而這些強相關的像素在進行稀疏分類時重構誤差往往較小,是導致誤分、錯分的主要原因。常用的分類器例如KNN[4]分類器中使用的歐式距離并不是測量兩個高光譜像素之間距離的最佳選擇,而相關系數(shù)(correlation coefficient)是確定兩個變量是否相關的有效指標,在此使用不同像素之間的相關系數(shù)來確定這些像素是否屬于同一類,測量相關系數(shù)的計算方法如式(10)所示。
(10)
接下來,我們計算像素x經(jīng)過ASRC重構產(chǎn)生重構誤差,樣本字典X=[X1,X2,X3, …,Xi]作為稀疏表示的字典,αi作為Xi的稀疏向量,待測樣本x可以通過字典和稀疏向量進行表示,如式(11)所示。
x=Xiαi
(11)
求出稀疏矩陣后,每一種類別的殘差都可以通過式(12)來計算。
(12)
最后,通過引入正則化參數(shù)λ來將CC值與ASR進行融合,通過式(13)來獲取待測樣本x的標簽,并將這種新的高光譜分類方法命名為CCASR。算法流程圖如表1所示。
表1 CCASR的算法流程圖Table 1 CCASR algorithm flow chart
Class(x)=arg min(ri(x)+λ×(1-cci(y)))
(13)
采用兩組實驗數(shù)據(jù)來驗證本算法的有效性,兩組實驗數(shù)據(jù)均是是通過基于聲光可調(diào)諧濾波器(AOTF)的高光譜成像儀HIS-300拍攝的高光譜圖像,第一組數(shù)據(jù)圖像大小為470×370像素,波段寬度為449~801 nm,波段間隔為4 nm,拍攝的天氣晴朗、無風、空氣質(zhì)量優(yōu)。高光譜成像儀在拍攝時的曝光時間為0.1 s,增益設置為0。
兩幅圖像均選擇25,50和85波段作為R,G和B三個通道合成假彩色圖像。實驗數(shù)據(jù)1的假彩色圖和灰度圖如圖1所示,實驗數(shù)據(jù)1的背景主要為綠色草地背景。拍攝場景中共有6種地物,按照從A到F的順序,依次為灌木叢、某型叢林迷彩作戰(zhàn)訓練服、綠色棉質(zhì)外套、某型作訓雨衣、兩種人工草皮。
圖1 實驗數(shù)據(jù)1的偽彩色圖像和灰度圖Fig.1 Gray scale and pseudo colour images of experimental data 1
實驗數(shù)據(jù)2的背景主要是荒漠背景,圖像為像素大小410×400像素大小,拍攝場景的偽彩色圖像和灰度圖如圖2所示,在圖中布置了三種偽裝物,從A到D的順序依次為某型荒漠叢林作戰(zhàn)訓練服、黃色偽裝板1、黃色偽裝板2以及荒漠叢林迷彩偽裝帽,E為荒漠背景,F(xiàn)為秋季淺黃色草皮,G為秋季闊葉樹木的樹葉。
圖2 實驗數(shù)據(jù)2的偽彩色圖像和灰度圖Fig.2 Gray scale and pseudo colour images of experimental data 2
使用實驗1的數(shù)據(jù)來測試本文所提方法的有效性,為了比較,采用了KNN,SRC,CRC,ASRC以及本文提出的CCASRC,但鄰域數(shù)量、稀疏度、正則化參數(shù)均會分別對KNN,SRC和CRC的分類精度產(chǎn)生影響。因此在進行對比實驗之前,有必要對每個算法的影響因素進行分析,對參數(shù)設置進行優(yōu)化,確保每個算法都在最佳狀態(tài)下進行分類。三種算法的分類識別精度隨著參數(shù)變化的影響如圖3所示。從三幅圖中可以看出,三種監(jiān)督算法的最佳參數(shù)N,K以及λ設置為2, 28, 10-2。
圖3 三種算法分類精度受參數(shù)設置的影響(a): 鄰域數(shù)量對KNN分類精度的影響; (b): K對SRC分類精度的影響; (c): 正則化參數(shù)對CRC分類精度的影響Fig.3 The classification accuracies of the three algorithm are affected by the parameter setting(a): The number of neighborhoods and KNN classification accuracy; (b): K and SRC classification accuracy;(c): Regularization parameter λ and CRC classification accuracy
CCASRC算法的主要影響參數(shù)是最近鄰域數(shù)量N和正則化參數(shù),如圖4所示,從圖中可以得到最近鄰域數(shù)量為6,正則化參數(shù)為0.5時的分類精度最高。同時可以看出當正則化參數(shù)設置為0時,分類方法完全變成自適應稀疏分類,融合了CC值后對分類精度有一定的提高,但當正則化參數(shù)過高時,算法精度又有所下降,這可以證明本文融合策略的有效性。隨著領域數(shù)量N的增加,本方法的分類精度先增加后減小,這是因為屬于同一類別的像素通常由相似的材料組成,但同時也容易受到陰影和其他成像因素的影響。
圖4 參數(shù)λ和N對CCASRC算法分類精度的影響Fig.4 The classification accuracy of CCASRC algorithm is impacted by the parameters λ and N
各個監(jiān)督方法中每個類別隨機選取10%的樣本作為訓練樣本,為了避免樣本隨機性的影響,每個實驗均重復5次并取平均值作為最后分類的結果,求得的分類對象對比如圖5所示,各個方法之間的分類精度矩陣直方圖如圖6所示。
圖5 綠地背景中各種分類方法的分類結果(a): K-means; (b): KNN; (c): SRC; (d): CRC; (e): ASRC; (f): CCASRCFig.5 Classification results of various classification methods in the background of green space(a): K-means; (b): KNN; (c): SRC; (d): CRC; (e): ASRC; (f): CCASRC
圖6 各種分類方法OA的矩陣直方圖Fig.6 Matrix histogram of various classification method OA
實驗的6種方法中,非監(jiān)督的K-means由于缺少先驗信息,分類結果相較于其他方法來說最差,本屬于灌木叢的大量像元被誤分到了背景類別中,各個目標之間的混分情況也比較嚴重,總體分類精度為65%,KC為0.53。5種監(jiān)督方法中,KNN方法表現(xiàn)最差,將灌木叢的像元誤分到了目標B和E以及背景中,CRC和SRC都將屬于灌木叢的像元分類到了偽裝物E類別中,ASRC分類結果相對較好,但分類圖中出現(xiàn)了較多的“麻點”,偽裝目標分辨率較低。CCASR分類精度達到了88.5%,相對于其他方法最高,并且分類圖中的各種目標清晰可見,尤其在陰影部分相較于ASRC分類錯誤相對減少,“麻點”效應大大減弱,KC系數(shù)為0.86,說明CCASRC的分類一致性也較好。
實驗2針對荒漠背景下的高光譜圖像進行分類,使用KNN、SRC、CRC以及本方法對圖像進行分類,得到的分類結果圖如圖7所示,分類精度表如表2所示。
表2 各個地物及背景的分類OA,AA及KappaTable 2 Classification of various features and backgrounds OA and Kappa
圖7 荒漠背景中各種方法的分類結果(a): SRC; (b): CRC; (c): ASRC; (d): CCASRCFig.7 Classification results of various methods in desert background(a): SRC; (b): CRC; (c): ASRC; (d): CCASRC
從以上的實驗結果可以看出,四種分類方法都能識別出四種偽裝物體,但從分類圖像和Kappa系數(shù)來看,CCASRC在分類一致性和背景分類精度上具有明顯的優(yōu)勢。具體來看,SRC方法的分類結果“麻點”最多,雖然沒有出現(xiàn)成塊的分類錯誤,但各個地物及背景的分類精度都不高,并且Kappa系數(shù)只有0.684。SRC和ASRC在進行分類時都出現(xiàn)了成塊的分類錯誤,SRC將左下角的背景F的像素誤分為了背景G,ASRC將背景E中很大一部分像素誤分為了偽裝物B,而CCASRC擁有最高的分類精度,圖中的場景“麻點”較少,偽裝物清晰可見。這主要是因為陸基條件下的高光譜圖像分類很難獲得精準的樣本,同一類別中獲得的樣本相關性較高,而本文提出的CCASRC不僅能夠考慮樣本的選擇,同時能夠考慮樣本集的相關性,與相關系數(shù)融合能夠克服圖像中的破壞性因素(比如陰影,噪聲點等),在獲得較高分類精度的同時可以保持分類的一致性。
結合了陸基條件下的高光譜圖像特點,提出了一種針對陸基條件下高光譜圖像的分類方法,對研究陸基條件下的高光譜圖像分類具有一定的指導意義。該方法通過引入正則化參數(shù),融合了自適應稀疏表示和相關系數(shù),既能兼顧樣本數(shù)量以及樣本之間的相關性,同時對于圖像中的破壞性因素(比如陰影、噪聲點等)具有一定的抗干擾性,通過綠地背景以及荒漠背景下的高光譜圖像進行了分類實驗,實驗結果表明,本方法分類精度有了一定的提高,并且分類一致性較好,可以應用于陸基條件下的高光譜圖像分類。