楊 佳,華文深,劉 恂,馬左紅
(1.軍械工程學(xué)院,河北 石家莊050003;2.解放軍73101部隊,江蘇 徐州221000)
在經(jīng)歷了全色成像、彩色攝影、多光譜掃描成像階段后,20世紀80年代出現(xiàn)了成像光譜的概念。高光譜成像是利用連續(xù)的窄小波段獲取目標(biāo)有關(guān)信息的技術(shù),高光譜數(shù)據(jù)將傳統(tǒng)的圖像維和光譜維信息融為一體,在獲取目標(biāo)空間圖像的同時,得到每個圖像單元對應(yīng)的光譜信息,這樣,在基于空間維度進行目標(biāo)分類識別的同時,能夠從光譜維度依光譜特征實現(xiàn)目標(biāo)信息的反演和識別。
高光譜數(shù)據(jù)中波段數(shù)量多,波段之間相關(guān)性強,信息冗余多,使數(shù)據(jù)處理難度加大。為了有效地利用高光譜數(shù)據(jù)的豐富信息,同時較快地完成數(shù)據(jù)處理,就需要對原始數(shù)據(jù)進行降維[1]。波段選擇便是降維的重要方法之一,依據(jù)一定的判據(jù)從全部波段中選出最能表示目標(biāo)特征的若干波段,并以此來表示整個數(shù)據(jù)集。該方法克服了變換法改變圖像特性的缺點,較好地保留了最原始的數(shù)據(jù)信息,更有利于保持圖像的原有特性,成為高光譜數(shù)據(jù)降維的重要研究方向[2-6]。
波段選擇應(yīng)遵循以下3個原則[7]:
1)所選的波段信息量盡可能豐富;
2)所選的波段之間相關(guān)性盡可能小,保持各波段的獨立性和有效性;
3)所選的波段組合對識別或分類目標(biāo)的光譜特性差異要最大、類別可分性要強。
在現(xiàn)階段研究中,波段選擇的基本算法可以分為2類:一種是基于信息量的最佳波段選擇方法,如最佳指數(shù)因子法、波段指數(shù)法、自適應(yīng)波段法等;另一種是基于類間可分性的波段選擇方法,如計算離散度、光譜相關(guān)系數(shù)、波段分組等。這些方法在計算過程中,只是單獨考慮波段信息量或類間可分性,導(dǎo)致在對已知光譜特征的目標(biāo)進行分類時,效果不夠理想。為解決這一問題,本文將波段信息量與可分性綜合進行考慮,在保證信息量最大的前提下,對波段的類間可分性進行分析,從而找到分類精度較高的波段組合。使用K-L散度(Kullback-Leibler divergence)計算波段信息量差異,利用光譜可分性距離計算類間可分性,得到最優(yōu)波段組合,實現(xiàn)針對特定目標(biāo)的波段選擇。
常見的相似性度量方法有光譜角制圖、光譜信息散度和相關(guān)系數(shù)等,它們可以分別從不同方面描述兩波段的相似性。為了在波段選取的過程中,即保證所選波段信息量豐富,又能去除臨近波段之間大量的冗余信息,這里使用K-L散度來衡量波段間的相似程度以及波段之間信息量大小的關(guān)系。K-L散度是一種在信息論中得到廣泛應(yīng)用的信號相似度度量[8]。對于2個概率分布為P和Q的離散隨機信號,Q相對于P的K-L散度可以按照(1)式進行計算:
即按照概率P求得的P和Q對數(shù)差的平均值,并且當(dāng)且僅當(dāng)∑iP(i)=∑iQ(i)=1時才有意義。
將K-L散度應(yīng)用到高光譜圖像處理時,把每一個波段看作一個隨機變量,即可求出任意2個波段的相似性[9]。假設(shè)一組高光譜數(shù)據(jù)有L個波段,表示為Y=[y1,y2,…,yL],其中yi(1≤i≤L)是N維波段列向量,代表波段i上N 個像元光譜分量。將yi進行歸一化,得到,那么第j個波段相對于第i個波段的K-L散度為
式(2)的物理意義是用第j個波段來表示第i個波段所需信息量的大小。K-L散度越大,說明完全用第j個波段來表示第i個波段的難度越大,即2個波段之間的相似度越低[10]。
為了完成針對特定目標(biāo)的最優(yōu)波段選擇,需要對高光譜數(shù)據(jù)進行光譜可分性距離的計算,分析不同地物類別在哪些波段上最容易區(qū)分。高光譜數(shù)據(jù)是地物對電磁波反射信息和自身輻射信息的綜合,本質(zhì)上記載了地物的總輻射量,即像元亮度值,稱為DN值(digital number)。不同地物由于結(jié)構(gòu)、組成成分和物理化學(xué)性質(zhì)不同,導(dǎo)致其光譜特性存在著差異?;诖耍捎霉庾V混合距離可以有效地對光譜可分性距離進行計算。光譜的混合距離計算公式如下“
式中:Dkl為光譜的混合距離;ykm、ylm分別為第k類和第l類地物在m波段上的光譜亮度值。對于任意的兩類地物,光譜混合距離越大,說明在該波段或波段組合上的可分性越好,判讀效果也就越好。
算法主要由4步組成:
HBO經(jīng)過??瓢l(fā)展已具有穩(wěn)定安全的治療方案,嚴重不良反應(yīng)罕見,目前最常見的不良反應(yīng)是中耳氣壓傷,其發(fā)生受加減壓速度和咽鼓管功能影響。由于鼻腔手術(shù)后常有黏膜腫脹和分泌物積蓄,故治療前應(yīng)保持鼻腔、鼻竇口和咽鼓管的通暢,預(yù)防中耳和鼻竇氣壓傷的發(fā)生。本次實驗中未觀察到實驗動物發(fā)生明顯不良反應(yīng)。綜上所述,早期HBO治療在鼻腔手術(shù)后黏膜的恢復(fù)過程中,對抑制纖維結(jié)締組織增生和減少瘢痕形成具有促進作用,可減輕鼻內(nèi)鏡手術(shù)后的去黏膜化反應(yīng),甚至可能在一部分難治性鼻-鼻竇炎中起到重要的逆轉(zhuǎn)作用。
1)選擇初始波段對波段子集進行初始化,產(chǎn)生集合φ1={B1},其中B1為初始波段,與其他各波段的K-L散度值之和最大。
2)計算剩余波段與φ1中各元素的K-L散度,找到K-L散度值最大的對應(yīng)波段B2,它與φ1中元素最不相似,加入1)的波段子集中,即φ2=φ1∪{B2}。
3)循環(huán)步驟2),直到φx中的波段數(shù)目達到設(shè)定閾值。
4)在φx的波段中,對特定目標(biāo)進行光譜可分性分析,去掉地物可分性距離小的波段,得到最終的波段子集φ。
實驗所采用的高光譜數(shù)據(jù)有89個波段,波長范圍從0.45μm~0.80μm,光譜分辨率為4nm。取第15、30、57波段分別作為R、G、B分量合成假彩色圖,如圖1所示。
圖1 波段15、30、57合成的偽彩色圖像Fig.1 Pesudo color image at channel 15,30,57
初始波段的選擇對于整個波段選擇過程具有決定性的作用。計算任意2個波段之間的K-L散度,找到相似性最低的2個波段(波段28與波段64)組成初始波段集。實際應(yīng)用中,最優(yōu)波段組合中的波段數(shù)目與圖像復(fù)雜程度有關(guān),圖像越復(fù)雜、包含的地物種類越多,所需要的波段數(shù)目就越大,從而為后續(xù)的目標(biāo)分類與探測過程提供足夠的數(shù)據(jù)支撐。圖像中主要有偽裝目標(biāo)、草坪、樹木、屋頂、路面等5種地物,設(shè)置波段個數(shù)為6個,可以滿足圖像分類需要。
最終通過K-L散度計算得到包含6個波段的波段子集是φ={28,62,84,82,51,26}。各波段的灰度圖如圖2所示。
圖2 波段選擇結(jié)果Fig.2 Result of band selection
波段子集中,各波段分布均勻,不在成像光譜范圍的兩端,受到儀器本身干擾和其他噪聲干擾較少,比較理想。
圖3 5種地物的光譜曲線Fig.3 Spectral curves of 5 kinds of ground objects
為選出目標(biāo)與不同背景地物的最佳3波段(用于合成偽彩色圖像),在表1中列出的波段組合中選取最優(yōu)波段子集中相關(guān)性最小,包含信息最多的3個波段:28、51、84。這3個波段出現(xiàn)的頻率比較高,它們之間的相關(guān)系數(shù)分別為:0.825 5、0.755 0、0.710 1,相對其他波段組合相關(guān)系數(shù)較小,所以選取這3個波段用于整幅圖像的最佳3波段組合,將波段84(781nm)賦予紅色、波段28(557nm)賦予綠色、波段51(649nm)賦予藍色。得到如圖4所示的合成后的偽彩色圖像。
表1 區(qū)別目標(biāo)與其他種類地物的最優(yōu)波段子集Table 1 Optimal subset of bands for distinguishing target and other kinds of ground objects
圖4 波段84、28、51合成的偽彩色圖像Fig.4 Pesudo color image at channel 84、28、51
為了驗證所選波段的分類效果,利用光譜角制圖法對圖像進行分類。
光譜角制圖(spectral angle mapper,SAM)以光譜角為基礎(chǔ),將每條光譜都視為波譜空間的一個矢量,根據(jù)矢量夾角來確定兩條光譜間的相似程度。夾角越小,說明像元與參考光譜越相似,分入該類;夾角超過指定的弧度閾值,則不被分為該類。在分類過程中,可以消除或減弱因太陽入射角、地形、觀測角等因素引起的光譜變異的同物異譜現(xiàn)象,適用于高光譜數(shù)據(jù)分類。以選出的3波段28、51、82為例進行分類,設(shè)定各類地物分類時的光譜角閾值,光譜角從0開始,以0.01rad為單位逐漸增大,找到能夠使各類地物分類精度高且錯分精度小的光譜角作為閾值,結(jié)果如表2所示。
表2 各類地物光譜角閾值Table 2 Spectral angle thresholds of ground objects
利用表2中的光譜角閾值對圖像進行分類得到如圖5所示的分類結(jié)果,地面參考圖像進行對比,得到混淆矩陣如表3所示。混淆矩陣,又稱誤差矩陣,行中各元素表示分類結(jié)果中某類集合與參考圖像中各類集合的交集像元個數(shù);列中各元素表示參考圖像中某類集合與分類結(jié)果中各類集合的交集像元個數(shù);列總計為參考圖像中某類所有像元個數(shù)的之和。利用混淆矩陣,計算Kappa系數(shù)和分類精度對分類效果進行評價。
表3 分類后的混淆矩陣Table 3 Confusion matrix of classification
Kappa=(總體精度-期望精度)/(1-期望精度)。Kappa值大于80%,說明分類圖像與參考圖像吻合度很好,40%~80%表示吻合度中等,40%表示吻合度很差。經(jīng)過計算,Kappa系數(shù)為0.887 8,說明分類效果較好。
圖5 分類結(jié)果Fig.5 Result of classification
總體分類精度=(正確分類的像元數(shù)/總像元數(shù))=(29 185/31 656)=92.2%。
其中5種類別地物的分類精度分別為:97.14%、57.81%、99.68%、95.67%、72.98%。從計算結(jié)果可以看出,整個分類過程對草地、道路、屋頂分類精度比較高,而對偽裝目標(biāo)與樹木分類精度較低。分析造成分類精度較低的原因主要有以下幾個方面:第一,分類過程受主觀因素影響較大。光譜角閾值是經(jīng)過反復(fù)實驗觀察得到,并不是最準(zhǔn)確的。閾值偏大,會將不同類別的像元歸入一類;閾值偏小,會將本該屬于一類的像元歸入不同類別。第二,所使用的偽裝材料與樹木在可見光部分光譜吻合比較好,難以區(qū)分,單純依靠可見光3波段的光譜角制圖法分類,得到的結(jié)果精度不高。加入紅外波段的研究將會使分類更加準(zhǔn)確,這也是將來工作的研究重點。
本文設(shè)計了一種基于K-L散度與光譜可分性距離的波段選擇算法。將每個波段的N個像元光譜分量看成一個N 維波段向量,利用K-L散度計算得到信息量大且相似性最小的波段組合,同時結(jié)合高光譜圖像中各類地物的連續(xù)光譜特征,計算它們的光譜可分性距離,距離越大,說明在該波段中可分性越好,最終得到可以用于合成假彩色圖像的3個波段。實驗結(jié)果表明,本文所用的算法在應(yīng)用到高光譜圖像的分類時能夠取得良好效果,是一種實用的高光譜圖像波段選擇算法。
[1] 張良培,張立福.高光譜遙感[M].武漢:武漢大學(xué)出版社,2005.ZHANG Liang-pei,ZHANG Li-fu.Hyperspectral remote sensing [M].Wuhan:Wuhan University Press,2005.(in Chinese)
[2] 劉建平,趙英時,孫淑玲.高光譜遙感數(shù)據(jù)最佳波段選擇方法試驗研究[J].遙感技術(shù)與應(yīng)用,2001,16(1):7-13.LIU Jian-ping,ZHAO Ying-shi,SUN Shu-ling.Experimental studies about methods on optimal bands selection of hyperspectral remote sensing datasets[J].Remote Sensing Technology and Application.2001,16(1):7-13.(in Chinese with an English abstrast)
[3] 楊金紅,尹球,周寧.一種改進的高光譜數(shù)據(jù)自適應(yīng)波段選擇方法[J].遙感技術(shù)與應(yīng)用,2007,22(4):513-519.YANG Jin-hong,YIN Qiu,ZHOU Ning.An improved method of hyperspectral remote sensing data adaptive band selection[J].Remote Sensing Technology and Application,2007,22(4):513~519.(in Chinese with an English abstrast)
[4] DU Qian.Band selection and its impact on target detection and classification in hyperspectral image analysis[C].Maryland:IEEE Greenbelt,2003:374-377.
[5] CHANG Chein-I,WANG Su.Constrained band selection for hyperspectral imagery[J].IEEE Trans.Geosci.Remote Sens,2006,44(6):1575-1585.
[6] DU Qian,YANG He.Similarity-based unsupervised band selection for hyperspectral image analysis[J].IEEE Geosci.Remote Sens.2008,5(4):564-568.
[7] 杜培軍.高光譜遙感信息中的特征提取與應(yīng)用研究[J].光子學(xué)報,2005,34(2):293-298.DU Pei-jun.Spectral feature extraction in hyperspectral RS date and its application to information processing[J].Acta photonica sinica,2005,34(2):293-298.(in Chinese with an English abstract)
[8] SHEFFIELD C.Selecting band combinations from multispectral data[J].Photogrammetric Engineering& Remote Sensing,1985,51(6):681-687.
[9] 何元磊,劉代志,易世華.一種新的高光譜圖像波段選擇方法[J].光電工程,2009,37(9):122-126.HE Yuan-lei,LIU Dai-zhi,YI Shi-hua.A new band selection method for hyperspectral images[J].Opto-Electronic Engineering,2009,37(9):122-126.(in Chinese with an English abstrast)
[10] 劉雪松,葛亮,王斌,等.基于最大信息量的高光譜遙感圖像無監(jiān)督波段選擇方法[J].紅外與毫米波學(xué)報,2012,31(2):166-170.LIU Xue-song,GE Liang,WANG Bin,et al.An unsupervised band selection algorithm for hyperspectral imagery based on maximal information[J].Journal of Infrared and Millimeter Waves,2012,31(2):166-170.(in Chinese with an English abstract)