任會(huì)峰,朱洪前,唐 玥,董慶超
(1.無錫學(xué)院,江蘇 無錫 214105;2.中南林業(yè)科技大學(xué) 材料科學(xué)與工程學(xué)院,長(zhǎng)沙 410004;3.海軍航空大學(xué) 岸防兵學(xué)院,山東 煙臺(tái) 264001)
遙感圖像分類是高光譜遙感圖像處理的重要分支,在城市規(guī)劃、智能農(nóng)業(yè)、環(huán)境保護(hù)、地質(zhì)勘探、搶險(xiǎn)救災(zāi)以及軍事偵察等領(lǐng)域應(yīng)用廣泛[1-2]。目前主要依據(jù)地物圖像的空間信息分類識(shí)別遙感圖像場(chǎng)景[3]。在計(jì)算機(jī)運(yùn)算能力相對(duì)較低的早期,學(xué)者們主要依據(jù)遙感圖像的局部特征進(jìn)行分類[4-5],這些研究為遙感圖像分類進(jìn)行了積極探索,但由于探測(cè)波段和空間分辨率較低等因素的影響,遙感圖像分類面臨特征維數(shù)高、訓(xùn)練樣本缺乏等問題,而且局部特征與遙感圖像本身的語義之間存在“鴻溝”[6]。為了提高對(duì)遙感圖像語義的理解和表示,相關(guān)學(xué)者在局部特征的基礎(chǔ)上引入特征編碼方法,如詞袋模型BOW[7]以及結(jié)合稀疏表示[8-9]的改進(jìn)算法,提高了對(duì)圖像的描述能力[10-11]。機(jī)器學(xué)習(xí)方法中,傳統(tǒng)字典學(xué)習(xí)通過最小化信號(hào)重構(gòu)誤差實(shí)現(xiàn)分類[12],不適用于圖像分類,且圖像細(xì)節(jié)的方向性影響局部特征的描述[13],不同尺度圖像的細(xì)節(jié)也不同[14]。
將遙感圖像在8個(gè)方向5個(gè)尺度進(jìn)行高斯核分解后提取Gabor特征,并用改進(jìn)的粒子群算法確定中心最大頻率和帶寬的最優(yōu)取值,稀疏表示構(gòu)建Gabor特征視覺詞典,形成遙感圖像稀疏系數(shù)矩陣輸入分類器,在分類器中計(jì)算特征增益以區(qū)分不同特征的重要度,從而構(gòu)建遙感圖像多方向多尺度稀疏表示(multiple levels sparse representation,MLSR)特征增益SVM分類器,并在標(biāo)準(zhǔn)數(shù)據(jù)集上測(cè)試方法的優(yōu)越性。
Gabor濾波的多角度選擇性較好地模擬了人類視覺感受,能在頻域和空域獲得最佳分辨率,對(duì)提取信息量高的特征非常有效[15]。因此,可通過二維Gabor濾波器組與遙感圖像卷積運(yùn)算獲得頻域范圍內(nèi)各角度和各尺度的局部特征和鑒別特征。
二維Gabor濾波器組由高斯包絡(luò)調(diào)制的正弦波定義,其高斯核表達(dá)式為
二維Gabor濾波器組與遙感圖像卷積運(yùn)算按照式(5)從時(shí)域或空域轉(zhuǎn)換到頻域:
濾波器包含實(shí)部濾波和虛部濾波2個(gè)部分,選擇實(shí)部操作,計(jì)算公式見式(6):
圖1是二維Gabor濾波器組在5個(gè)尺度8個(gè)方向的實(shí)部圖像。
圖1 二維Gabor濾波器組在5個(gè)尺度8個(gè)方向的實(shí)部圖像
二維Gabor濾波器組對(duì)遙感圖像在各角度和各尺度的局部特征和鑒別特征的提取效果取決于其參數(shù)選擇。組合參數(shù)最佳取值可以采用粒子群算法對(duì)中心最大頻率kmax和帶寬σ進(jìn)行尋優(yōu)。針對(duì)標(biāo)準(zhǔn)粒子群算法容易早熟且慣性權(quán)重線性遞減導(dǎo)致進(jìn)化后期算法收斂速度下降的問題,將慣性權(quán)重ω和加速因子c1和c2設(shè)置為最優(yōu)點(diǎn)適應(yīng)度的函數(shù),如式(7)和式(8)所示:
式中:f(gk)是算法第k次迭代全局最優(yōu)點(diǎn)適應(yīng)度,α=1/f(g1),n∈(1,2),通常n取值為1.5。按照式(9)和(10)更新粒子的速度和位置。
式中:k=1,2,…,m是迭代次數(shù),根據(jù)迭代次數(shù)線性遞減慣性權(quán)重ω,加速因子c1和c2取值為2,r1和r2取值為均勻分布在閉區(qū)間[0,1]的隨機(jī)數(shù);pi和pg分別表示當(dāng)前粒子歷史最優(yōu)點(diǎn)和全局最優(yōu)點(diǎn),搜索空間范圍為kmax∈[0,2π]/2,帶寬σ∈[0,2π]。適應(yīng)度函數(shù)采用式(11)的加權(quán)歐氏距離計(jì)算,其中L為類別數(shù),fi為待分類遙感圖像經(jīng)過第i個(gè)Gabor濾波器高斯核后的平均值,為第l類遙感圖像經(jīng)過第i個(gè)Gabor濾波器高斯核后的平均值和方差。
參數(shù)尋優(yōu)算法如下:
步驟1初始化種群規(guī)模M,終止條件為迭代100次,隨機(jī)生成每個(gè)粒子的位置xi和速度vi,i=1,2,…,M。
步驟2按照式(11)計(jì)算粒子的適應(yīng)度f(xi)。
步驟3按照如下規(guī)則更新粒子的極值和全局極值:
步驟4若滿足終止條件,則pg對(duì)應(yīng)位置坐標(biāo)即為最優(yōu)組合參數(shù)取值,否則步驟5。
步驟5按式(7)和式(8)更新慣性權(quán)重和加速因子。
步驟6按照式(9)和(10)更新粒子的位置,返回步驟2。
采用改進(jìn)的粒子群算法獲得二維Gabor濾波器組的最優(yōu)參數(shù)組合后,連接Gabor濾波器5個(gè)尺度和8個(gè)方向的實(shí)部共計(jì)5×8個(gè)輸出,形成遙感圖像的Gabor特征向量集F={f1,…,fV}。
稀疏表示可用于遙感圖像的特征聚類和生成可視化字典,在稀疏表示過程中,利用稀疏表示模型從遙感圖像中提取空間特征[16],從而提高視覺詞典的語義準(zhǔn)確性,生成更健壯有效的遙感圖像表示。給定Y=[y1,y2,…,yN]∈Rd×N為N個(gè)d維遙感圖像Gabor特征向量的集合,其中yi為一個(gè)d維的Gabor特征描述子。B=[b1,b2,…,bM]∈Rd×M是一個(gè)具有M個(gè)聚類中心的字典,對(duì)每一個(gè)列向量yi稀疏表示的系數(shù)向量記為xi∈RM,X=[x1,x2,…,xN]∈RM×N是字典B上的系數(shù)矩陣,其中M<<N。
遙感圖像稀疏表示就是求解字典B的過程,使得Y=BX,其中系數(shù)矩陣X中非零元素的數(shù)量遠(yuǎn)小于數(shù)據(jù)樣本yi的數(shù)量,則求解系數(shù)矩陣X就是解決如下優(yōu)化問題:
式中:‖·‖是l0范數(shù),亦即X中非零元素的個(gè)數(shù),盡管l0范數(shù)的求解是NP問題,但當(dāng)系數(shù)足夠稀疏時(shí),可用l1范數(shù)代替l0范數(shù)從而獲得稀疏表示系數(shù)矩陣。因此,可將上式轉(zhuǎn)換為如下優(yōu)化問題
式中,最小化代價(jià)函數(shù)由X中每一列的數(shù)據(jù)擬合和正則化項(xiàng)組成,參數(shù)λ是一個(gè)平衡數(shù)據(jù)保真度和解稀疏性的懲罰參數(shù)[17]。
不同類別的遙感圖像地物特征位于不同的子空間,能夠被該類訓(xùn)練樣本組成的字典線性表示,而很難被其他類別的訓(xùn)練樣本線性表示。
首先對(duì)遙感圖像I提取多層次的Gabor特征,構(gòu)建特征集F={f1,…,fV},根據(jù)式(13)和(14)采用開源工具SPAMS獲得稀疏系數(shù)矩陣X和構(gòu)造字典B,最后將稀疏系數(shù)矩陣作為SVM分類器的輸入。SVM分類器用歐氏距離度量樣本之間的相似度,每一維的特征對(duì)分類器的貢獻(xiàn)存在差異,而傳統(tǒng)SVM分類模型中假設(shè)所有特征對(duì)分類器的貢獻(xiàn)相等,忽視了特征的重要度差異。信息論中“熵”表明任意樣本集對(duì)分類器的貢獻(xiàn)都具有一定不確定性,因此,圖像特征對(duì)分類器的貢獻(xiàn)可以用特征的信息增益表示。同上可以計(jì)算所有稀疏系數(shù)向量的特征增益λM,得到遙感圖像特征增益對(duì)角矩陣Q=diag(λM)。
考慮稀疏系數(shù)向量的特征增益以后,SVM的核函數(shù)形式變?yōu)?/p>
SVM核函數(shù)選擇高斯核函數(shù),則稀疏系數(shù)向量特征增益的高斯核函數(shù)為
圖2為基于多層次特征稀疏表示的遙感圖像分類流程框圖。
圖2 特征增益SVM分類流程框圖
特征增益稀疏系數(shù)矩陣作為SVM分類器的輸入,采用開源工具箱LIBSVM判決得到測(cè)試像素的類別標(biāo)簽。
采用Pavia University數(shù)據(jù)集進(jìn)行測(cè)試,該數(shù)據(jù)集是由德國(guó)的機(jī)載反射光學(xué)光譜成像儀(reflective optics spectrographic imaging system,ROSIS-03)在2003年對(duì)意大利的帕維亞城所成的像[18],空間分辨率為1.3 m,尺寸為610像素×340像素,因此共計(jì)2 207 400個(gè)像素,其中包含大量的背景像素,包含地物的像素總共只有42 776個(gè),這些像素共包括9個(gè)地物類別,表1為各類的名稱和每類的樣本總數(shù),圖3為Pavia University數(shù)據(jù)集中典型圖像和對(duì)應(yīng)的真實(shí)地物類別標(biāo)識(shí)圖像。
表1 Pavia University數(shù)據(jù)集屬性表
圖3 Pavia University圖像與對(duì)應(yīng)真實(shí)地物類別標(biāo)識(shí)圖像
由于Pavia University數(shù)據(jù)集C1~C9這9類樣本間數(shù)量相差較大,若按比例抽取會(huì)造成類間不平衡問題,影響分類結(jié)果。因此,仿真時(shí)從每一類抽取250個(gè)樣本作為分類模型的訓(xùn)練集,且限制抽取的樣本總數(shù)不超過Pavia University數(shù)據(jù)集樣本總數(shù)的10%。
經(jīng)過30次迭代,共耗時(shí)262.736秒獲得粒子的最優(yōu)位置,對(duì)應(yīng)中心最大頻率kmax為2.406 7,帶寬σ為1.148 6,分類器采用LIBSVM工具包[19]中徑向基函數(shù)核的SVM,對(duì)于懲罰參數(shù)和RBF核寬度通過網(wǎng)格搜索的方法分別從{2-5,…,215}和{2-15,…,23}中選取。二維Gabor濾波器組中采用不同高斯核將遙感圖像分解成不同尺度對(duì)算法性能的影響體現(xiàn)在中心最大頻率和帶寬的不同取值,表2為不同Gabor組合參數(shù)下分類器性能。
表2 不同Gabor參數(shù)下分類性能
從表2可知,選擇合適的二維Gabor組合參數(shù)中心最大頻率和帶寬對(duì)分類器的性能具有較大影響,主要因?yàn)椴煌闹行淖畲箢l率和不同的帶寬對(duì)圖像的濾波能力和局部特征提取能力存在差異,低頻有利于提取圖像的整體特征,而窄帶有利于提取圖像的局部特征,從而全局上提升了圖像的描述能力。而不同的中心最大頻率和不同帶寬對(duì)模型的訓(xùn)練時(shí)間影響不大,實(shí)驗(yàn)測(cè)試分析發(fā)現(xiàn),只需要犧牲很小的時(shí)間代價(jià)即可換取較大的分類性能的提升。
再將提出的多層次特征稀疏表示聯(lián)合特征增益SVM的遙感圖像分類方法(MLSR)與不考慮特征增益的SVM分類器(MLSVM)以及BoVW、PLSA算法進(jìn)行比較。其中,SVM統(tǒng)一采用徑向基函數(shù)核,評(píng)價(jià)指標(biāo)選擇總體精度和Kappa系數(shù)[20],表3為Pavia University數(shù)據(jù)集上不同方法的測(cè)試結(jié)果。
表3 不同方法的識(shí)別結(jié)果
圖4為MLSR、BoVW和PLSA 3種不同算法在Pavia University數(shù)據(jù)集上采用SVM分類器模型的分類結(jié)果示意圖。圖4(a)為真實(shí)的地物類別圖;圖4(b)為BoVW算法基礎(chǔ)上的SVM分類結(jié)果;圖4(c)為PLSA算法基礎(chǔ)上的SVM分類結(jié)果。
圖4 不同算法分類結(jié)果示意圖
由表3和圖4可知:提出的多層次特征稀疏表示聯(lián)合特征增益的遙感圖像分類方法(MLSR)相比不考慮特征增益的SVM分類器(MLSVM)、BoVW和PLSA算法具有更高的總體精度和Kappa系數(shù),這是因?yàn)椴煌卣鲗?duì)分類器的貢獻(xiàn)存在差異,通過計(jì)算信息熵和條件熵,將特征對(duì)分類器的貢獻(xiàn)加以區(qū)分,提升了分類器的性能,同時(shí)多角度多尺度的多級(jí)特征稀疏表示能夠更完備地描述遙感圖像語義特征,其原因在于通過多角度多尺度分解后,低頻有利于提取圖像的整體特征,而窄帶有利于提取圖像的局部特征,從而在全局提升圖像的描述能力,更加充分地利用遙感圖像的空間信息,縮小圖像特征與圖像語義之間的鴻溝。盡管增加了圖像的預(yù)處理過程,但是稀疏表示減少了運(yùn)算量,模型訓(xùn)練時(shí)間并無明顯增加。
為進(jìn)一步直觀展現(xiàn)不同方法的性能差異,采用PowerBI的Chord視覺對(duì)象對(duì)分類結(jié)果可視化,如圖5所示。9個(gè)類別用不同的顏色的色帶表示,色帶之間的連接關(guān)系表示對(duì)應(yīng)類別之間的混淆情況,各類之間連線交叉越復(fù)雜表明類間分類混淆程度越大,連接線與色帶顏色越接近表示被誤分為此類的樣本越多。從中可見,MLSR的類間混淆最少,總體分類精度最高。
圖5 和弦圖
遙感圖像因其訓(xùn)練樣本少、特征維數(shù)高,其分類是一項(xiàng)比較復(fù)雜的任務(wù),二維Gabor濾波器組的關(guān)鍵參數(shù)中心最大頻率和帶寬對(duì)分類器的性能影響較大,低頻窄帶提高了圖像的描述能力和可解釋性,通過區(qū)分特征增益進(jìn)一步提升了分類器的性能,下一步將深入開展遙感圖像地物面積和形狀測(cè)量工作。