祖寶開,夏克文+,牛文佳,姜曉慶
1.河北工業(yè)大學(xué) 電子信息工程學(xué)院,天津 300401
2.河北工業(yè)大學(xué) 河北省大數(shù)據(jù)計(jì)算重點(diǎn)實(shí)驗(yàn)室,天津 300401
3.濟(jì)南大學(xué) 信息科學(xué)與工程學(xué)院,濟(jì)南 250022
近年來,隨著科學(xué)技術(shù)的飛速發(fā)展,高光譜、高分辨率等遙感影像也逐步發(fā)展。它已經(jīng)廣泛應(yīng)用于礦產(chǎn)資源勘探[1-2]、軍事[3-4]、城市土地利用[5-6]、作物生長監(jiān)測(cè)和生態(tài)環(huán)境檢測(cè)[7-8]等方面。高分辨率圖像具有較高的空間分辨率和豐富的空間信息。然而,數(shù)據(jù)量大、紋理特征復(fù)雜等問題很難解決。高分辨率圖像數(shù)據(jù)的處理和信息提取一直是困擾研究者的難題[9]。
隨著社會(huì)的發(fā)展,城市土地利用研究顯得尤為重要[9]。城市土地利用變化對(duì)人類社會(huì)活動(dòng)、城市經(jīng)濟(jì)發(fā)展和城市生態(tài)環(huán)境都是有影響的。機(jī)器學(xué)習(xí)方法是遙感圖像分類中最有效的方法之一。主要分為無監(jiān)督和監(jiān)督分類方法[10]。監(jiān)督分類利用先驗(yàn)知識(shí)來訓(xùn)練分類模型。與此相反,無監(jiān)督分類不利用先驗(yàn)信息,通常也被稱為聚類[10]。常用的無監(jiān)督分類有k-均值和迭代自組織數(shù)據(jù)分析算法(iterative selforganizing data analysis techniques algorithm,ISODATA)[11]。監(jiān)督分類方法有統(tǒng)計(jì)模型的分類方法、基于神經(jīng)網(wǎng)絡(luò)的分類方法[12]、支持向量機(jī)(support vector machine,SVM)[13]和相關(guān)向量機(jī)(relevancevectormachine,RVM)[14]分類方法。決策樹方法包括基于信息熵增益的ID3算法[15]和利用信息熵增益比的C4.5算法[16]。
然而,大規(guī)模遙感數(shù)據(jù)難以獲取大量標(biāo)記數(shù)據(jù)。因?yàn)闃?biāo)記樣本需要大量的人力和物力,且時(shí)間長,效率低。如果只利用少量的標(biāo)記樣本,訓(xùn)練出的學(xué)習(xí)系統(tǒng)很難有好的泛化能力[17]。而且,如果只使用標(biāo)記樣本來訓(xùn)練分類模型,則浪費(fèi)了未標(biāo)記樣本所提供的有用信息。為了解決上述問題,半監(jiān)督學(xué)習(xí)應(yīng)運(yùn)而生。半監(jiān)督學(xué)習(xí)利用少量的標(biāo)記樣本和大量的未標(biāo)記樣本來學(xué)習(xí)分類模型。與監(jiān)督方法相比,半監(jiān)督學(xué)習(xí)可以有效地緩解“小樣本”存在的問題[18-20]。Cai等人在線性判別分析的基礎(chǔ)上提出了同時(shí)使用標(biāo)記和未標(biāo)記樣本的方法,稱為半監(jiān)督判別分析(semisupervised discriminant analysis,SDA)[21]。但是基于圖的半監(jiān)督學(xué)習(xí)算法的性能在很大程度上依賴于圖的構(gòu)建過程。傳統(tǒng)的圖構(gòu)造方法K近鄰(K-nearest neighbor,KNN)和局部線性嵌入(locally linear embedding,LLE)等方法在很大程度上依賴參數(shù)的選擇,同時(shí)利用歐幾里德距離作為測(cè)度,容易受到噪聲的影響。
Candès等人為了克服維數(shù)災(zāi)難,提出了稀疏表示與低秩理論[22-23]。稀疏表示和低秩理論的提出是為了解決信號(hào)重構(gòu)的問題。低秩表示(low rank representation,LRR)法構(gòu)造了一個(gè)無向圖(這里稱為低秩(low rank,LR)圖),它根據(jù)低秩約束條件聯(lián)合獲取整個(gè)數(shù)據(jù)表示[24-25],對(duì)噪聲來說是魯棒的。
低秩表示在遙感圖像分類上的應(yīng)用還很少,技術(shù)還不是很成熟,尤其是針對(duì)大規(guī)模遙感圖像的分類。隨著數(shù)據(jù)點(diǎn)(像素)的增加,LRR的計(jì)算復(fù)雜度呈指數(shù)增長。為了解決上述問題,將處理后的圖像按像素劃分為塊(子集),并在每個(gè)塊上進(jìn)行低秩表示。然后,將特征表示子集組合成一個(gè)完整的特征圖。應(yīng)用K近鄰來處理整個(gè)低秩圖使之轉(zhuǎn)換為對(duì)稱矩陣,同時(shí),K近鄰最大程度地保留了圖像的局部信息[26]。最后,應(yīng)用半監(jiān)督判別分析進(jìn)行特征提取,可以充分利用標(biāo)記樣本的標(biāo)簽信息以及標(biāo)記和未標(biāo)記的數(shù)據(jù)點(diǎn)數(shù)據(jù)固有的幾何結(jié)構(gòu)信息。
對(duì)武漢市區(qū)WorldView-2遙感影像進(jìn)行仿真分析。結(jié)果表明,基于塊低秩圖的特征提取方法是一種有效的方法??梢源蟠筇岣哌b感圖像分類的性能。在簡單的最近鄰分類器以及少量標(biāo)簽樣本的情況下,也可以獲得顯著的分類性能。
LRR是將數(shù)據(jù)矩陣X=[x1,x2,…,xn]∈Rm×n表示成字典矩陣A=[a1,a2,…,am](也稱為基矩陣)下的線性組合,即:
其中,Z=[z1,z2,…,zn]∈Rl×n為低秩表示矩陣,zi為xi的低秩表示系數(shù)。為此,求解下列優(yōu)化問題:
直接求解式(2)較困難。通過矩陣分解方法,式(2)轉(zhuǎn)化為核范數(shù)問題:
其中,‖?‖*表示矩陣的核范數(shù)。
當(dāng)用樣本X本身作為字典,式(3)可轉(zhuǎn)換為:
考慮到實(shí)際應(yīng)用中數(shù)據(jù)的損壞或丟失和噪聲等,目標(biāo)函數(shù)轉(zhuǎn)化為:
其中,噪聲項(xiàng)選取l2,1范數(shù)。λ(λ>0)平衡目標(biāo)函數(shù)的兩部分。
將式(5)轉(zhuǎn)化為:
式(6)可以通過求解非精確增廣拉格朗日乘子問題計(jì)算,即:
式中,Y1、Y2為拉格朗日乘子,μ>0為懲罰參數(shù)。取得最優(yōu)解(Z*,E*)后,利用Z*構(gòu)造一個(gè)無向圖的相似度矩陣,其中樣本xi和xj為圖的頂點(diǎn),max([z*]ij,[z*]ji)為兩個(gè)樣本之間的權(quán)值。
線性判別分析算法(linear discriminant analysis,LDA)目標(biāo)是找到一個(gè)投影子空間,使得在該子空間中,屬于不同類別的點(diǎn)離得越遠(yuǎn)越好,而相同類別的點(diǎn)離得越近越好,即使類間離散度和類內(nèi)離散度的比值達(dá)到最大[21]。
假設(shè)給定樣本{x1,x2,…,xl}∈Rn,屬于c個(gè)類別。LDA的目的是找到一個(gè)投影向量a,使aTSba和aTSta之間的比例最大化。
其中,μ是總樣本的均值向量,是第k類樣本的平均向量,lk是k類樣本個(gè)數(shù),是在第k類中的第i個(gè)樣本,Sw和Sb分別為類內(nèi)和類間散度矩陣??偵⒍染仃?有St=Sw+Sb,那么式(8)中的目標(biāo)函數(shù)為:
最優(yōu)解a是與本征值問題的非零特征值對(duì)應(yīng)的特征向量:
當(dāng)訓(xùn)練樣本不足時(shí),過擬合將發(fā)生。防止過擬合的典型方法是加入正則化約束。Cai提出了半監(jiān)督判別分析模型[21]。SDA的目的是找到一個(gè)投影來代表從標(biāo)記的數(shù)據(jù)點(diǎn)中推斷出判別信息,以及從標(biāo)記和未標(biāo)記的數(shù)據(jù)點(diǎn)中推斷出的數(shù)據(jù)固有幾何結(jié)構(gòu)。具體而言,結(jié)合標(biāo)記樣本和無標(biāo)記樣本建立一個(gè)包含數(shù)據(jù)集鄰域信息的圖。利用拉普拉斯圖的概念,該圖提供了一個(gè)相對(duì)于數(shù)據(jù)流形局部幾何結(jié)構(gòu)的離散的近似值。因此,SDA優(yōu)化算法可以保留流形結(jié)構(gòu)[21]。SDA優(yōu)化問題為:
其中,正則化項(xiàng)J(a)控制模型的學(xué)習(xí)復(fù)雜度,而系數(shù)α控制模型復(fù)雜度與正則化項(xiàng)間的平衡[21]。
J(a)是樣本的鄰接圖矩陣,充分利用了先驗(yàn)知識(shí)。半監(jiān)督學(xué)習(xí)算法的關(guān)鍵是一致性的先驗(yàn)假設(shè)[21]。傳統(tǒng)的SDA用一個(gè)K近鄰的圖G模擬附近的數(shù)據(jù)點(diǎn)之間的關(guān)系。對(duì)于樣本點(diǎn)xi和xj,在節(jié)點(diǎn)i和j之間設(shè)置一個(gè)邊。相應(yīng)的權(quán)重矩陣S定義為:
其中,Nk(xi)表示K近鄰的集合。一般而言,映射函數(shù)在圖上應(yīng)該是盡可能光滑的。因此,那些稠密相連的子圖可能擁有相同的標(biāo)簽。正則化矩陣可以定義如下:
其中,D是一個(gè)對(duì)角矩陣,它是S的列(或行,因?yàn)镾是對(duì)稱的)的總和。Dii=∑jSij,L=D-S是拉普拉斯矩陣。得到SDA的目標(biāo)函數(shù):
最優(yōu)投影向量a由廣義特征值問題求得:
其中Sb=XWl×lXT。
在上面的章節(jié)中,研究了經(jīng)典半監(jiān)督判別分析和可以有效捕捉數(shù)據(jù)全局結(jié)構(gòu)的低秩表示算法?;谏鲜鰡l(fā),提出基于塊低秩表示的正則化圖。
對(duì)于特征向量X=[x1,x2,…,xM]∈RN×M,N是波段數(shù)(數(shù)據(jù)維數(shù)),M是像素?cái)?shù)(樣本數(shù))。隨著樣本數(shù)量的增加,低秩表示計(jì)算時(shí)間呈指數(shù)增長。因此,通過分塊理論來研究低秩表示問題。
讓{g1,g2,…,gm}表示m個(gè)塊圖像的集合索引,其中每個(gè)gi存在S個(gè)像素。將同一塊的向量放在一起,即X={Xg1,Xg2,…,Xgm},A={Ag1,Ag2,…,Agm}和E={Eg1,Eg2,…,Egm}。然后每個(gè)塊的LRR優(yōu)化問題轉(zhuǎn)換為以下形式:
選擇l2,1-norm作為誤差項(xiàng)范數(shù)‖·‖l,它是
通過不精確增廣拉格朗日乘子(augmented Lagrange multiplier,ALM)法[25]將增廣拉格朗日函子最小化得到塊低秩(block low rank,BLR)圖然后將這些特征子集合并得到特征圖矩陣Z={Zg1,Zg2,…,Zgm}=[z1,z2,…,zM]∈RS×M。
由于圖鄰接矩陣Z是不對(duì)稱的,需要對(duì)稱化處理才能滿足SDA正則圖的對(duì)稱性要求。經(jīng)典的對(duì)稱化過程是矩陣轉(zhuǎn)置和其本身的均值。然而,鄰接圖矩陣Z不是一個(gè)方陣。之前的研究表明,低秩K近鄰(low rankK-nearest neighbor,LRKNN)圖可以顯著提高SDA[26]的性能。因此,K近鄰算法的處理不僅解決了鄰接矩陣對(duì)稱化的要求,而且最大限度地保留了圖像局部信息。因此,引入基于塊低秩K近鄰正則圖對(duì)遙感影像進(jìn)行半監(jiān)督特征提取。
如果zi屬于zj的k個(gè)最鄰近點(diǎn),或者zj是zi的k鄰近點(diǎn),那么zi和zj互為近鄰點(diǎn)。這里使用熱核方法為S分配權(quán)重,如下所示:
其中,Nk(zi)表示zi中的k近鄰。
給定一個(gè)屬于c類的標(biāo)記數(shù)據(jù)集和一個(gè)未標(biāo)記數(shù)據(jù)集其中,第k類有l(wèi)k個(gè)樣本,假設(shè){xi,…,xl}中的數(shù)據(jù)點(diǎn)根據(jù)自身的標(biāo)簽來排序。
基于塊低秩圖的半監(jiān)督判別分析的步驟如下:
步驟1構(gòu)造鄰接圖:構(gòu)建X的低秩近鄰圖矩陣S,計(jì)算該圖的拉普拉斯矩陣L=D-S。
步驟2構(gòu)建標(biāo)記圖:為標(biāo)記圖構(gòu)建權(quán)重矩陣Wl×l∈Rm×m,如下:
步驟3特征值問題:計(jì)算廣義特征向量問題及其對(duì)應(yīng)的非零特征值。
其中,X=[x1,x2,…,xl,xl+1,…,xm],W的秩為d,得到d個(gè)特征向量a1,a2,…,ad。
步驟4SDA特征映射:讓A=[a1,a2,…,ad],A是一個(gè)n×c的變換矩陣。通過X→Z=ATX,數(shù)據(jù)可以映射到d維子空間。
由式(18)可以得到投影矩陣A:
其中,S是KNN變換之后的圖。L=D-S是拉普拉斯矩陣。Sij是代表附近數(shù)據(jù)點(diǎn)關(guān)系模型的圖形。Dii=∑jSij是對(duì)角矩陣D。
將W通過映射矩陣Φ映射到d維子空間中。
步驟5最后,執(zhí)行K近鄰分類器進(jìn)行分類。
實(shí)驗(yàn)的硬件平臺(tái)是處理器為Intel Core CPU 2.60 GHz和8 GB RAM的機(jī)器,在Matlab 2016b上進(jìn)行實(shí)驗(yàn)分析。
實(shí)驗(yàn)區(qū)為湖北武漢市轄區(qū),地理位置在30°52′N~30°48′N與114°27′E~114°32′E之間(圖1)。實(shí)驗(yàn)數(shù)據(jù)為WorldView-2影像數(shù)據(jù),圖像大小為2 500×2 500個(gè)像素的tif格式文件,影像質(zhì)量良好,分辨率為2 m。WorldView-2影像是由美國Digital Globe公司發(fā)射的衛(wèi)星獲取的,該數(shù)據(jù)具有很高的分辨率。該衛(wèi)星系統(tǒng)能夠采集海量的影像數(shù)據(jù),存儲(chǔ)速度極快,而且定位精度極高,存儲(chǔ)量極大。數(shù)據(jù)實(shí)驗(yàn)區(qū)內(nèi)地物類型豐富,主要有河流、湖泊、建筑物、草地、農(nóng)業(yè)用地、林地等。在武漢市中心城區(qū)附近,景觀分布較為破碎,裸地和建筑用地、草地和林地等在空間上分布混亂。
Fig.1 Study area圖1 研究區(qū)域
分類精度評(píng)價(jià)非常重要,通過精度評(píng)價(jià),能夠直觀、有效地獲取分類結(jié)果中的信息。下面給出幾種常用的遙感影像分類精度評(píng)價(jià)指標(biāo)。
在遙感分類領(lǐng)域,經(jīng)常使用混淆矩陣(confusion matrix)表示分類精度。對(duì)角線為正確分類的樣本數(shù),而非對(duì)角線表示錯(cuò)誤分類的樣本數(shù)。對(duì)角線的值越高表示結(jié)果越好。
分類精度(classification accuracy,CA)是指每個(gè)類別中正確分類的像素的百分比??傮w準(zhǔn)確率(overall accuracy,OA)指正確分類像素的百分比。平均準(zhǔn)確率(average accuracy,AA)是計(jì)算所有類平均正確分類像素的百分比。為了使測(cè)量更加客觀,使用Kappa系數(shù)來估計(jì)正確分類的像素的百分比。
制圖精度(producer’s accuracy)是指分類器將整個(gè)影像的像元正確分為某類的像元數(shù)(混淆矩陣中對(duì)角線值)與該類真實(shí)參考總數(shù)(混淆矩陣中該類列的總和)的比率。
用戶精度(user’s accuracy)是指正確分到某類的像元總數(shù)(對(duì)角線值)與分類器將整個(gè)影像的像元分為該類像元總數(shù)(混淆矩陣中該類行的總和)比率。
為了驗(yàn)證本文方法的有效性,給出以下幾個(gè)對(duì)比方法。為了公平,對(duì)比方法均包含KNN正則化處理過程。
塊k近鄰(blockKNN,BKNN)圖:K近鄰圖(KNN圖)每個(gè)頂點(diǎn)只與自己的k個(gè)近鄰連接[26]。這里近鄰數(shù)k設(shè)置為4。采用高斯核計(jì)算權(quán)重。
塊局部線性嵌入(block locally linear embedding,BLLE)圖:從局部線性嵌入方法通過最小化l2重構(gòu)樣本。將下式求得的局部線性重構(gòu)系數(shù)作為樣本連接權(quán)值[27]。
由于分類結(jié)果對(duì)訓(xùn)練樣本的選取有很大的依賴性,因此選取的訓(xùn)練樣本要具有典型性和代表性。本實(shí)驗(yàn)借助ENVI處理軟件選取各個(gè)地物特征明顯的區(qū)域作為訓(xùn)練樣本。從數(shù)值結(jié)果和視覺效果上進(jìn)行了比較。一般來說,地物像元的一致性只能通過采樣來檢查,因?yàn)闄z查所有的像元是不現(xiàn)實(shí)的。驗(yàn)證樣本可以通過野外實(shí)地調(diào)查或在高分辨率圖像上通過目釋解譯的方法獲取各個(gè)分類的地表真實(shí)感興趣區(qū)[28-29]。由于實(shí)驗(yàn)影像分辨率為2 m,結(jié)合武漢市區(qū)的文字圖片資料,在影像上選取6 270個(gè)驗(yàn)證樣本和4 762個(gè)訓(xùn)練樣本,如表1所示。表1給出每類分類精度、總體分類精度等評(píng)價(jià)指標(biāo)。
Table 1 Classification results for different feature graphs表1 不同特征圖的分類結(jié)果
表2~表5給出了混淆矩陣、制圖精度和用戶精度等。從表1~表5可以看出,BLR分類方法無論是在總體分類精度上還是Kappa系數(shù)上都比BSR、BKNN、BLLE方法有優(yōu)勢(shì)。Kappa系數(shù)比其他方法提高了約6個(gè)百分點(diǎn)。對(duì)比表1中的三種方法分類結(jié)果,可以看出基于BLR的影像分類結(jié)果比基于BSR的總體準(zhǔn)確率提高了4.83%,Kappa系數(shù)提高了5.79%,說明基于BLR的分類能夠較好提高高分辨率遙感影像的分類精度。雖然基于BSR方法的總體精度和Kappa系數(shù)較高,但從表3可以看出其對(duì)耕地、裸地和草地混分較為嚴(yán)重,耕地的制圖精度只有70.35%。這是由于耕地和草地光譜較為相似,二者光譜特征在各個(gè)波段波動(dòng)范圍較大,在同一波段上反射率具有一定的重疊。稀疏表示圖缺乏對(duì)數(shù)據(jù)的全局約束,每個(gè)樣本求解過程相互獨(dú)立?;诜謮K低秩圖方法分類結(jié)果的總體精度比BKNN和BLLE方法的總體精度分別提高了5.57%和4.94%,Kappa系數(shù)分別提高了6.67%和5.92%。這是因?yàn)镵近鄰和LLE使用固定的全局參數(shù),利用歐幾里德距離來確定圖的權(quán)重,其圖矩陣結(jié)構(gòu)對(duì)噪聲敏感。
Table 2 Classification results of BLR graph method表2 BLR正則圖方法分類結(jié)果
Table 3 Classification results of BSR graph method表3 BSR正則圖方法分類結(jié)果
Table 4 Classification results of BKNN graph method表4 BKNN正則圖方法分類結(jié)果
基于塊低秩圖的分類方法中耕地的制圖精度達(dá)到90.43%,比稀疏表示方法提高了20.08%。這是因?yàn)長R圖解決了對(duì)比方法的缺點(diǎn),它根據(jù)低秩約束獲得數(shù)據(jù)的全局信息,并且對(duì)噪聲表現(xiàn)出魯棒性。同時(shí)使用K近鄰來處理整個(gè)低秩圖,保留了數(shù)據(jù)的局部信息。因此,塊低秩圖方法顯著提高了分類性能,對(duì)于大規(guī)模遙感影像是非常好的特征提取方法,能夠在一定程度上改善耕地和草地的分類精度。然而,對(duì)于耕地、裸地和草地,由于在城市中樣本數(shù)比較少,容易受到其他相對(duì)較大規(guī)模地物的混淆,導(dǎo)致基于塊稀疏表示方法的分類精度沒有較大的提高。由表2看出,基于BLR方法的各類制圖精度都在90%以上,能夠滿足一般遙感影像制圖精度的需求。因此,基于分塊低秩的方法用于大規(guī)模遙感影像分類有一定的優(yōu)勢(shì)。
Table 5 Classification results of BLLE graph method表5 BLLE正則圖方法分類結(jié)果
從視覺效果上對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行比較,如圖2所示,基于分塊低秩的分類方法和其他對(duì)比方法相比,有效地提高了影像的分類精度。例如,圖中左上角水體區(qū)域以及右下角的裸地等誤分為其他地物的問題得到了有效的改善,在一定程度上提高了影像分類精度,在影像分類上具有一定的可行性。遙感影像的分類受到眾多因素制約,許多問題還有待進(jìn)一步研究。實(shí)驗(yàn)中缺乏足夠的實(shí)地調(diào)查信息和受目視判讀的影響,樣本地物類別判斷上可能存在一定的偏差。實(shí)驗(yàn)只選擇了光譜信息作為特征數(shù)據(jù),在未來可以考慮將圖像的紋理等信息引入到圖像分類中。
Fig.2 Land cover classification of Wuhan municipal district圖2 武漢市轄區(qū)土地利用覆蓋分類結(jié)果
本文把塊低秩表示方法應(yīng)用到高分遙感影像半監(jiān)督分類上。為了降低計(jì)算復(fù)雜度,整個(gè)圖像被分塊并分別實(shí)現(xiàn)每個(gè)塊上的低秩表示。因此,通過低秩表示保留了影像的全局結(jié)構(gòu)。另外,K近鄰算法保留了影像的局部幾何結(jié)構(gòu)。因此,基于塊低秩正則圖的半監(jiān)督判別分析特征提取方法可以有效提高圖像分類的性能。對(duì)武漢市WorldView-2影像進(jìn)行實(shí)驗(yàn)表明,本文方法是有效和魯棒的,可以實(shí)現(xiàn)大規(guī)模遙感影像的精確分類。